Life in a Nutshell

MDP入门

介绍

MDP(Markov Decision Process)由5元组构成\(MDP(S,A,{P_{sa}},\gamma,R)\),具体的 参数介绍如下:

  • \(S\):状态集合
  • \(A\):动作集合
  • \(P_{sa}\):状态转移概率分布,\(P_{sa}(s')\)表示在\(s\)状态下采取 \(s\)动作,转移到\(s'\)的概率,\(P_{sa}(s')\geq0\)
  • \(\gamma\):折扣系数取值范围\(0\leq\gamma\le1\)
  • \(R\):回报函数,\(R:S\mapsto \mathbb{R ...

文本分类

1 概述

最近做了一个简单的文本分类程序,在这篇博客里面记录具体的分类流程。一般来说包括 以下几个步骤:

  1. 语料获取
  2. 文本预处理
  3. 特征值提取
  4. 训练分类器
  5. 评估分类性能

下文将分析上面每个步骤的具体实现过程。

2 语料获取

语料获取可以采用爬虫来获得,在实现的过程中从网易上获取了十个类别的新闻语料,分 别是:时政、军事、教育、娱乐、房产、女人、财经、体育、科技和旅游。关于爬虫怎么 写可以参考Scrapy 轻松定制网络爬虫,这篇文章对于学习Scrapy框架非常有 用,但是文章较老,很多接口可能很多都被丢弃,新的接口参考 ...

hexo数学公式

在使用Hexo写博客的时候无法插入数学公 式,通过调研发现MathJax可以很好的在网页里 面显示数学公式,并且能够支持很多浏览器,下面分步骤描述生成公式的方法。

修改主题

MathJax的官方文档说只 要在每个页面的head标签里面插入下面的javascript代码:

<script type="text/javascript"
   src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML"></script>

接下来的步骤就是要把这个代码加入所有的文章页面里面,这里参考 greyshade中对这段代码的处理方式 ...

BCM57780没有网络连接

问题描述

安装完Gentoo之后发现系统一直没有办法上网,通过lspci找到自己的网卡之后,搜索问 题,发现通过下面几条命令之后才能够激活网卡:

# rmmod broadcom 
# rmmod tg3 
# modprobe broadcom 
# modprobe tg3 
# dhcpcd eth0

问题解决

但是并不能永久解决问题,由上面看来问题应该出在内核那边,需要安装下面的方法重新 编译一下模块:

Device Drivers ---> 
     Network Device Support ---> 
          Ethernet driver support ---> 
               Broadcom devices 
                 <M> Broadcom Tigon3 support 
          PHY Device support and infrastrcutre ---> 
             <M> Drivers for Broadcom PHYs

参考文章

Gentoo Portage使用技巧

本文章记录一些使用Gentoo Portage的技巧。

指定Slot安装软件

Slot是在Gentoo的包管理的一个重要功能,当一个软件有多个分支的时候Portage能够 保证不同的版本并存。例如,Python一般有多个版本

$ eix dev-lang/python
[I] dev-lang/python
     Available versions:  
        (2.5)   2.5.4-r4 ~2.5.4-r5
        (2.6)   2.6.8 ~2.6.8-r1
        (2.7)   2.7.3-r2 ~2.7.3-r3
        (3.1)   3.1.5 ~3.1 ...

Linux字体配置

fontconfig简介

Linux字体配置采用 fontconfig来做字体渲染 ,中文的fontconfig手册  参考这里,根据这个手册对Linux的字体进行简单的配置。

配置文件

根据自己的日常使用习惯,下面对我的fontconfig配置文件做一个描述。

dpi设定

dpi的详细设定参考这两篇文章,dpi设置及sub-pixel次像素微调 Linux 字体微调 - windows 效果 版两篇文章,Windows 7的默认dpi 是96,我的字体设定的dpi也采用96。参考前面两篇文章可以知道dpi的计算公式如下:

屏幕 width = 287 mm = 28.7 cm,height = 215 mm = 21.5 cm
水平 dpi = 水平 resolution * 2.54 / width = 1024 * 2.54 / 28 ...

解决Linux下mp3标签乱码

在Linux下mp3标签出现乱码的原因主要是下载到的mp3都使用GB2312编码,然而Linux下使用的编码是UTF-8编码,所以只要对标签编码做一个转换就可以解决问题。

安装软件

下面以Gentoo为例子安装Mutagen,其他的发行 版自行Google。

emerge --ask media-libs/mutagen

转换当前目录下的所有mp3文件标签

find . -iname "*.mp3" -exec mid3iconv -e gbk {} \;

转换当前目录下的所有ape文件标签

find . -iname "*.ape" -exec mid3iconv -e gbk {} \;

Linux 音频格式转换

需要的软件

在开始转换之前我们需要两个程序LAMEFAAD2,这两个包应该通过linux自带 的软件包管理器就可以安装。Gentoo下面安装方法如下:

emerge --ask media-sound/lame
emerge --ask media-libs/faad2

批量转换

m4a转换成mp3

#!/bin/bash

for i in *.m4a; do
    echo "Converting: ${i%.m4a}.mp3"
    faad -o - "$i" | lame - "${i%.m4a}.mp3"
done

flac转mp3

另外可以使用flac转mp3,需要以下三个命令flac lame id3,然后使用以下脚本

#! /bin/sh

for a in *.flac ...

gentoo wifi 共享

简介

本文主要描述如何在Gentoo下利用无线网卡做一个wifi热点来给手机提供无线网络访 问。目前在Windows下有connectify来共享网络,同样的在Linux下也有hostapd。 由于在Windows下基本就是一键配置热点,但是Linux配置起来比较麻烦,所以本文在这里 记录一下配置过程。

软件安装

需要安装一些软件

emerge -a hostapd
emerge -a dnsmasq
emerge -a iptables

配置

以下描述各个软件的配置说明。

网卡参数

修改文件/etc/conf.d/net

modules_wlan0="!iwconfig !wpa_supplicant"
config_wlan0="192.168.0.1/24"

网卡配置好之后,要加入默认启动 ...