Useful Terminal Control Sequences
前言
ANSI定义了用于屏幕显示的Escape屏幕控制码,打印输出到终端时,可指定输出颜色、格式等。
基本格式
1\033[<background color>;<front color>m string to print \033[0m
\033[ xxxx m为一个句段;
\033[0m关闭所有属性;
光标控制
ANSI控制码
含义
\033[nA
光标上移n行
\033[nB
光标下移n行
\033[nC
光标右移n行
\033[nD
光标左移n行
\033[y;xH
设置光标位置
\033[2J
清屏
\033[K
清除从光标到行尾的内容
\033[s
保存光标位置
\033[u
恢复光标位置
\033[?25l
隐藏光标
\033[?25h
显示光标
颜色控制
ANSI控制码
含义
\033[m
NONE
\033[0;32;31m
RED
\033[1;31m
LIGHT RED
\033[0;32;32m
GREEN
\033[1;32m
LIGHT GR ...
Hexo+Github博客搭建
前言
那么问题来了,现有的博客还是现有的这篇文章呢?
软件安装
安装node.js, git, hexo
博客搭建
初始化
推荐使用git命令窗口,执行如下指令
12345678910111213141516171819202122232425262728293031$ mkdir Blog$ cd Blog$ hexo initINFO Cloning hexo-starter to ~\Desktop\BlogCloning into 'C:\Users\LouisHsu\Desktop\Blog'...remote: Enumerating objects: 68, done.remote: Total 68 (delta 0), reused 0 (delta 0), pack-reused 68Unpacking objects: 100% (68/68), done.Submodule 'themes/landscape' (https://github.com/hexojs/hexo-theme-landscape.git) re ...
二次入坑raspberry-pi
前言
距上一次搭建树莓派平台已经两年了,保存的镜像出了问题,重新搭建一下。
系统
下载
从官网下载树莓派系统镜像,有以下几种可选
Raspberry Pi — Teach, Learn, and Make with Raspberry Pi
Raspbian & Raspbian Lite,基于Debian
Noobs & Noobs Lite
Ubuntu MATE
Snappy Ubuntu Core
Windows 10 IOT
其余不太了解,之前安装的是Raspbian,对于Debian各种不适,换上界面优雅的Ubuntu Mate玩一下
老老实实玩Raspbian,笑脸:-)
安装
比较简单,准备micro-SD卡,用Win32 Disk Imager烧写镜像
Win32 Disk Imager download | SourceForge.net
安装完软件后可点击Read备份自己的镜像。
注意第二次开机前需要配置config.txt文件,否则hdmi无法显示
树莓派配置文档 config.txt 说明 | 树莓派实验室
123456 ...
TF-IDF
引言
正在做LintCode上的垃圾邮件分类,使用朴素贝叶斯方法解决,涉及到文本特征的提取。
TF-IDF(词频-逆文档频率)算法是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
计算步骤
词频(TF)
Term Frequency,就是某个关键字出现的频率,具体来讲,就是词库中的某个词在当前文章中出现的频率。那么我们可以写出它的计算公式:
TFij=nij∑kni,kTF_{ij} = \frac{n_{ij}}{\sum_k n_{i, k}}
TFij=∑kni,knij
其中,nijn_{ij}nij表示关键词jjj在文档iii中的出现次数。
单纯使用TF来评估关键词的重要性忽略了常用词的干扰。常用词就是指那些文章中大量用到的,但是不能反映文章性质的那种词,比如:因为、所以、因此等等的连词,在英文文章里就体现为and、the、of等等的词。这些词往往拥有较高的TF,所以仅仅使用TF来考察一个词的关键性,是不够的。
逆文档频率(IDF)
I ...