LOUIS' BLOG

发表于2019-05-28|Linux

前言 ANSI定义了用于屏幕显示的Escape屏幕控制码，打印输出到终端时，可指定输出颜色、格式等。基本格式 1\033[<background color>;<front color>m string to print \033[0m \033[ xxxx m为一个句段； \033[0m关闭所有属性；光标控制 ANSI控制码含义 \033[nA 光标上移n行 \033[nB 光标下移n行 \033[nC 光标右移n行 \033[nD 光标左移n行 \033[y;xH 设置光标位置 \033[2J 清屏 \033[K 清除从光标到行尾的内容 \033[s 保存光标位置 \033[u 恢复光标位置 \033[?25l 隐藏光标 \033[?25h 显示光标颜色控制 ANSI控制码含义 \033[m NONE \033[0;32;31m RED \033[1;31m LIGHT RED \033[0;32;32m GREEN \033[1;32m LIGHT GR ...

Hexo+Github博客搭建

发表于2019-01-04|其他

前言那么问题来了，现有的博客还是现有的这篇文章呢？软件安装安装node.js, git, hexo 博客搭建初始化推荐使用git命令窗口，执行如下指令 12345678910111213141516171819202122232425262728293031$ mkdir Blog$ cd Blog$ hexo initINFO Cloning hexo-starter to ~\Desktop\BlogCloning into 'C:\Users\LouisHsu\Desktop\Blog'...remote: Enumerating objects: 68, done.remote: Total 68 (delta 0), reused 0 (delta 0), pack-reused 68Unpacking objects: 100% (68/68), done.Submodule 'themes/landscape' (https://github.com/hexojs/hexo-theme-landscape.git) re ...

二次入坑raspberry-pi

发表于2018-10-29|Linux|Linux

前言距上一次搭建树莓派平台已经两年了，保存的镜像出了问题，重新搭建一下。系统下载从官网下载树莓派系统镜像，有以下几种可选 Raspberry Pi — Teach, Learn, and Make with Raspberry Pi Raspbian & Raspbian Lite，基于Debian Noobs & Noobs Lite Ubuntu MATE Snappy Ubuntu Core Windows 10 IOT 其余不太了解，之前安装的是Raspbian，对于Debian各种不适，换上界面优雅的Ubuntu Mate玩一下老老实实玩Raspbian，笑脸:-) 安装比较简单，准备micro-SD卡，用Win32 Disk Imager烧写镜像 Win32 Disk Imager download | SourceForge.net 安装完软件后可点击Read备份自己的镜像。注意第二次开机前需要配置config.txt文件，否则hdmi无法显示树莓派配置文档 config.txt 说明 | 树莓派实验室 123456 ...

TF-IDF

发表于2018-10-25|Practice

引言正在做LintCode上的垃圾邮件分类，使用朴素贝叶斯方法解决，涉及到文本特征的提取。 TF-IDF（词频-逆文档频率）算法是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。计算步骤词频(TF) Term Frequency，就是某个关键字出现的频率，具体来讲，就是词库中的某个词在当前文章中出现的频率。那么我们可以写出它的计算公式： TFij=nij∑kni,kTF_{ij} = \frac{n_{ij}}{\sum_k n_{i, k}} TFij=∑kni,knij 其中，nijn_{ij}nij表示关键词jjj在文档iii中的出现次数。单纯使用TF来评估关键词的重要性忽略了常用词的干扰。常用词就是指那些文章中大量用到的，但是不能反映文章性质的那种词，比如：因为、所以、因此等等的连词，在英文文章里就体现为and、the、of等等的词。这些词往往拥有较高的TF，所以仅仅使用TF来考察一个词的关键性，是不够的。逆文档频率(IDF) I ...