玩转Fasttext
Fasttext是Facebook AI Research最近推出的文本分类和词训练工具,其源码已经托管在Github上。Fasttext最大的特点是模型简单,只有一层的隐层以及输出层,因此训练速度非常快,在普通的CPU上可以实现分钟级别的训练,比深度模型的训练要快几个数量级。同时,在多个标准的测试数据集上,Fa...
Fasttext是Facebook AI Research最近推出的文本分类和词训练工具,其源码已经托管在Github上。Fasttext最大的特点是模型简单,只有一层的隐层以及输出层,因此训练速度非常快,在普通的CPU上可以实现分钟级别的训练,比深度模型的训练要快几个数量级。同时,在多个标准的测试数据集上,Fa...
Find命令是linux用非常常用的命令,功能也非常强大。平时仅仅是用了下Find的几个简单的用法,并没有深入去研究高级用法。借着看leveldb的makefile的契机又研究下下Find的有关命令。特此记录一下。
This post mainly covered two approaches for solving Linear Regression, one is normal equations, another is gradient descent.
最近学习了下python,用python写了一个线性回归的程序,因为对numpy的api不是很熟练,所以写出来的程序发现有bug。之前没有python程序的调试经验,虽然可以打印变量,但是个人觉得还是没有单步调试来的方便。于是就自己折腾了下IPython的调试功能。特此记录一下。
what is chunking? chunk可以理解为知识点在你大脑中的存储。举一个很形象的例子,我们有很多很多的数据需要存储在大脑中,因此我们需要以一种方便我们保存和查询的方式保存下来,比如我们用xml或者json的格式保存数据,在我们的大脑中,知识点是以chunk的形式保存下来的。