买了本<Collective Intelligence>,
没有想到的是, 书里所有的算法都不再是生硬的pseudo-code, 而是Python,
不过, Python实现的算法很轻巧, 很优雅, 不用过多的去关注数据结构.
这让我想起了, 有一天下了一堆有关协同过滤的papers, 后来准备自己动手实践下,
当时俺不会Python, 想到用C解决一堆集合的求交问题, 我就头大.
当时正好在MATLAB里做了个很简单的, 基因启动子相关的处理实验,
顺手就接着用MATLAB做了, 哈哈哈哈哈.
基于MovieLens的数据库,
把所有的运算都一股脑塞到矩阵里, 最后嘎吱嘎吱的等着出结果,
结果… 结果… 好像不大理想.
于是昨天索性又用Python重写了一遍,
继续用修正余弦相关性,
基于之前放出去的一个音乐口味的测试,
结果… 结果… 好像还不赖.
好像阶段性的大概无非接下来就两条路,
要么找更多的测试者, 看看再更大的样本集里, 能否有更稳定更精确的结果,
要么直接开始做想做的东西, 通过实践检验效果.
可我只是觉得头痛, 烦躁和不安,
好像整个世界都不属于我了.