2010.
咳咳, 我就这么期盼下.
Nodebox强大之处在于, 有无数第三方的扩展库, 可以快速的实现数据处理和可视化.
Graph就是一个很方便的用于图论可视化的扩展库.
不过Nodebox是Mac-only的(基于Cocoa), Shoebot是其基于GTK+和Cairo的移植.
断断续续花了两天时间把graph库移植到了shoebot下, 一些诡异的细节问题折磨了我n久.
经过了对原graph库的一些hack, 现在基本上可以正常的跑起来了.
除去对graph库的hack外, 我也改了不少shoebot的源码,
一方面是使得shoebot的命令调用更兼容Nodebox, 一方面是移植了部分Nodebox更新后, shoebot还没有移植的功能.
先放一张example图, 改天把源码再仔细检查下, 就放到github上去.
Comments (3) ·· Tags: Nodebox·Python·shoebot·visualization
忘了最早哪儿看到的了, 去年用AS3写了一个,
不过我的AS3实在是烂.
今天est大神提到了这个, 我就顺便用shoebot重写了一次.
分词使用的pymmseg, 不过缺点是分词后不会有词性, 这样就无法通过词性筛掉一部分出现频率高但是实际上重要性不大的词.

如图是胡core在十七大上的讲话, 当然太长了, 我只用了新华社稿子的前两页.
(社会主义果然无比强大啊!)
几点总结:
1. shoebot的确很好用, 或者应该说nodebox真的很好用 -__-!
2. 关于文字排布, 最简单的方法往往是最简单的.
接下来准备把这个东西继续完善下,
1. 做一个HTTP的服务, 免得只能在本机跑很无趣.
2. 做一点语义元素上的挖掘, 我倒是想看看单词在给定距离下的邻接性会不会有什么有趣的东西… 比如根据单词的邻接图绘制最小生成树?
3. 有空了打算做个cluster, 说不定也是一个有趣的结果.
Comments (1) ·· Tags: Python·shoebot·visualization
Carleton College有个field investigation, 调查四川的农业现状, 我蹩脚的跟去做志愿者.
打了几天酱油, 今天是第一天去实际的农场.
实地去了解中国这个农业大国的农业现状, 才发现宅得太深, 人都变得无比浮浅而无知了.
守着一亩三分田地, 望天吃饭, 面对着严重水土流失, 沙质土壤的人们, 突然鲜活的出现在眼前, 除了震撼, 还是震撼.
成都平原富饶的土地一点一点被房地产开发吞噬的时候, 这些丘陵地区的农业还在一步一步的摸索.
拜访的那家农户有12亩土地, 3亩水稻田, 3亩果园, 4亩已经退耕还林, 剩下2亩耕作西瓜, 花生等作物.
土地重新分配后, 考虑到不同的光照, 降水, 地理位置等条件, 每户农家的土地都是散布在整个村落里一块块.
丘陵地区的灌溉条件太差, 基本只靠雨水作为唯一的水源, 水稻田在冬季基本都是休耕蓄水.
主人说, 08年柑橘蛆虫事件爆发后, 柑橘价格一路走低, 因此没什么利润, 果园也基本疏于打理了.
坡地上的4亩土地过去种玉米, 现在已经改成了柏树, 只因为水土流失实在太过严重, 整个山脊上全是土壤流失的沟壑和痕迹.
每年冬季, 农民会在山脚用人力把冲刷下的土壤重新回填到山坡上.
跟着我们同去的农科院专家讲解了很多当地的现状, 也真正第一次让我了解到了这些在田地里工作和科研的科学家的努力,
一切的耕作中需要关注的细节都铺陈在面前的时候, 才意识到自己对农业有着太多的误解和无知.
人口结构的失衡, 土壤结构的薄弱, 农村教育水平的落后, 资金的缺乏, 农民-专家沟通网络的缺失, 都使得这种纯粹靠天吃饭的农业看起来像是这个农业大国肩上过重的负担.
无论是现场实地实验田里的反差, 还是幻灯片里的图表, 都可以看到田地间实验缓慢的结果积累的背后, 无数人的艰辛和汗水.
向这些平凡而伟大的农业工作者致敬.
尽管用科技推动农业生产的路还很漫长, 尽管这个国家农业的重担还是这么的沉重,
不过就像那些仍然用双肩挑起着丰收希望的人努力那样,
我们总归还是要去面对的.
主人说, 村子里像他这样的壮年男子还在种地的不多了,
为了挣钱, 许多人随着农民工大潮在城市里打拼生活.
他之所以留下, 是因为热爱这份耕作的自由, 以及对”一份土地, 孕育万物”的大自然魅力的热爱.
他的儿子现在在学校有相当不错的成绩, 他说, 他希望他的儿子以后能考上大学, 成为城市人.
这种对土地的执着和热爱, 以及在城市化进程加速中渴望摆脱贫穷, 改变现状的矛盾,
或许是这些质朴的人们所面临的最大的难题吧.