Archive for Gossip
May 20, 2010 at 2:23 pm · Filed under Gossip
两周前接到小六电话, 说我的域名需要备案.
还在琢磨着买VPS迁移, 209就以一种琢磨不透的方式挂掉了.
把209从机柜上拖下来, 打开机箱, 拆下来电源.
尽管事后我才想起, 当天测电压输出的时候, 竟然愚蠢的没有短接4脚和5脚, 但总归事实是这块电源再也无法点亮209的主板了.
于是207被短暂的停止工作, 剥皮掏内脏, 24pin接口被插到209上, 以测试这台积满了灰尘的白色1U服务器, 是否已经彻底的死掉了.
除了一个主板上看起来微微有些凸起的电容不让人怎么放心外, 总归207的电源还是成功的让209启动起来, 通过了自检.
接着的问题, 就是一个经典的, “我们图省事买了一台高度定制化和充满了非标准化接口的设备, 现在这玩意儿坏了, 我们怎么办”的困境. 现在我们有一个挂掉的OEM 1U电源, 只有一个24pin的接口, 和一个8pin, 给SCSI板供电的接口.
万能的淘宝上貌似找不到这样的电源. 偶尔瞥见有的电源带8pin接口输出, 都无一例外是+12v给CPU供电的.
于是我和万能的科学帝Aw讨论了很久,如何改造一个标准电源的问题.
山寨如电工胶布把剪下来的8pin头和砍头的两个IDE头拼接的方案,到最后的,转换头的方案.
然后我们手里就有了,嗯,8pin和IDE头子的塑料件,导线,和金属接头.
接下来是焊接和拼装工作,直到出现了一个看起来有些诡异的转接头.
再接下来,209被成功的点亮.一堆臃肿的电源线故被鼓囊囊地塞进狭小的机箱,新电源狭长的尺寸使得它没法像OEM电源那样被固定,甚至它使得机箱壳子都没法合拢——不过, 让这台轰鸣的机器重新复工, 又还能奢求什么呢.
关于209重新复活的故事,我最喜欢的部分,就是这个转接头的地线.
该死的,那天我们竟然没有找到愿意开零卖给我们黑线的奸商.
于是,四根粗硕的紫线,让这个转接头,充满了山寨的色彩.
当209重新点亮的那一刻,
我满脑子的思绪立刻回到了两周前.
因为莫名其妙的被死亡而不了了之的备案和blog迁移的事情, 又变得现实起来.
所以,最终,又回到了这个博客死亡的话题上了.
March 14, 2010 at 10:58 pm · Filed under Gossip
大雨敲的车窗满是光影和节律, 雨刮器嗞嗞刮过, 留下一道让人眩晕密布的轨迹.
从12月27日不眠的夜晚, 到3月13日, 待着日出, 把早餐小心翼翼的放在盘子里的清晨,
开过了1428公里, 假期和暖冬, 伴着不规律的睡眠, 晚餐, 浑浑噩噩的思考.
有一只黄色长毛的猫, 游荡在这个寂静的公寓里.
有一些泛蓝泛黄的灯, 开开关关, 忘了时间的点亮, 熄灭.
有一次次的带着寒意日出的入眠.
有狼藉的厨房, 随处摆放的杯盘, 琐碎的冰箱.
带着异样的期盼, 对未知的惶恐, 对寂寞的习惯过完整个寒假,
偶尔走在熙攘的从学校宿舍到学校的小路上, 惊讶的感到陌生.
世界在雨滴和刮花的窗玻璃中模糊, 只剩下些许的轮廓和大片的色彩.
几丝寒风中清冷的黄昏, 不知道重复了多少次相同的一天的场景.
守着蓝色墙壁的卧室, 开开关关的灯,
哼着歌曲的音箱, 惨白的屏幕, 咕噜咕噜的鱼缸, 两面看着头发长了又长, 张牙舞爪的镜子.
一只悠闲的猫, 总是在黑夜里感到不安, 一路点亮灯泡, 整夜忘了关掉的我.
有的时候, 我真的很恨孤单.
自言自语先生你好, 该换雨刮器了.
你的世界在这个雨水开始降临的季节里, 总会时不时的这样, 变得一切模糊.
于是你就迷失在某个城市的角落里.
关掉雨刮器, 滴滴答答, 直到红灯变绿, 你的生活开始继续.
自言自语先生你好, 很感谢你每天都陪我聊天.
还有, 我们的面包吃完了.
January 23, 2010 at 9:54 pm · Filed under Gossip
中国互联网是开放的,中国也是互联网发展最活跃的国家,到去年底,中国网民达3.84亿,网站达368万个,博客1.8亿。中国宪法保护公民的言论自由,推动互联网的发展是我们的一贯政策。中国有自己的国情和文化传统,中国对互联网坚持依法管理,符合世界通行做法。
【该评论已关闭】
January 10, 2010 at 12:35 am · Filed under Gossip
寒假的一些简短计划, 写在这里好了:
- 钻研Biopython和numpy, 用Biopython和numpy重写procadj, 完成后续的最小生成树部分的.
- 额, 多看看Computational genomics, System biology, Functional genomics, Comparative genomics的paper.
- 完成S. cereviase 基因预测的项目, 包括manuscript, 以及可能的annotation的尝试?
- 分子生物学, 生物信息学, 数据挖掘, 算法设计的教材再认真的看看.
- Random Forest, HMM.
- Metagenomics的了解, 包括数据获取, 基本研究方法等等.
- 准备生物医学信号处理的缓考考试 -.-#
·· Tags: Bioinformatics
January 3, 2010 at 4:57 pm · Filed under Gossip
很久以前做了个豆瓣-电子科大图书馆馆藏查询的Bookmarklet/Greasemonkey Script,
在图书馆借书的时候才发现手持设备根本没法查馆藏信息, 悲剧啊!
最近一直在看Google App Engine的文档, 就打算写个App来体验下.
于是就有了这个项目: 郫县豆瓣.mobile.
名字来源于电子科大幼儿园郫县金凤村附属电子高专,和豆瓣.
功能很简单, 就是利用豆瓣的API查询图书, 然后同时查询图书的馆藏状态.
把服务跑在GAE而不是栋力的服务器上的坏处是:
- 电子科大的DNS经常抽风, 外网访问图书馆系统不稳定
- 访问延迟偏高
昨天最开始测试的时候, urlfetch不停的超时, 最后不得已, 还是在209上搭了个桥, 囧.
稍微修改了下原来用PHP写的Web Services, 支持多个请求合并, 这样可以减少urlfetch的调用数目.
不过既然做了个网站, 就打算把原来只停留在TODO list上的features全部实现了,
包括:
- 用户借书清单, 对我这种很久去一次图书馆借一堆书的人省得用纸笔了
- 图书自动续借, 懒人专用
- 图书借阅信息双向同步(比如借了本书就在豆瓣上标记为”在读”, 归还后标记为”读过”), 懒人专用
- 归还通知, XMPP的也好, 邮件的也好, 甚至Twitter的也好, 看有没有精力折腾吧.
比较落后于时代, 在郫县豆瓣.mobile里也是第一次用Google Analytics,
不得不说Google Analytics和Google App Engine的确是简单好用到极致了.
最后, 郫县豆瓣.mobile项目是开源的, 基于Apache License 2.0发布,
代码托管在Github, 地址: http://github.com/killkeeper/Douban-UESTC-Library-Mashup-Mobile

·· Tags: douban·GAE·github·Google·Python
December 31, 2009 at 6:33 pm · Filed under Gossip
咳咳, 我就这么期盼下.

December 9, 2009 at 9:33 pm · Filed under Gossip
Carleton College有个field investigation, 调查四川的农业现状, 我蹩脚的跟去做志愿者.
打了几天酱油, 今天是第一天去实际的农场.
实地去了解中国这个农业大国的农业现状, 才发现宅得太深, 人都变得无比浮浅而无知了.
守着一亩三分田地, 望天吃饭, 面对着严重水土流失, 沙质土壤的人们, 突然鲜活的出现在眼前, 除了震撼, 还是震撼.
成都平原富饶的土地一点一点被房地产开发吞噬的时候, 这些丘陵地区的农业还在一步一步的摸索.
拜访的那家农户有12亩土地, 3亩水稻田, 3亩果园, 4亩已经退耕还林, 剩下2亩耕作西瓜, 花生等作物.
土地重新分配后, 考虑到不同的光照, 降水, 地理位置等条件, 每户农家的土地都是散布在整个村落里一块块.
丘陵地区的灌溉条件太差, 基本只靠雨水作为唯一的水源, 水稻田在冬季基本都是休耕蓄水.
主人说, 08年柑橘蛆虫事件爆发后, 柑橘价格一路走低, 因此没什么利润, 果园也基本疏于打理了.
坡地上的4亩土地过去种玉米, 现在已经改成了柏树, 只因为水土流失实在太过严重, 整个山脊上全是土壤流失的沟壑和痕迹.
每年冬季, 农民会在山脚用人力把冲刷下的土壤重新回填到山坡上.
跟着我们同去的农科院专家讲解了很多当地的现状, 也真正第一次让我了解到了这些在田地里工作和科研的科学家的努力,
一切的耕作中需要关注的细节都铺陈在面前的时候, 才意识到自己对农业有着太多的误解和无知.
人口结构的失衡, 土壤结构的薄弱, 农村教育水平的落后, 资金的缺乏, 农民-专家沟通网络的缺失, 都使得这种纯粹靠天吃饭的农业看起来像是这个农业大国肩上过重的负担.
无论是现场实地实验田里的反差, 还是幻灯片里的图表, 都可以看到田地间实验缓慢的结果积累的背后, 无数人的艰辛和汗水.
向这些平凡而伟大的农业工作者致敬.
尽管用科技推动农业生产的路还很漫长, 尽管这个国家农业的重担还是这么的沉重,
不过就像那些仍然用双肩挑起着丰收希望的人努力那样,
我们总归还是要去面对的.
主人说, 村子里像他这样的壮年男子还在种地的不多了,
为了挣钱, 许多人随着农民工大潮在城市里打拼生活.
他之所以留下, 是因为热爱这份耕作的自由, 以及对”一份土地, 孕育万物”的大自然魅力的热爱.
他的儿子现在在学校有相当不错的成绩, 他说, 他希望他的儿子以后能考上大学, 成为城市人.
这种对土地的执着和热爱, 以及在城市化进程加速中渴望摆脱贫穷, 改变现状的矛盾,
或许是这些质朴的人们所面临的最大的难题吧.
November 29, 2009 at 1:47 pm · Filed under Gossip

豆豆.
细节问题害死人啊.
又花了无数分钟和memory corruption做斗争,
惊讶的发现以前的程序里有这么的错.
以前的结果估计全是错的 -.-
唉, 离代码民工的水平都差得远啊.
November 15, 2009 at 9:32 pm · Filed under Gossip
你从来都不和我说任何的关于这方面的顾虑,
我不知道你是在害怕什么, 或者担心什么,
但是显然的, 你有顾虑, 你有莫名的畏惧.
我不明白, 为什么你总是害怕开始一个新阶段, 或者说一个新状态,
就好象如果你是一个DFA, 你在无谓的害怕状态的转换, 这说不通啊?
你要明白, 在到达接受态前, 做任何的抵抗, 挣扎, 或者在一个loop上麻痹自己是永远不会有结果的.
可是有的时候我真的不明白你, 你只是选择用转移注意力来麻痹自己,
你开始选择逃离生活的主题, 你很少说话, 你甚至和我说话都不愿意说实话, 是吗?
我们的时间真的越来越少了,
眼看着就要月底了, 你甚至都还没有完成最简单最初步的工作,
你一边说时间还多, 一边也知道时间正在快速的溜走, 你明明知道这种正在流逝的紧迫感,
你却只是轻描淡写的选择用各种方式来拖延, 就是不愿意切入正题.
我有点害怕看不透你,
也许只是因为,
本质上, 只有看见了你evil的一面, 我才会在这里无谓的唠叨.
今天是11月15日,
你知道15日是多么敏感的日子,
我本来不想给我们找任何纵容自己的借口,
但是也许我和你一样, 都是这样纵容自己停滞不前的执行者.
从改变生活习惯开始吧,
我们还有不多的2周.
November 15, 2009 at 11:30 am · Filed under Gossip, Program
无聊得蛋痛, 想起了电子科大附属幼儿园”门户”的那个CAPTCHA.
前几周帮导师准备支持向量机的上机实验的时候, 正好看到一个用svm识别手写阿拉伯数字的数据库.
简单来说, 手写数字的图形被缩放为16×16的二值图像最后转化为256参数的多元分类问题,
考虑到上面这个阿拉伯数字数据库不错的交叉检验准确率, 我也就顺便拿来做”门户”的CAPTCHA识别了.
写了个脚本拖了100+个验证码样本回来, 仔细看了下,
虽然这个第二版山寨门户的CAPTCHA比第一版的CAPTCHA有了不少的进步(第一版的数字无比规则以至于可以直接写一个Greasemonkey脚本用canvas来识别),
但是总体上还是比较好识别的, 统一是二值图片, 字符间有清晰的间隙(除了有一张图有一点毛刺外),
只是图片加上了一些简单的几何变换.

上面是一个CAPTCHA的例子。
考虑到几何变换对字符产生的形变所造成的相同字符间差异,还没有手写阿拉伯数字样本间的差异大,
我就没做任何校正处理直接把字符切割了送去做训练和识别了.
通过识别各个字符的最大边界, 将四个字符分割出来, 统一复制到60×60的一块空画布上,
最后缩放到15×15, 转化为标准的二值 bitmap, 最后输出为libsvm的标准格式.
训练集我一共下载了124张CAPTCHA图片, 也就是496个字符的samples,
用libsvm对训练集做了5重的Cross-Validation, 自检验准确率: 97.1311% (Radial Basis核).
*EDIT* 又用线性核做了一次, 可以跑到98.1557%
总的来说, 支持向量机识别这个轻微几何变形的CAPTCHA还是有相当高的准确率的.
最后感谢无比handy的PIL以及Python,
这让我突然想起了用C/CPP写酵母基因预测程序时候的繁琐和折磨.
最后的最后, 我也不知道把这个CAPTCHA hack了有什么实质性的用处,
电子科大附属幼儿园门户系统如此山寨, 以至于从上一版本到现在的版本,
都可以绕过CAPTCHA直接提交信息进行认证,
回扣万岁!!
附简化原理图一张:

·· Tags: Captcha·libsvm·PIL·Python·SVM
Next entries »