Archive for September, 2008
September 28, 2008 at 4:41 am · Filed under Gossip
热风吹着狭小的空间, 让这个雨夜我几乎忘了寒冷和哆嗦.
更新完了博客站, 看完了House, 无聊的打开了DormID看了看,
思绪似乎一下飞回一年前, 好奇怪, 去年那些我搁置了一直没有做的功能,
似乎我现在忽然能想起当时的偷懒的理由.
栋力无限首页改版了, 却并不是最初和BlueF设想的那样, 成为一个信息的集散地,
而只是成了功能的列示, 和一个简陋的, 人工信息发布平台,
有点遗憾, 于是这几天, 淅淅沥沥的雨里, 一边踏着水洼, 一边都在不停的想,
要不要www2的域名访问到的是一个不一样的栋力无限.
不一样, 我却不知道, 这样的不一样,
这样的带有小众色彩的偏执的想法,
到底会得到多少的认同和认可.
anyway, 热风吹, 总有点安慰和温暖,
实现了自己想法中的东西的感觉总是非常好,
虽然现在是一个尴尬的时间, 没法和所有人分享新功能.
希望有人能, 发现它的价值吧,
这会让我很开心, 真的很开心.
莫大的认同和认可.
September 26, 2008 at 1:33 am · Filed under Gossip, Program
正好最近和est讨论了些编码的问题,
然后百度的笔试题里, 也出现了GBK的编码的问题,
加上我终于非常坚定的自我批判, 认为自己是个crap,
于是乎我决定从昨天(嗯, 现在是今天了 = =!)开始, 每天看2—3h的c语言代码.
脑袋里想了想, 今天就从用了很多次的scws开始了,
正好关乎算法, 编码和足够多又不算少的代码.
感觉收获非常大,
然后继续被void*和ptr **轰杀到坚信自己是crap.
记得上次觉得Python语言非常优美的时候的感叹, 现在可以全部搬过来扔到C语言上,
自己真的学得太轻浮草率了.
今晚继续读scws核心的有关hash和查找树的那部分代码,
希望自己能读懂, 不然就背着crap这牌坊爬不起来了.
时间不早了, 空调吹得有点冷,
看了很久的代码, 从Daniel Powter听到了Tamas Wells,
不停的试图去理解, 揣测, 查资料和做笔记,
感觉脑子有点累得转不动了,
罢了, 回寝室睡觉吧.
晚安, 决定了我是crap的大脑.
September 25, 2008 at 2:05 pm · Filed under Gossip
看到一篇文章, 说脱唷踏准备投身天然气混合动力车.
文章里讲, 石油价格的持续坚挺已经使得市场对于烧气的车辆需求增加了,
但是, 在米粒尖这片神奇的土地上, 目前还只有日本的轰哒公司, 能够向市场供应CNG车辆 — Civic GX, 当然, 这种供应还仅限于加州市场.
因为这种居然能将天然气燃烧转化为汽车动能的车辆, 卖的相当好, 轰哒已经决定, 在2009年, 多生产2000辆这种超越了地球引擎科技的车. 于是乎, 同是日本车商的脱唷踏坐不住了, 宣布要在11月的洛杉矶车展上, 推出牛逼烘烘, 震惊地球人的气-电混合动力版Camry.
我们跑题一下,
脱唷踏一直被认为是这个世界上最青睐混合动力的厂商, 尽管他们在中国生产的一种叫做Prius的外星车辆, 有着非常奇异的掀背造型, 而且据说在深夜可以静悄悄的启动, 偷偷的开出小区, 没有一点发动机轰轰的声响.
最重要的是, 它的价格, 30+万, 并不像它宣传的高科技那样离我们有数个光年.
当然, 当然, 销量不是评价一种技术的最终手段, 因为脱唷踏一直很牛逼的认为, 在混合动力上, 他们是业界的先行者, 引领了整个汽车工业在混合动力发展上的步调. 所以, Prius能被地球人接受, 已经是一种奇迹.
跑题结束.
这周, 脱唷踏在米国波特兰召开会议, 他们分析得出, 人类烧了很多年的石油产量已经无法再坚挺了, 而天然气还非常富足, 用于车辆, 可以解决让人提心吊胆的当前的能源危机.
当然呢, blah blah, 天然气不耐跑啊, 跑不远啊, 米国的加气站很少啊, 还是个问题啊, blah blah…
—————- 分割线 ——————-
1. 我国科技果然非常牛逼, CNG车辆满地跑的时代已经来临很多年了.
2. 米国果然是一片神奇的土地.
3. 天然气如此富足, 为啥我国CNG加气站还时常就气压低, 闹气荒呢?
想来想去, 估计这个星球有两个平行时空…
·· Tags: CNG·汽车·能源
September 25, 2008 at 1:32 pm · Filed under Gossip
很多年前, 大概就是很多很多年前,
家里还有一包完X山奶粉的时候, 完X山在电视上轰炸”牛初乳”的时候,
我好奇的看过那几粒”牛初乳”, 用胶囊封起来的白色粉末,
神奇的据说蛋白质含量极高的玩意儿.
不是很多年前, 就是前不久,
一个男人穿着蓝色还是紫色的衣服, 十分2B而自信的走过欧洲的一条死寂的小街,
对着一帮外国佬傻笑也不忘捏盒特X苏牛奶的那位,
也是据说这种牛奶如何如何的营养, 因为蛋白快要塞满了那些黏黏乎乎的白色液体,
虽然我没有喝出个所以然来, 也没有喝出那个男人那般猥琐的自信.
回过头来一想, 要么就是那粒胶囊里装的就是三聚氰胺,
要么就是特X苏, 特别添加试剂纯级别的三聚氰胺, 不含其他工业杂质.
反正嘛, 牛也不会说话, 牛也不知道每天对着自己乳头捏啊捏啊, 捏出来的机器或者工人,
最后会从自己的奶里测出多少的蛋白,
牛说, 反正俺不喝三聚奶.
September 19, 2008 at 5:03 pm · Filed under Gossip
经过漫长的等待到我终于快要忘记域名迁移的时候,
收到了一堆来自Dreamhost和Godaddy的域名迁移相关的邮件,
挨着处理完, 接着设置好A Record和CNAME Record, 然后开始静候国内的DNS缓存更新…
很快, g.dormforce.net就会分配给flatGrid用了,
而自己留下又长又怪的tremblefrog.org,
各位做了我blogroll的, 人肉更新下吧.
算起来从自己假设架设(感谢Sin除虫)wordpress的博客以来,
已经有过5次域名更改了, 真是, 折腾啊…
September 12, 2008 at 10:50 am · Filed under Gossip
这么俗气的标题, 是因为我实在懒得去想一个能比这句话更简单明了的句子.
这么浑浑噩噩的就过完了人生的第21个年头,
不想回顾太多, 因为记忆总是具有模糊的选择性. :p
这周一个人系统的做了一个小项目, stage2,
很有感触, 也学了不少东西.
做项目真是让人受益匪浅.
回到正题,
killkeeper, 生日快乐!
September 11, 2008 at 4:38 pm · Filed under Gossip
Apple的软件都有一个伟大的共性, 就是软件启动时间可以让你悠闲的泡一杯茶…
当然Safari的字体总是渲染得很萌, iTunes的Podcast我挺喜欢, 没事还可以对着Coverflow翻着自己可怜的专辑玩,
只有Quicktime, 每次我都不知道这个软件到底有什么让人怜爱的优点.
在Windows平台上, Quicktime就是个移植过来的鸡肋.
P.S @max, 谢谢你的生日礼物
·· Tags: Apple·iTunes·Quicktime·Safari
September 10, 2008 at 10:52 am · Filed under Program
Sept 9
完成了基于栈的深度优先目录爬虫原型, 不过在实验爬的过程中, 各种古怪的Exception无数次打断爬虫工作,
这就是错误处理做得烂的恶果啊…
工作最后被打断在对含空格, 尤其是连续空格的文件名处理上, 苦想了半个小时, 也没想好怎么更快的通过split函数处理.
Sept 10
基于正则重写了字符串处理, 结果性能还比该死的split+filter高.
第一次看着爬虫模拟爬行, 处理完了清水河畔的202.115.22.16:21的FTP的所有目录, 接下来开始处理文件.
昨天大概想了下, 对于目录内只有文件而没有子目录的情况, 可以做一个FLAG, 这类的目录可以只判断最后修改时间即可, 没有发生修改则无需再进目录爬内容, 其他的情况都需要执行CWD再爬行.
太阳落山, 实验了下爬出的所有目录的写入数据库, 习惯了数据入库前的数据转义, 找了半天Python里转义与反转义的函数, 后来恍然大悟, 文件名是不可以有这些需要被转义的字符的. XD
想了很久的文件比对列表重建, 后来还是选择了相对容易实现, 和容易比对的平面dict重建.
将所有的目录都放在一个平面的dict中, key是文件夹的path(要不要用path的hash呢?), value是另一个dict, 定义了数据库中对应的唯一ID, 以及一个目录下文件的”files”的dict入口.
Sept 11
完成了对爬虫算法的所有优化, 即本地缓存的构造与文件/文件夹是否更新的检查.
在爬虫完成了首次对FTP仓库的探索后, 之后的每次爬行会进行可能的, 不含推测的最大优化,
这样, 每次的爬行可以避免重复的抓取长时间不会更新的文件.
对于如何在Python和PHP中构建相同的分词体系, 还在考虑中,
原来考虑过在Python里使用pymmseg-cpp, 但是后来担心词库和分词算法的不同, 使PHP和Python下的key不匹配, 结果就是, 搜索失败.
自己现在的想法是做一个scwsd, 即基于scws的守护程序, 监听某个端口完成分词API的执行,
即可做到分词的一致性.
*EDIT* 觉得似乎就在php里完成分词和Xapian Index最简单, 数据库里只需要做一个默认的字段, php每次检查尚未分词的条目进行分词即可
当前还没有考虑好, 对于已删除的文件或文件夹的处理方法,
是建立一张回收表, 还是建立一个”已删除”的字段呢?
Sept 16
添加了对于部分无效目录的判断, 防止在爬行时出现的无效目录导致的无数bug的问题.
另外在些错误自陷时, 将当前的目录移除出缓存, 保证了最后处理”已删除目录和文件”时出现的冲突.
·· Tags: FTP·Python·Stage2·web·编程
September 9, 2008 at 6:13 pm · Filed under Gossip
从昨天开始, 给这块二手的SCSI硬盘里继续塞了Xapian, Memcached和Python的一堆extensions.
September 8, 2008 at 2:43 pm · Filed under Gossip
打开一本红红的TOEFL单词书, 里面有各种不知所云的”单词记忆法”, 美其名曰, 词根+联想记忆法.
我记得很早以前就有这种玩意儿, 甚至衍生出无数个系列和包装下就出版马扁钱的玩意儿.
我觉得有一套图书就定位得很好, “火星英语”, 真装B, 这种英语学习法就应该留给这种自以为是的编者到火星满意的意淫,
而不是冠冕堂皇的在市面上到处售卖.
把书翻过来, 发现还是俞敏洪这个自我良好的2B编纂的这本破玩意儿,
前言里, 他还很欣慰的向广大读者推荐着他的这套记忆法是如何的好用:
“还有很多单词可以通过联想的方法记忆, 比如crystal(水晶)这个单词, 我们可以将它拆分并解释为”cry(哭泣)+stal(看做star 星星)->水晶像是星星哭泣掉下的眼泪, 通过这种方法记住的单词往往遗忘率很低.”
我靠, 俞老师您真NB, 这样拆也能想出来, 我怎么就愣是看不出来stal和star有哪门子关系?
这种滥俗狗屁不通的生搬硬套, 生拉硬扯的”联想记忆法”也能被您生造出来, 我是无话可说.
这么说impaction也可以拆为i’m + pact(看做pack, 打包) + ion –> 我在打包, 所以就是”压紧”.
这和几百年前在街上立着幌子, 号称通过拆字洞穿一切的江湖骗子有啥区别?
况且再不说您不知道哪儿找来的数据, 说这样胡编乱造的狗屁联想, 就能”通过这种方法记住的单词往往遗忘率很低”?
这种经验主义想当然连个狗屁数据都没有的自吹自擂我见得多了,
有的好歹还找个国外的不入流的演员扮演个XX大学的XX教授装模作样的表演半天.
我不是说我英语好,
我英语谦卑的说, 很烂, 比不上您老人家那样的NB,
不过我总觉得, 一门语言是有自己的连贯性的, 生硬的违背语言本身的美感和语感去生造一套映射记忆系统,
真是费力不讨好.
总结单词没错, 比拿着本词典挨着翻省事, 也更有效率,
只是看不惯这种所谓的再加工, 就像吃下去的东西, 吐出来一团乱七八糟, 也美其名曰, 利于消化了.
病态, 真TM的病态,
学个英语看这种自以为是的装B书籍还真是需要点能耐.
·· Tags: TOEFL·教育·新东方·英语
Next entries »