MockBank过半 新的玩意又来

Rain 发表于 2008-04-15 21:53:11

我说,从来没这么感谢过伟大祖国的教学评估。
不然今天就该传说中的《实变函数与泛函分析》,坊间传闻是:实变函数学十遍,泛函分析心犯寒。
可以小缓冲下到四月底来考,实在是太好了。来说说看近期的活动和安排:)

看完了Python的tutorial,在艰难的看各种库。 那个《Python in a nutshell》是本蛮不错的书,实在看电子书看的太疲倦了就直接看这个吧。
那个关于Java的安全包已经比较熟悉鸟,虽然估计以后都不会再用到。我们数据分析的在这个小项目里面感觉就是救场的,哪里人少就去充数,这两天被调到测试组去写test case 算半个SQA助理。然后最近两天的office time都在看测试的书。剩下的时间就看Python了。

-------------------------------
既然Test Case写完,下面就等着coding的人编码完了过来测试咯,测试平台好像也不归我管。Hoho,好轻松那要不是有考试在远处诡笑。

下面的两周内要用Python去写一个"可配置的Spider",哎呀终于做到我喜欢玩的东西了:)
大体是 抓取页面,分析内容,删除重复,内容展现,数据存档

  • 抓取就直接用urllib
  • 分析用from sgmllib import SGMLParser 再加上一些re的东西
  • 删除重复这块
    简单点的就直接匹配标题好了
    复杂点的要去计算文档摘要
  • 内容展现就写成个XML文档出来就好了
  • 数据存档是可选的,可以连上一个MySQL的数据库,把元素拆开放进去



思路是不难,但是对Python的不熟悉将是拖慢进度的最重要的原因:
可以用的资源:



需求(1D)-->系统分析(2D)-->编码(4D)-->测试(1D)-->文档撰写
完全非典型
关键词(Tag): fun spider python


收藏: QQ书签 del.icio.us 订阅: Google 抓虾

最新评论

  • 2008-04-16 18:17:51

    是不是还有一条叫随机数学随机过……
    真是大好青年呢……


  • 2008-04-16 21:36:22 匿名 121.229.*.*

    只是,来看看

发表评论

* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 
 

分类小组论坛
杂谈, 娱乐、八卦, 文学、艺术, 体育, 旅游、同城, 象牙塔, 情感, 时尚、生活, 星座, 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定