自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 robots协议标准

    前两天刚知道用爬虫抓取page有个协议的问题,尤其是对于opensource的爬虫,刚看到一篇blog,写的就是如此,难怪之前看google的robots也和另外一个U.S.的网站相同,感情是大家都商量好了,可能这方面中国的一些站点这种意识要稍微淡一点。。。同时这也害得毕设还得另谋思路。。...

2008-07-29 14:51:00 1142 0

原创 Oracle 10g Express Edition安装删除心得。。。

    由于要使用ODM,最好还是装个oracle,但可能由于本科时使用过oracle9i的缘故,搞的现在还是好担心它的运行情况,所以下了个Oracle 10g的ExpressEdition,只有200多MB,比标准版小得多,但目前还不知道它对ODM工具的支持情况。。。   第一次装Oracle ...

2008-07-29 14:41:00 4752 1

原创 提问:Heritrix应用问题

Heritrix应用问题请教一下大家如何用heritrix抓取以下网站内容,需要定制么?下面是USPTO的专利网页:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FP...

2008-07-10 08:39:00 1019 0

提示
确定要删除当前文章?
取消 删除