Posted on 2007-06-29 22:41
天霁 阅读(1608)
评论(13) 编辑 收藏 所属分类:
nutch
好久没回来了,终于有时间可以更新这个小工具了。
修改的地方:
1、区分数据存储的实际目录;
2、可以反复查询不同的目录数据;
3、数据导出为CVS文件;
4、其他一些小bug;
5、修改status的表现内容
在这里下载,下载后解压缩,两个解压缩文件:RedmuTool.jar,startup.bat,一个类包文件夹:lib。确认这三个在同一文件夹下。
运行界面:
主界面出现后,File-->open,选择nutch抓取后保存数据的文件夹:
菜单中不同的选项对应不同的文件夹,点击相应的选择,就会看到相应的数据内容:
>
点击“ExportToCVS”,则把数据导入到指定的文件内:
对于被保存的页面内的内容“ParseText”和“Content”,处理不好,数据太长了,写到文本文件内表现实在太长了。
在使用中任何意见均可留言,或发送邮件到:
redmuer@hotmail.com。