马可波罗的梦乡

BlogJava 首页 新随笔 联系 聚合 管理
  4 Posts :: 50 Stories :: 2 Comments :: 0 Trackbacks
第一个分词问题,居然是在FTP返回字符串的解析之上,暂时还没有想到解决的办法。

如   /hello/this is directory/IT 类
IT 类 /civilservant/_Incoming_/公务员/专业课/  这行记录也已经搜到,所以下面的文档搜不到,问题可能出在 爬虫上,下面的文档url没有放到 原始数据中?  // 看了一下原始数据,果然没有包含此url,问题是出在哪里呢?

但是在测试例子中这样做是可以的啊。。。

posted on 2009-09-16 22:05 梦回唐朝 阅读(91) 评论(0)  编辑  收藏 所属分类: Lucene

只有注册用户登录后才能发表评论。


网站导航: