10分钟开始使用ICTCLAS Java版

# re: 10分钟开始使用ICTCLAS Java版[未登录]

这样的分词程序有很多，呵呵～～这个也不错。

hiswing 评论于 2008-09-21 19:48 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我用的是庖丁解牛2.0beta版的，就是没有词性标注
这个还是很不错的
呵呵

tinypig 评论于 2008-09-22 20:06 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我使用了下，不行啊！！
你确定你运行成功了?为什么我会出现这个错误呢：
Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:571)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:63)
at testjava.Testictclas4j.main(Testictclas4j.java:12)

tinypig 评论于 2008-09-22 20:36 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

啊，你提醒了我，文章中关于Data文件夹放置的位置是错的，正确的位置应该是你建的Eclipse项目的文件夹下，而不是bin目录下，这回应该可以了吧。

Jasper 评论于 2008-09-23 00:13 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

可以了。谢谢
以后可能还要多请你多指教啊

tinypig 评论于 2008-09-23 17:16 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

Ok，谢谢

norm 评论于 2008-12-17 16:08 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

在那个onemail类中可以运行，但是一放到jsp中就出错。一样的代码
请教~ 急

海洋评论于 2009-01-31 19:30 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

你好，我在JDK的环境下如何调用ictclas4j？
我将OneMain.java放在哪里才能用呢？呜呜，新手，没法使用啊，请您帮助下我吧，谢谢

yjwmylm 评论于 2009-03-19 11:41 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

你好，我把ictclas4j放到JDK1.6下使用，也碰到了java.lang.NullPointerException
org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:571)
org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
org.ictclas4j.segment.SegTag.split(SegTag.java:63)
请问你的问题解决了吗？能帮我看下为什么么

yjwmylm 评论于 2009-03-22 15:01 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@yjwmylm
ICTCLAS因为有一个卖钱的商业版，所以这个开源的版本毛病还是比较多的。比如有一些词库中不存在的词，就会扔空指针的错误，比如“深圳”，“大阪”这样的词。
还有对一些特殊的字符串模式，比如单引号隔几个字符再加一个什么什么的，就会报错（年代有些久远，记不太清了）。还有一些特殊的字符，也会报错。如果不是很重视这些偏门的东西，建议还是修改一下源代码，把这样的异常屏蔽下就好。

Jasper 评论于 2009-03-22 15:24 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@yjwmylm
data位置放错了。。

www 评论于 2009-03-29 16:27 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我用这个在本地是可以使用的，可是在建立web project的时候就会出错。在这一句时SegResult sr = st.split(input);
java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:571)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:63)

tttt 评论于 2009-06-09 16:40 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我终于能用了，谢谢！

hust 评论于 2009-06-09 16:44 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

jsp传的字符串是正确的，即使直接用新建的字符串，还是会出现同样的问题。同样的使用java application 运行又是没问题。

tttt 评论于 2009-06-09 16:51 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@tttt
请注意,本地的Application可以找到的资源,在Web服务器中未必找得到,所以请试着把ICTCLAS的词典文件（也就是Data文件夹）放在正确的位置才可以。

Jasper 评论于 2009-06-09 17:32 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@Jasper
谢谢。
恩，我前面也发现了应该是这个原因，甚至直接把data文件设为环境变量都不行。最后把data放在eclipse的安装目录下才可以。有办法修改这默认资源路径么？

tttt 评论于 2009-06-09 18:05 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我的怎么出这个问题啊？
Exception in thread "main" java.lang.NoClassDefFoundError: bean/FilesUtil
at org.ictclas4j.segment.SegTag.<init>(SegTag.java:33)
at OneMain.main(OneMain.java:11)
Caused by: java.lang.ClassNotFoundException: bean.FilesUtil
at java.net.URLClassLoader$1.run(Unknown Source)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
at java.lang.ClassLoader.loadClassInternal(Unknown Source)
... 2 more
This is OneMain

jia15679 评论于 2009-07-28 19:32 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

你好Jasper
我是新手请教一下为什么我用ICTCLAS4j
src下org.ictclas4j.bean有很多编译错误
大部分是
ReflectionToStringBuilder cannot be resolved
和
The import org.apache cannot be resolved

另外不知道您是否测试过不开源的共享版是否提供比较全面的词库？
我只想用它来分词完全是应用
非常感谢～

Miao 评论于 2009-08-02 22:06 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@Miao
查看一下自己使用的JDK版本，保证JDK5以后.另外我没有测试过非开源版的ICTCLAS，但是据他们的文档和ICTCLAS4j的作者讲，非开源的版本词库要全得多，速度也快得多。

Jasper 评论于 2009-08-03 08:46 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

hi Jasper非常感谢

我装的是JDK6/ jre/ Eclipse/ XP
我仔细看了所有错误都是和ReflectionToStringBuilder有关
should be from:
import org.apache.commons.lang.builder.ReflectionToStringBuilder

但我没有org.apache
不知道它是什么时候跟着什么安装的还是自己要额外安装jar??

Miao 评论于 2009-08-03 22:40 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@Miao
哦,需要一个Apache的commons的jar包,可以去www.apache.org找到。

Jasper 评论于 2009-08-03 22:46 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

恩谢谢我刚找到。。。是google到的
去了apache.org上但是不知道怎么找到我想要的jar呢
在下载页那个非常长的目录。。。
应该怎么找commons呢

这个本来就应该是手动安装的么？

另外这个apache和 apache http server 有什么关系？

非常非常感谢伟大的Jasper同志～～

Miao 评论于 2009-08-03 23:38 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

hi Jasper~ (again ;p)
不好意思又来麻烦请教～
我运行您的测试类之后也出现
This is OneMain
Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:571)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:63)
at OneMain.main(OneMain.java:13)

文件位置应该都是正确的
我试了把文本里的中文字去掉之后只剩下英文的时候就运行正常
用的是英文xp eclipse里已经在preference把text的encoding改成utf-8了。
不知道还可能是什么问题呢？非常感谢～

Miao 评论于 2009-08-04 05:05 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

改成gbk 之后终于ok了非常感谢 :) 好心情～

Miao 评论于 2009-08-04 05:15 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

你是刘群老师的学生吗？

rubby 评论于 2009-08-04 22:43 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@rubby
不是的。

Jasper 评论于 2009-08-05 08:56 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

你好~~
我运行了为什么总出现导入包的错误啊

Exception in thread "main" java.lang.Error: Unresolved compilation problems:
SegTag cannot be resolved to a type
SegTag cannot be resolved to a type
SegResult cannot be resolved to a type
import语句一直都有问题哦

tina 评论于 2009-08-14 10:45 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@tina
如果有遇到问题的朋友，请移步这里：
http://blog.csdn.net/zzljlu/archive/2010/06/17/5676053.aspx

zzl 评论于 2010-06-17 17:21 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

你好，我想请教一下，既然ictclas4j是用java编写，为什么在linux下运行会报异常呢？异常类型：java.lang.NullPointerException。
多谢指点。

tzm 评论于 2010-08-31 20:34 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

急！！为什么总是出现这样：
Exception in thread "main" java.lang.Error: Unresolved compilation problems:
SegTag cannot be resolved to a type
SegTag cannot be resolved to a type
SegResult cannot be resolved to a type

婷评论于 2010-10-07 14:57 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@tttt
java web java.lang.NullPointerException~
请问问题解决了么？

kim 评论于 2011-03-22 16:36 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@www
我是直接使用的jar包，用build path导入，也出现了空指针问题，难道我的data数据的位置也有问题？
Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:574)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:96)
at org.ictclas4j.segment.SegTag.split(SegTag.java:63)
at execute.SegmentWords.main(SegmentWords.java:15)

子一评论于 2011-05-07 10:45 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我的QQ：450713994，谁知道答案，速与我联系好吗？急！急！集!先谢谢各位了！！！！

子一评论于 2011-05-07 10:48 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

呵呵，这个helloworld，像是给ict做广告
我的搜索引擎也是使用这个，从朋友那拷过来的，+词库。但没有源码，不知道开不开源？听说是隐马尔科夫模型。想探探。

shiym 评论于 2011-06-14 23:09 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

Mac OS x 下似乎不工作，即使没有NPE，分词也不成功。
如果你用Linux或者Mac，建议用Chinese Analyzer，我试了一下，可以用。

JJ 评论于 2011-07-20 13:22 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

new SegTag(1);
请问一下这个的1表示什么意思？我试了一下，其他的整数似乎也可以？有什么区别吗？

ChenMin 评论于 2011-10-13 21:53 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

苹果电脑可以用这个分值器吗

学学评论于 2012-12-22 11:34 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@hiswing
@Jasper
能给我发一份ICTCLAS Java版吗？这几天官网下不了，网上有很多都是假的。
375513290@qq.com
谢谢!!!

sjjgmf 评论于 2013-05-03 16:42 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

DATA位置应该放哪才能在JSP上运行啊，菜鸟求告知，求确切路径，不胜感激！

不是坏YIN 评论于 2013-05-25 06:35 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@tinypig
你好，今天也碰到了和你同样的问题。Data文件夹到底放在什么位置呢，楼主在上文中说到是Eclipse项目的文件夹下，在回复你的评论中又说刚才说错了，但也一样是Eclipse项目的文件下呀。。。
我用“Run as java application”就没有问题，但启动tomcat后就报你说的那个错误了。
我把Data放在了MyEclipse的项目文件夹下，又在tomcat的项目文件夹下放了一个，也不行。
不知是什么原因，谢谢了！

yibaoemily 评论于 2013-08-23 16:32 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@tttt
你好啊，时代有点久远了，也不知道能不能有回复。我照着你说的也放在了eclipse的安装目录下，依然报错。不知道楼主说的正确的位置指哪里啊。。。求助！

yibaoemily 评论于 2013-08-23 16:39 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@yibaoemily
知道问题所在了，自问自答一下吧。把Data文件夹放在了tomcat安装目录的bin目录下，就可以了！

yibaoemily 评论于 2013-08-23 17:03 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@Jasper
新手求救
The import org.apache cannot be resolved

xx 评论于 2013-09-02 10:50 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

请问这能根据 \x 某个分类来过滤标点符号或者某些类别词语吗？

李剑鹏评论于 2014-05-15 16:46 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

xileng 评论于 2014-08-05 13:36 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@怎么解决的啊，分享一下

xileng 评论于 2014-08-05 14:13 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

赞楼主
请问用eclipse开发android时怎么使用ictclas4j
如楼主所讲已将 “Data文件夹整个拷贝到Eclipse项目的文件夹下,而bin目录下的org文件夹整个拷贝到你Eclipse项目的bin目录下，把src目录下的org文件夹整个拷贝到Eclipse项目的src目录下” 后
出现Exception in thread "main" java.lang.NullPointerException
怎么办呢？

icefog 评论于 2014-08-23 10:14 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我查了代码，好像里面的文件名称有错误，文件夹的名称是Data，而代码里面是data，还有一个是BigramDict.dct，不知道楼主是怎么能运行的@icefog

无名小卒评论于 2014-09-01 09:44 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

我查了代码，好像里面的文件名称有错误，文件夹的名称是Data，而代码里面是data，还有一个是BigramDict.dct，不知道楼主是怎么能运行的.我也没解决好@xileng

无名小卒评论于 2014-09-01 09:48 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

本想做一个app的，现在进度因为这个完全停住了@无名小卒

icefog 评论于 2014-09-06 12:59 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

@tinypig

我这边也提示 Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:618)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:96)
at OneMain.main(OneMain.java:25)
不知道是缺少了什么东西

jyp 评论于 2014-09-29 20:51 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean.Dictionary.getMaxMatch(Dictionary.java:571)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:63)
at OneMain.main(OneMain.java:15)
我这边也提示 Exception in thread "main" java.lang.NullPointerException
at org.ictclas4j.bean. www.48yl.com Dictionary.getMaxMatch(Dictionary.java:618)
at org.ictclas4j.segment.GraphGenerate.generate(GraphGenerate.java:93)
at org.ictclas4j.segment.SegTag.split(SegTag.java:96)
at OneMain.main(OneMain.java:25)

用力小说网评论于 2014-09-29 22:25 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

字符“艹”貌似没有

asd 评论于 2014-11-19 11:04 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版

您好，你这个ictclas4j压缩包还有吗？能麻烦发一份给我吗？我的邮箱：wwwh2008@163.com
我在网上下了一个ictclas4j，但总是分成一个字一个字的，如下：
打/g 造/g 经/g 济/vg 的/vg 航/g 空/g 母/g 舰/g 。/g
我觉得是data文件不对~~

guw 评论于 2014-12-22 15:59 回复更多评论

# re: 10分钟开始使用ICTCLAS Java版[未登录]

@guw 我也是遇到你那种情况，请教你后来怎么解决的？

windy 评论于 2015-04-06 09:42 回复更多评论

公告

常用链接

留言簿(64)

随笔分类

随笔档案

文章分类

搜索

最新评论

阅读排行榜

评论排行榜

Jasper's Java Jacal 嘉士伯的Java小屋
BlogJava \| 首页 \| 发新随笔 \| 发新文章 \| 联系 \| 聚合 \| 管理	随笔：51 文章：2 评论：717 引用：0