Ictclas4j
中文分词系统是sinboy
在中科院张华平和刘群老师的研制的FreeICTCLAS
的基础上完成的一个java
开源分词项目,简化了原分词程序的复杂度,旨在为广大的中文分词爱好者一个更好的学习机会。
关于ICTCLAS分词系统的讨论,可以访问google group关于ictclas分词系统的讨论组http://groups.google.com/group/ictclas
另外“春江润楠”大哥对它还做了一些改造,大家可以参阅一下:http://chenyr.spaces.live.com/blog/cns!7BF57CE83A7A863D!394.entry。
下载地址:http://code.google.com/p/ictclas4j/downloads/list
另外还有个挺不错的开源项目MMSeg,用起来也蛮简单,分词的正确度还不错,有兴趣的朋友也可以参考一下:
MMSeg,挺不错的一个开放源代码的中文分词软件包
本文作者:javaread.com