小叮咚 中文分词 发布 java 版本 , c# 版本 , c++ 版本
最近关于中文分词的处理逐渐多了起来,我以前的文章也零星的介绍过许多这方面的技术。总有一些朋友来信索要中文分词的代码,而且要不同版本的,鉴于这个情况,我把我对分词的理解,按照java,C#语言各自实现了一份。C++的版本,还是用中科院的ICTCLAS 毕竟这个分词程序是很多分词的鼻祖。
大家可以到:小叮咚中文分词主页查看详情。
程序还有很多不完善的地方,功能列表和开发文档现在都不完整,希望有这方面爱好的朋友一起参与进来,完善,提高。
也欢迎大家来信讨论: xiaodingdong@gmail.com
田春峰
相关联接:
小叮咚分词主页
计算所汉语词法分析系统ICTCLAS 字典格式解析
一种面向搜索引擎的中文切分词方法
公开小叮咚分词源代码