andy-j2ee  
JAVA
公告
  • 在夜深人静的时候,偶弹起心爱的土琵琶,唱起那动人的歌谣(柯受良-《大哥》):偶写了代码好多年,偶不爱冰冷的床沿,不要逼偶想念,不要逼偶流泪,偶会翻。
日历
<2011年5月>
24252627282930
1234567
891011121314
15161718192021
22232425262728
2930311234
统计
  • 随笔 - 19
  • 文章 - 1
  • 评论 - 1
  • 引用 - 0

导航

常用链接

留言簿

随笔分类(5)

随笔档案(19)

文章分类(1)

文章档案(1)

搜索

  •  

最新评论

阅读排行榜

评论排行榜

 
今天开发了自己的第二个开源工具 jar包
名称:pinyin4j.jar
功能: 将汉语拼音转换为汉语拼音

算法:
从对应的资源文件中(文件中包含了常用汉字的unicode编码-拼音)
文件格式如下:
3007 (ling2)
4E00 (yi1)
4E01 (ding1,zheng1)
4E02 (kao3)
4E03 (qi1)
4E04 (shang4,shang3)
.
.
.
用数据流的方式读取 然后将unicode码以key,pinyin为value存入一个HashMap中

接口:
    传入:汉语拼音的字符串
    返回:拼音的字符串数组(即每个汉语拼音对应相应的拼音)


源码:
package com.anduo.pinyin4j;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.HashMap;

public class PinYinHelper {
	private static HashMap<String, String> hashMap = new HashMap<String, String>();

	/**
	 * 将unicode-to-hanyu-pinyin.txt文件 以unicode为key pinyin为value 加到hashmap中
	 */
	private static void myReader() {
		InputStream is = PinYinHelper.class.getClass().getResourceAsStream(
				"/resource/unicode_to_hanyu_pinyin.txt");
		BufferedReader breader = new BufferedReader(new InputStreamReader(is));
		String s;
		String unicode;
		String pinyin;
		try {
			while ((s = breader.readLine()) != null) {
				// 提取文件流每行中的unicode码以及 pinyin字符串
				unicode = s.substring(0, 4);
				pinyin = s.substring(6, s.length() - 1);
				hashMap.put(unicode.toLowerCase(), pinyin);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	/**
	 * 将汉语转换为汉语拼音
	 * 
	 * @param value
	 * @return pinyin[]
	 */
	public static String[] toHanYuPinYin(String value) {

		myReader();

		String[] result = new String[value.length()];
		String unicode;
		String pinyin;
		for (int i = 0; i < value.length(); i++) {
			Character c = value.charAt(i);
			unicode = Integer.toHexString(c);// 得到汉字的unicode编码
			pinyin = hashMap.get(unicode);// 从hashMap中找到汉子的拼音
			result[i] = pinyin;
		}

		return result;
	}
}



然后导出为jar包

测试一下:
新建一个java工程,然后将刚做好的jar包导入的工程中
新建一个test类
package com.anduo;

import com.anduo.pinyin4j.PinYinHelper;

public class test {
	public static void main(String[] args) {

		String s[] = PinYinHelper.toHanYuPinYin("大但是关键的是概多少了攻击多少");
		for (String string : s) {
			System.out.println(string);
		}

	}
}



测试效果:
da4,dai4
dan4
shi4
guan1
jian4
de5,di4,di2
shi4
gai4
duo1
shao3,shao4
le5,liao3,liao4
gong1
ji1
duo1
shao3,shao4


遇到的问题,在导出jar包的时候出了很多错误
主要问题出在: 如何读取jar包中的资源文件 这个可以参考我收藏的一篇文章




已有 0 人发表留言,猛击->>这里<<-参与讨论


ITeye推荐



posted on 2011-05-14 19:53 安多 阅读(264) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航:
 
 
Copyright © 安多 Powered by: 博客园 模板提供:沪江博客