空间站

北极心空

  BlogJava :: 首页 :: 联系 :: 聚合  :: 管理
  15 Posts :: 393 Stories :: 160 Comments :: 0 Trackbacks

Java实现汉字转换为拼音

import  java.util.Iterator;
import  java.util.LinkedHashMap;
import  java.util.Set;

/**
 *
 汉字转化为全拼
 *
 JDK版本: 1.4
*/
public   class  CnToSpell {
    
private   static  LinkedHashMap spellMap  =   null ;

    
static  {
        
if  (spellMap  ==   null ) {
            spellMap 
=   new  LinkedHashMap( 400 );
        }
        initialize();
        System.out.println(
" Chinese transfer Spell Done. " );
    }

    
private  CnToSpell() {
    }

    
private   static   void  spellPut(String spell,  int  ascii) {
        spellMap.put(spell, 
new  Integer(ascii));
    }

    
private   static   void  initialize() {
        spellPut(
" a " - 20319 );
        spellPut(
" ai " - 20317 );
        spellPut(
" an " - 20304 );
        spellPut(
" ang " - 20295 );
        spellPut(
" ao " - 20292 );
        spellPut(
" ba " - 20283 );
        spellPut(
" bai " - 20265 );
        spellPut(
" ban " - 20257 );
        spellPut(
" bang " - 20242 );
        spellPut(
" bao " - 20230 );
        spellPut(
" bei " - 20051 );
        spellPut(
" ben " - 20036 );
        spellPut(
" beng " - 20032 );
        spellPut(
" bi " - 20026 );
        spellPut(
" bian " - 20002 );
        spellPut(
" biao " - 19990 );
        spellPut(
" bie " - 19986 );
        spellPut(
" bin " - 19982 );
        spellPut(
" bing " - 19976 );
        spellPut(
" bo " - 19805 );
        spellPut(
" bu " - 19784 );
        spellPut(
" ca " - 19775 );
        spellPut(
" cai " - 19774 );
        spellPut(
" can " - 19763 );
        spellPut(
" cang " - 19756 );
        spellPut(
" cao " - 19751 );
        spellPut(
" ce " - 19746 );
        spellPut(
" ceng " - 19741 );
        spellPut(
" cha " - 19739 );
        spellPut(
" chai " - 19728 );
        spellPut(
" chan " - 19725 );
        spellPut(
" chang " - 19715 );
        spellPut(
" chao " - 19540 );
        spellPut(
" che " - 19531 );
        spellPut(
" chen " - 19525 );
        spellPut(
" cheng " - 19515 );
        spellPut(
" chi " - 19500 );
        spellPut(
" chong " - 19484 );
        spellPut(
" chou " - 19479 );
        spellPut(
" chu " - 19467 );
        spellPut(
" chuai " - 19289 );
        spellPut(
" chuan " - 19288 );
        spellPut(
" chuang " - 19281 );
        spellPut(
" chui " - 19275 );
        spellPut(
" chun " - 19270 );
        spellPut(
" chuo " - 19263 );
        spellPut(
" ci " - 19261 );
        spellPut(
" cong " - 19249 );
        spellPut(
" cou " - 19243 );
        spellPut(
" cu " - 19242 );
        spellPut(
" cuan " - 19238 );
        spellPut(
" cui " - 19235 );
        spellPut(
" cun " - 19227 );
        spellPut(
" cuo " - 19224 );
        spellPut(
" da " - 19218 );
        spellPut(
" dai " - 19212 );
        spellPut(
" dan " - 19038 );
        spellPut(
" dang " - 19023 );
        spellPut(
" dao " - 19018 );
        spellPut(
" de " - 19006 );
        spellPut(
" deng " - 19003 );
        spellPut(
" di " - 18996 );
        spellPut(
" dian " - 18977 );
        spellPut(
" diao " - 18961 );
        spellPut(
" die " - 18952 );
        spellPut(
" ding " - 18783 );
        spellPut(
" diu " - 18774 );
        spellPut(
" dong " - 18773 );
        spellPut(
" dou " - 18763 );
        spellPut(
" du " - 18756 );
        spellPut(
" duan " - 18741 );
        spellPut(
" dui " - 18735 );
        spellPut(
" dun " - 18731 );
        spellPut(
" duo " - 18722 );
        spellPut(
" e " - 18710 );
        spellPut(
" en " - 18697 );
        spellPut(
" er " - 18696 );
        spellPut(
" fa " - 18526 );
        spellPut(
" fan " - 18518 );
        spellPut(
" fang " - 18501 );
        spellPut(
" fei " - 18490 );
        spellPut(
" fen " - 18478 );
        spellPut(
" feng " - 18463 );
        spellPut(
" fo " - 18448 );
        spellPut(
" fou " - 18447 );
        spellPut(
" fu " - 18446 );
        spellPut(
" ga " - 18239 );
        spellPut(
" gai " - 18237 );
        spellPut(
" gan " - 18231 );
        spellPut(
" gang " - 18220 );
        spellPut(
" gao " - 18211 );
        spellPut(
" ge " - 18201 );
        spellPut(
" gei " - 18184 );
        spellPut(
" gen " - 18183 );
        spellPut(
" geng " - 18181 );
        spellPut(
" gong " - 18012 );
        spellPut(
" gou " - 17997 );
        spellPut(
" gu " - 17988 );
        spellPut(
" gua " - 17970 );
        spellPut(
" guai " - 17964 );
        spellPut(
" guan " - 17961 );
        spellPut(
" guang " - 17950 );
        spellPut(
" gui " - 17947 );
        spellPut(
" gun " - 17931 );
        spellPut(
" guo " - 17928 );
        spellPut(
" ha " - 17922 );
        spellPut(
" hai " - 17759 );
        spellPut(
" han " - 17752 );
        spellPut(
" hang " - 17733 );
        spellPut(
" hao " - 17730 );
        spellPut(
" he " - 17721 );
        spellPut(
" hei " - 17703 );
        spellPut(
" hen " - 17701 );
        spellPut(
" heng " - 17697 );
        spellPut(
" hong " - 17692 );
        spellPut(
" hou " - 17683 );
        spellPut(
" hu " - 17676 );
        spellPut(
" hua " - 17496 );
        spellPut(
" huai " - 17487 );
        spellPut(
" huan " - 17482 );
        spellPut(
" huang " - 17468 );
        spellPut(
" hui " - 17454 );
        spellPut(
" hun " - 17433 );
        spellPut(
" huo " - 17427 );
        spellPut(
" ji " - 17417 );
        spellPut(
" jia " - 17202 );
        spellPut(
" jian " - 17185 );
        spellPut(
" jiang " - 16983 );
        spellPut(
" jiao " - 16970 );
        spellPut(
" jie " - 16942 );
        spellPut(
" jin " - 16915 );
        spellPut(
" jing " - 16733 );
        spellPut(
" jiong " - 16708 );
        spellPut(
" jiu " - 16706 );
        spellPut(
" ju " - 16689 );
        spellPut(
" juan " - 16664 );
        spellPut(
" jue " - 16657 );
        spellPut(
" jun " - 16647 );
        spellPut(
" ka " - 16474 );
        spellPut(
" kai " - 16470 );
        spellPut(
" kan " - 16465 );
        spellPut(
" kang " - 16459 );
        spellPut(
" kao " - 16452 );
        spellPut(
" ke " - 16448 );
        spellPut(
" ken " - 16433 );
        spellPut(
" keng " - 16429 );
        spellPut(
" kong " - 16427 );
        spellPut(
" kou " - 16423 );
        spellPut(
" ku " - 16419 );
        spellPut(
" kua " - 16412 );
        spellPut(
" kuai " - 16407 );
        spellPut(
" kuan " - 16403 );
        spellPut(
" kuang " - 16401 );
        spellPut(
" kui " - 16393 );
        spellPut(
" kun " - 16220 );
        spellPut(
" kuo " - 16216 );
        spellPut(
" la " - 16212 );
        spellPut(
" lai " - 16205 );
        spellPut(
" lan " - 16202 );
        spellPut(
" lang " - 16187 );
        spellPut(
" lao " - 16180 );
        spellPut(
" le " - 16171 );
        spellPut(
" lei " - 16169 );
        spellPut(
" leng " - 16158 );
        spellPut(
" li " - 16155 );
        spellPut(
" lia " - 15959 );
        spellPut(
" lian " - 15958 );
        spellPut(
" liang " - 15944 );
        spellPut(
" liao " - 15933 );
        spellPut(
" lie " - 15920 );
        spellPut(
" lin " - 15915 );
        spellPut(
" ling " - 15903 );
        spellPut(
" liu " - 15889 );
        spellPut(
" long " - 15878 );
        spellPut(
" lou " - 15707 );
        spellPut(
" lu " - 15701 );
        spellPut(
" lv " - 15681 );
        spellPut(
" luan " - 15667 );
        spellPut(
" lue " - 15661 );
        spellPut(
" lun " - 15659 );
        spellPut(
" luo " - 15652 );
        spellPut(
" ma " - 15640 );
        spellPut(
" mai " - 15631 );
        spellPut(
" man " - 15625 );
        spellPut(
" mang " - 15454 );
        spellPut(
" mao " - 15448 );
        spellPut(
" me " - 15436 );
        spellPut(
" mei " - 15435 );
        spellPut(
" men " - 15419 );
        spellPut(
" meng " - 15416 );
        spellPut(
" mi " - 15408 );
        spellPut(
" mian " - 15394 );
        spellPut(
" miao " - 15385 );
        spellPut(
" mie " - 15377 );
        spellPut(
" min " - 15375 );
        spellPut(
" ming " - 15369 );
        spellPut(
" miu " - 15363 );
        spellPut(
" mo " - 15362 );
        spellPut(
" mou " - 15183 );
        spellPut(
" mu " - 15180 );
        spellPut(
" na " - 15165 );
        spellPut(
" nai " - 15158 );
        spellPut(
" nan " - 15153 );
        spellPut(
" nang " - 15150 );
        spellPut(
" nao " - 15149 );
        spellPut(
" ne " - 15144 );
        spellPut(
" nei " - 15143 );
        spellPut(
" nen " - 15141 );
        spellPut(
" neng " - 15140 );
        spellPut(
" ni " - 15139 );
        spellPut(
" nian " - 15128 );
        spellPut(
" niang " - 15121 );
        spellPut(
" niao " - 15119 );
        spellPut(
" nie " - 15117 );
        spellPut(
" nin " - 15110 );
        spellPut(
" ning " - 15109 );
        spellPut(
" niu " - 14941 );
        spellPut(
" nong " - 14937 );
        spellPut(
" nu " - 14933 );
        spellPut(
" nv " - 14930 );
        spellPut(
" nuan " - 14929 );
        spellPut(
" nue " - 14928 );
        spellPut(
" nuo " - 14926 );
        spellPut(
" o " - 14922 );
        spellPut(
" ou " - 14921 );
        spellPut(
" pa " - 14914 );
        spellPut(
" pai " - 14908 );
        spellPut(
" pan " - 14902 );
        spellPut(
" pang " - 14894 );
        spellPut(
" pao " - 14889 );
        spellPut(
" pei " - 14882 );
        spellPut(
" pen " - 14873 );
        spellPut(
" peng " - 14871 );
        spellPut(
" pi " - 14857 );
        spellPut(
" pian " - 14678 );
        spellPut(
" piao " - 14674 );
        spellPut(
" pie " - 14670 );
        spellPut(
" pin " - 14668 );
        spellPut(
" ping " - 14663 );
        spellPut(
" po " - 14654 );
        spellPut(
" pu " - 14645 );
        spellPut(
" qi " - 14630 );
        spellPut(
" qia " - 14594 );
        spellPut(
" qian " - 14429 );
        spellPut(
" qiang " - 14407 );
        spellPut(
" qiao " - 14399 );
        spellPut(
" qie " - 14384 );
        spellPut(
" qin " - 14379 );
        spellPut(
" qing " - 14368 );
        spellPut(
" qiong " - 14355 );
        spellPut(
" qiu " - 14353 );
        spellPut(
" qu " - 14345 );
        spellPut(
" quan " - 14170 );
        spellPut(
" que " - 14159 );
        spellPut(
" qun " - 14151 );
        spellPut(
" ran " - 14149 );
        spellPut(
" rang " - 14145 );
        spellPut(
" rao " - 14140 );
        spellPut(
" re " - 14137 );
        spellPut(
" ren " - 14135 );
        spellPut(
" reng " - 14125 );
        spellPut(
" ri " - 14123 );
        spellPut(
" rong " - 14122 );
        spellPut(
" rou " - 14112 );
        spellPut(
" ru " - 14109 );
        spellPut(
" ruan " - 14099 );
        spellPut(
" rui " - 14097 );
        spellPut(
" run " - 14094 );
        spellPut(
" ruo " - 14092 );
        spellPut(
" sa " - 14090 );
        spellPut(
" sai " - 14087 );
        spellPut(
" san " - 14083 );
        spellPut(
" sang " - 13917 );
        spellPut(
" sao " - 13914 );
        spellPut(
" se " - 13910 );
        spellPut(
" sen " - 13907 );
        spellPut(
" seng " - 13906 );
        spellPut(
" sha " - 13905 );
        spellPut(
" shai " - 13896 );
        spellPut(
" shan " - 13894 );
        spellPut(
" shang " - 13878 );
        spellPut(
" shao " - 13870 );
        spellPut(
" she " - 13859 );
        spellPut(
" shen " - 13847 );
        spellPut(
" sheng " - 13831 );
        spellPut(
" shi " - 13658 );
        spellPut(
" shou " - 13611 );
        spellPut(
" shu " - 13601 );
        spellPut(
" shua " - 13406 );
        spellPut(
" shuai " - 13404 );
        spellPut(
" shuan " - 13400 );
        spellPut(
" shuang " - 13398 );
        spellPut(
" shui " - 13395 );
        spellPut(
" shun " - 13391 );
        spellPut(
" shuo " - 13387 );
        spellPut(
" si " - 13383 );
        spellPut(
" song " - 13367 );
        spellPut(
" sou " - 13359 );
        spellPut(
" su " - 13356 );
        spellPut(
" suan " - 13343 );
        spellPut(
" sui " - 13340 );
        spellPut(
" sun " - 13329 );
        spellPut(
" suo " - 13326 );
        spellPut(
" ta " - 13318 );
        spellPut(
" tai " - 13147 );
        spellPut(
" tan " - 13138 );
        spellPut(
" tang " - 13120 );
        spellPut(
" tao " - 13107 );
        spellPut(
" te " - 13096 );
        spellPut(
" teng " - 13095 );
        spellPut(
" ti " - 13091 );
        spellPut(
" tian " - 13076 );
        spellPut(
" tiao " - 13068 );
        spellPut(
" tie " - 13063 );
        spellPut(
" ting " - 13060 );
        spellPut(
" tong " - 12888 );
        spellPut(
" tou " - 12875 );
        spellPut(
" tu " - 12871 );
        spellPut(
" tuan " - 12860 );
        spellPut(
" tui " - 12858 );
        spellPut(
" tun " - 12852 );
        spellPut(
" tuo " - 12849 );
        spellPut(
" wa " - 12838 );
        spellPut(
" wai " - 12831 );
        spellPut(
" wan " - 12829 );
        spellPut(
" wang " - 12812 );
        spellPut(
" wei " - 12802 );
        spellPut(
" wen " - 12607 );
        spellPut(
" weng " - 12597 );
        spellPut(
" wo " - 12594 );
        spellPut(
" wu " - 12585 );
        spellPut(
" xi " - 12556 );
        spellPut(
" xia " - 12359 );
        spellPut(
" xian " - 12346 );
        spellPut(
" xiang " - 12320 );
        spellPut(
" xiao " - 12300 );
        spellPut(
" xie " - 12120 );
        spellPut(
" xin " - 12099 );
        spellPut(
" xing " - 12089 );
        spellPut(
" xiong " - 12074 );
        spellPut(
" xiu " - 12067 );
        spellPut(
" xu " - 12058 );
        spellPut(
" xuan " - 12039 );
        spellPut(
" xue " - 11867 );
        spellPut(
" xun " - 11861 );
        spellPut(
" ya " - 11847 );
        spellPut(
" yan " - 11831 );
        spellPut(
" yang " - 11798 );
        spellPut(
" yao " - 11781 );
        spellPut(
" ye " - 11604 );
        spellPut(
" yi " - 11589 );
        spellPut(
" yin " - 11536 );
        spellPut(
" ying " - 11358 );
        spellPut(
" yo " - 11340 );
        spellPut(
" yong " - 11339 );
        spellPut(
" you " - 11324 );
        spellPut(
" yu " - 11303 );
        spellPut(
" yuan " - 11097 );
        spellPut(
" yue " - 11077 );
        spellPut(
" yun " - 11067 );
        spellPut(
" za " - 11055 );
        spellPut(
" zai " - 11052 );
        spellPut(
" zan " - 11045 );
        spellPut(
" zang " - 11041 );
        spellPut(
" zao " - 11038 );
        spellPut(
" ze " - 11024 );
        spellPut(
" zei " - 11020 );
        spellPut(
" zen " - 11019 );
        spellPut(
" zeng " - 11018 );
        spellPut(
" zha " - 11014 );
        spellPut(
" zhai " - 10838 );
        spellPut(
" zhan " - 10832 );
        spellPut(
" zhang " - 10815 );
        spellPut(
" zhao " - 10800 );
        spellPut(
" zhe " - 10790 );
        spellPut(
" zhen " - 10780 );
        spellPut(
" zheng " - 10764 );
        spellPut(
" zhi " - 10587 );
        spellPut(
" zhong " - 10544 );
        spellPut(
" zhou " - 10533 );
        spellPut(
" zhu " - 10519 );
        spellPut(
" zhua " - 10331 );
        spellPut(
" zhuai " - 10329 );
        spellPut(
" zhuan " - 10328 );
        spellPut(
" zhuang " - 10322 );
        spellPut(
" zhui " - 10315 );
        spellPut(
" zhun " - 10309 );
        spellPut(
" zhuo " - 10307 );
        spellPut(
" zi " - 10296 );
        spellPut(
" zong " - 10281 );
        spellPut(
" zou " - 10274 );
        spellPut(
" zu " - 10270 );
        spellPut(
" zuan " - 10262 );
        spellPut(
" zui " - 10260 );
        spellPut(
" zun " - 10256 );
        spellPut(
" zuo " - 10254 );
    }

    
/**
     * 获得单个汉字的Ascii.
     * 
@param  cn char
     * 汉字字符
     * 
@return  int
     * 错误返回 0,否则返回ascii
     
*/
    
public   static   int  getCnAscii( char  cn) {
        
byte [] bytes  =  (String.valueOf(cn)).getBytes();
        
if  (bytes  ==   null   ||  bytes.length  >   2   ||  bytes.length  <=   0 ) {  // 错误
             return   0 ;
        }
        
if  (bytes.length  ==   1 ) {  // 英文字符
             return  bytes[ 0 ];
        }
        
if  (bytes.length  ==   2 ) {  // 中文字符
             int  hightByte  =   256   +  bytes[ 0 ];
            
int  lowByte  =   256   +  bytes[ 1 ];

            
int  ascii  =  ( 256   *  hightByte  +  lowByte)  -   256   *   256 ;

// System.out.println("ASCII=" + ascii);

            
return  ascii;
        }

        
return   0 // 错误
    }

    
/**
     * 根据ASCII码到SpellMap中查找对应的拼音
     * 
@param  ascii int
     * 字符对应的ASCII
     * 
@return  String
     * 拼音,首先判断ASCII是否>0&<160,如果是返回对应的字符,
     *
     否则到SpellMap中查找,如果没有找到拼音,则返回null,如果找到则返回拼音.
     
*/
    
public   static  String getSpellByAscii( int  ascii) {
        
if  (ascii  >   0   &&  ascii  <   160 ) {  // 单字符
             return  String.valueOf(( char ) ascii);
        }

        
if  (ascii  <   - 20319   ||  ascii  >   - 10247 ) {  // 不知道的字符
             return   null ;
        }

        Set keySet 
=  spellMap.keySet();
        Iterator it 
=  keySet.iterator();

        String spell0 
=   null ; ;
        String spell 
=   null ;

        
int  asciiRang0  =   - 20319 ;
        
int  asciiRang;
        
while  (it.hasNext()) {

            spell 
=  (String) it.next();
            Object valObj 
=  spellMap.get(spell);
            
if  (valObj  instanceof  Integer) {
                asciiRang 
=  ((Integer) valObj).intValue();

                
if  (ascii  >=  asciiRang0  &&  ascii  <  asciiRang) {  // 区间找到
                     return  (spell0  ==   null ?  spell : spell0;
                } 
else  {
                    spell0 
=  spell;
                    asciiRang0 
=  asciiRang;
                }
            }
        }

        
return   null ;

    }

    
/**
     * 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换
     * 
@param  cnStr String
     * 字符串
     * 
@return  String
     * 转换成全拼后的字符串
     
*/
    
public   static  String getFullSpell(String cnStr) {
        
if  ( null   ==  cnStr  ||   "" .equals(cnStr.trim())) {
            
return  cnStr;
        }

        
char [] chars  =  cnStr.toCharArray();
        StringBuffer retuBuf 
=   new  StringBuffer();
        
for  ( int  i  =   0 , Len  =  chars.length; i  <  Len; i ++ ) {
            
int  ascii  =  getCnAscii(chars[i]);
            
if  (ascii  ==   0 ) {  // 取ascii时出错
                retuBuf.append(chars[i]);
            } 
else  {
                String spell 
=  getSpellByAscii(ascii);
                
if  (spell  ==   null ) {
                    retuBuf.append(chars[i]);
                } 
else  {
                    retuBuf.append(spell);
                } 
//  end of if spell == null
            }  //  end of if ascii <= -20400
        }  //  end of for

        
return  retuBuf.toString();
    }

    
public   static  String getFirstSpell(String cnStr) {
        
return   null ;
    }

    
public   static   void  main(String[] args) {
        String str 
=   null ;
        str 
=   " 小红帽 " ;
        System.out.println(
" Spell= "   +  CnToSpell.getFullSpell(str));  }
}
posted on 2006-11-02 12:11 芦苇 阅读(7706) 评论(12)  编辑  收藏

Feedback

# re: Java实现汉字转换为拼音 2006-11-24 15:06 芦苇
JAVA将汉字转化成拼音的方法
/** *//**
#############################################################################
# DESCRIBE 将汉字转化成拼音
# DATE 2006-7-12
# COMPANY FLX
# PORJECT JAVA
#############################################################################
*/
import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.Set;

public class CnToSpell ...{
private static LinkedHashMap spellMap = null;

static ...{
if (spellMap == null) ...{
spellMap = new LinkedHashMap(400);
}
initialize();
System.out.println("Chinese transfer Spell Done.");
}

private CnToSpell() ...{
}

/** *//**
* 获得单个汉字的Ascii.
* @param cn char
* 汉字字符
* @return int
* 错误返回 0,否则返回ascii
*/
public static int getCnAscii(char cn) ...{
byte[] bytes = (String.valueOf(cn)).getBytes();
if (bytes == null || bytes.length > 2 || bytes.length <= 0) ...{ //错误
return 0;
}
if (bytes.length == 1) ...{ //英文字符
return bytes[0];
}
if (bytes.length == 2) ...{ //中文字符
int hightByte = 256 + bytes[0];
int lowByte = 256 + bytes[1];
int ascii = (256 * hightByte + lowByte) - 256 * 256;
return ascii;
}
return 0; //错误
}

/** *//**
* 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换
* @param cnStr String
* 字符串
* @return String
* 转换成全拼后的字符串
*/
public static String getFullSpell(String cnStr) ...{
if (null == cnStr || "".equals(cnStr.trim())) ...{
return cnStr;
}

char[] chars = cnStr.toCharArray();
StringBuffer retuBuf = new StringBuffer();
for (int i = 0, Len = chars.length; i < Len; i++) ...{
int ascii = getCnAscii(chars[i]);
if (ascii == 0) ...{ //取ascii时出错
retuBuf.append(chars[i]);
} else ...{
String spell = getSpellByAscii(ascii);
if (spell == null) ...{
retuBuf.append(chars[i]);
} else ...{
retuBuf.append(spell);
} // end of if spell == null
} // end of if ascii <= -20400
} // end of for

return retuBuf.toString();
}

/** *//**
* 根据ASCII码到SpellMap中查找对应的拼音
* @param ascii int
* 字符对应的ASCII
* @return String
* 拼音,首先判断ASCII是否>0&<160,如果是返回对应的字符,
*
否则到SpellMap中查找,如果没有找到拼音,则返回null,如果找到则返回拼音.
*/
public static String getSpellByAscii(int ascii) ...{
if (ascii > 0 && ascii < 160) ...{ //单字符
return String.valueOf((char) ascii);
}

if (ascii < -20319 || ascii > -10247) ...{ //不知道的字符
return null;
}

Set keySet = spellMap.keySet();
Iterator it = keySet.iterator();

String spell0 = null;
;
String spell = null;

int asciiRang0 = -20319;
int asciiRang;
while (it.hasNext()) ...{

spell = (String) it.next();
Object valObj = spellMap.get(spell);
if (valObj instanceof Integer) ...{
asciiRang = ((Integer) valObj).intValue();

if (ascii >= asciiRang0 && ascii < asciiRang) ...{ //区间找到
return (spell0 == null) ? spell : spell0;
} else ...{
spell0 = spell;
asciiRang0 = asciiRang;
}
}
}

return null;

}

private static void initialize() ...{
spellPut("a", -20319);
spellPut("ai", -20317);
spellPut("an", -20304);
spellPut("ang", -20295);
spellPut("ao", -20292);
spellPut("ba", -20283);
spellPut("bai", -20265);
spellPut("ban", -20257);
spellPut("bang", -20242);
spellPut("bao", -20230);
spellPut("bei", -20051);
spellPut("ben", -20036);
spellPut("beng", -20032);
spellPut("bi", -20026);
spellPut("bian", -20002);
spellPut("biao", -19990);
spellPut("bie", -19986);
spellPut("bin", -19982);
spellPut("bing", -19976);
spellPut("bo", -19805);
spellPut("bu", -19784);
spellPut("ca", -19775);
spellPut("cai", -19774);
spellPut("can", -19763);
spellPut("cang", -19756);
spellPut("cao", -19751);
spellPut("ce", -19746);
spellPut("ceng", -19741);
spellPut("cha", -19739);
spellPut("chai", -19728);
spellPut("chan", -19725);
spellPut("chang", -19715);
spellPut("chao", -19540);
spellPut("che", -19531);
spellPut("chen", -19525);
spellPut("cheng", -19515);
spellPut("chi", -19500);
spellPut("chong", -19484);
spellPut("chou", -19479);
spellPut("chu", -19467);
spellPut("chuai", -19289);
spellPut("chuan", -19288);
spellPut("chuang", -19281);
spellPut("chui", -19275);
spellPut("chun", -19270);
spellPut("chuo", -19263);
spellPut("ci", -19261);
spellPut("cong", -19249);
spellPut("cou", -19243);
spellPut("cu", -19242);
spellPut("cuan", -19238);
spellPut("cui", -19235);
spellPut("cun", -19227);
spellPut("cuo", -19224);
spellPut("da", -19218);
spellPut("dai", -19212);
spellPut("dan", -19038);
spellPut("dang", -19023);
spellPut("dao", -19018);
spellPut("de", -19006);
spellPut("deng", -19003);
spellPut("di", -18996);
spellPut("dian", -18977);
spellPut("diao", -18961);
spellPut("die", -18952);
spellPut("ding", -18783);
spellPut("diu", -18774);
spellPut("dong", -18773);
spellPut("dou", -18763);
spellPut("du", -18756);
spellPut("duan", -18741);
spellPut("dui", -18735);
spellPut("dun", -18731);
spellPut("duo", -18722);
spellPut("e", -18710);
spellPut("en", -18697);
spellPut("er", -18696);
spellPut("fa", -18526);
spellPut("fan", -18518);
spellPut("fang", -18501);
spellPut("fei", -18490);
spellPut("fen", -18478);
spellPut("feng", -18463);
spellPut("fo", -18448);
spellPut("fou", -18447);
spellPut("fu", -18446);
spellPut("ga", -18239);
spellPut("gai", -18237);
spellPut("gan", -18231);
spellPut("gang", -18220);
spellPut("gao", -18211);
spellPut("ge", -18201);
spellPut("gei", -18184);
spellPut("gen", -18183);
spellPut("geng", -18181);
spellPut("gong", -18012);
spellPut("gou", -17997);
spellPut("gu", -17988);
spellPut("gua", -17970);
spellPut("guai", -17964);
spellPut("guan", -17961);
spellPut("guang", -17950);
spellPut("gui", -17947);
spellPut("gun", -17931);
spellPut("guo", -17928);
spellPut("ha", -17922);
spellPut("hai", -17759);
spellPut("han", -17752);
spellPut("hang", -17733);
spellPut("hao", -17730);
spellPut("he", -17721);
spellPut("hei", -17703);
spellPut("hen", -17701);
spellPut("heng", -17697);
spellPut("hong", -17692);
spellPut("hou", -17683);
spellPut("hu", -17676);
spellPut("hua", -17496);
spellPut("huai", -17487);
spellPut("huan", -17482);
spellPut("huang", -17468);
spellPut("hui", -17454);
spellPut("hun", -17433);
spellPut("huo", -17427);
spellPut("ji", -17417);
spellPut("jia", -17202);
spellPut("jian", -17185);
spellPut("jiang", -16983);
spellPut("jiao", -16970);
spellPut("jie", -16942);
spellPut("jin", -16915);
spellPut("jing", -16733);
spellPut("jiong", -16708);
spellPut("jiu", -16706);
spellPut("ju", -16689);
spellPut("juan", -16664);
spellPut("jue", -16657);
spellPut("jun", -16647);
spellPut("ka", -16474);
spellPut("kai", -16470);
spellPut("kan", -16465);
spellPut("kang", -16459);
spellPut("kao", -16452);
spellPut("ke", -16448);
spellPut("ken", -16433);
spellPut("keng", -16429);
spellPut("kong", -16427);
spellPut("kou", -16423);
spellPut("ku", -16419);
spellPut("kua", -16412);
spellPut("kuai", -16407);
spellPut("kuan", -16403);
spellPut("kuang", -16401);
spellPut("kui", -16393);
spellPut("kun", -16220);
spellPut("kuo", -16216);
spellPut("la", -16212);
spellPut("lai", -16205);
spellPut("lan", -16202);
spellPut("lang", -16187);
spellPut("lao", -16180);
spellPut("le", -16171);
spellPut("lei", -16169);
spellPut("leng", -16158);
spellPut("li", -16155);
spellPut("lia", -15959);
spellPut("lian", -15958);
spellPut("liang", -15944);
spellPut("liao", -15933);
spellPut("lie", -15920);
spellPut("lin", -15915);
spellPut("ling", -15903);
spellPut("liu", -15889);
spellPut("long", -15878);
spellPut("lou", -15707);
spellPut("lu", -15701);
spellPut("lv", -15681);
spellPut("luan", -15667);
spellPut("lue", -15661);
spellPut("lun", -15659);
spellPut("luo", -15652);
spellPut("ma", -15640);
spellPut("mai", -15631);
spellPut("man", -15625);
spellPut("mang", -15454);
spellPut("mao", -15448);
spellPut("me", -15436);
spellPut("mei", -15435);
spellPut("men", -15419);
spellPut("meng", -15416);
spellPut("mi", -15408);
spellPut("mian", -15394);
spellPut("miao", -15385);
spellPut("mie", -15377);
spellPut("min", -15375);
spellPut("ming", -15369);
spellPut("miu", -15363);
spellPut("mo", -15362);
spellPut("mou", -15183);
spellPut("mu", -15180);
spellPut("na", -15165);
spellPut("nai", -15158);
spellPut("nan", -15153);
spellPut("nang", -15150);
spellPut("nao", -15149);
spellPut("ne", -15144);
spellPut("nei", -15143);
spellPut("nen", -15141);
spellPut("neng", -15140);
spellPut("ni", -15139);
spellPut("nian", -15128);
spellPut("niang", -15121);
spellPut("niao", -15119);
spellPut("nie", -15117);
spellPut("nin", -15110);
spellPut("ning", -15109);
spellPut("niu", -14941);
spellPut("nong", -14937);
spellPut("nu", -14933);
spellPut("nv", -14930);
spellPut("nuan", -14929);
spellPut("nue", -14928);
spellPut("nuo", -14926);
spellPut("o", -14922);
spellPut("ou", -14921);
spellPut("pa", -14914);
spellPut("pai", -14908);
spellPut("pan", -14902);
spellPut("pang", -14894);
spellPut("pao", -14889);
spellPut("pei", -14882);
spellPut("pen", -14873);
spellPut("peng", -14871);
spellPut("pi", -14857);
spellPut("pian", -14678);
spellPut("piao", -14674);
spellPut("pie", -14670);
spellPut("pin", -14668);
spellPut("ping", -14663);
spellPut("po", -14654);
spellPut("pu", -14645);
spellPut("qi", -14630);
spellPut("qia", -14594);
spellPut("qian", -14429);
spellPut("qiang", -14407);
spellPut("qiao", -14399);
spellPut("qie", -14384);
spellPut("qin", -14379);
spellPut("qing", -14368);
spellPut("qiong", -14355);
spellPut("qiu", -14353);
spellPut("qu", -14345);
spellPut("quan", -14170);
spellPut("que", -14159);
spellPut("qun", -14151);
spellPut("ran", -14149);
spellPut("rang", -14145);
spellPut("rao", -14140);
spellPut("re", -14137);
spellPut("ren", -14135);
spellPut("reng", -14125);
spellPut("ri", -14123);
spellPut("rong", -14122);
spellPut("rou", -14112);
spellPut("ru", -14109);
spellPut("ruan", -14099);
spellPut("rui", -14097);
spellPut("run", -14094);
spellPut("ruo", -14092);
spellPut("sa", -14090);
spellPut("sai", -14087);
spellPut("san", -14083);
spellPut("sang", -13917);
spellPut("sao", -13914);
spellPut("se", -13910);
spellPut("sen", -13907);
spellPut("seng", -13906);
spellPut("sha", -13905);
spellPut("shai", -13896);
spellPut("shan", -13894);
spellPut("shang", -13878);
spellPut("shao", -13870);
spellPut("she", -13859);
spellPut("shen", -13847);
spellPut("sheng", -13831);
spellPut("shi", -13658);
spellPut("shou", -13611);
spellPut("shu", -13601);
spellPut("shua", -13406);
spellPut("shuai", -13404);
spellPut("shuan", -13400);
spellPut("shuang", -13398);
spellPut("shui", -13395);
spellPut("shun", -13391);
spellPut("shuo", -13387);
spellPut("si", -13383);
spellPut("song", -13367);
spellPut("sou", -13359);
spellPut("su", -13356);
spellPut("suan", -13343);
spellPut("sui", -13340);
spellPut("sun", -13329);
spellPut("suo", -13326);
spellPut("ta", -13318);
spellPut("tai", -13147);
spellPut("tan", -13138);
spellPut("tang", -13120);
spellPut("tao", -13107);
spellPut("te", -13096);
spellPut("teng", -13095);
spellPut("ti", -13091);
spellPut("tian", -13076);
spellPut("tiao", -13068);
spellPut("tie", -13063);
spellPut("ting", -13060);
spellPut("tong", -12888);
spellPut("tou", -12875);
spellPut("tu", -12871);
spellPut("tuan", -12860);
spellPut("tui", -12858);
spellPut("tun", -12852);
spellPut("tuo", -12849);
spellPut("wa", -12838);
spellPut("wai", -12831);
spellPut("wan", -12829);
spellPut("wang", -12812);
spellPut("wei", -12802);
spellPut("wen", -12607);
spellPut("weng", -12597);
spellPut("wo", -12594);
spellPut("wu", -12585);
spellPut("xi", -12556);
spellPut("xia", -12359);
spellPut("xian", -12346);
spellPut("xiang", -12320);
spellPut("xiao", -12300);
spellPut("xie", -12120);
spellPut("xin", -12099);
spellPut("xing", -12089);
spellPut("xiong", -12074);
spellPut("xiu", -12067);
spellPut("xu", -12058);
spellPut("xuan", -12039);
spellPut("xue", -11867);
spellPut("xun", -11861);
spellPut("ya", -11847);
spellPut("yan", -11831);
spellPut("yang", -11798);
spellPut("yao", -11781);
spellPut("ye", -11604);
spellPut("yi", -11589);
spellPut("yin", -11536);
spellPut("ying", -11358);
spellPut("yo", -11340);
spellPut("yong", -11339);
spellPut("you", -11324);
spellPut("yu", -11303);
spellPut("yuan", -11097);
spellPut("yue", -11077);
spellPut("yun", -11067);
spellPut("za", -11055);
spellPut("zai", -11052);
spellPut("zan", -11045);
spellPut("zang", -11041);
spellPut("zao", -11038);
spellPut("ze", -11024);
spellPut("zei", -11020);
spellPut("zen", -11019);
spellPut("zeng", -11018);
spellPut("zha", -11014);
spellPut("zhai", -10838);
spellPut("zhan", -10832);
spellPut("zhang", -10815);
spellPut("zhao", -10800);
spellPut("zhe", -10790);
spellPut("zhen", -10780);
spellPut("zheng", -10764);
spellPut("zhi", -10587);
spellPut("zhong", -10544);
spellPut("zhou", -10533);
spellPut("zhu", -10519);
spellPut("zhua", -10331);
spellPut("zhuai", -10329);
spellPut("zhuan", -10328);
spellPut("zhuang", -10322);
spellPut("zhui", -10315);
spellPut("zhun", -10309);
spellPut("zhuo", -10307);
spellPut("zi", -10296);
spellPut("zong", -10281);
spellPut("zou", -10274);
spellPut("zu", -10270);
spellPut("zuan", -10262);
spellPut("zui", -10260);
spellPut("zun", -10256);
spellPut("zuo", -10254);
}

public static void main(String[] args) ...{
String str = null;
str = "谢海101普降喜雨";
System.out.println("Spell=" + CnToSpell.getFullSpell(str));

str = "张牙舞爪》。,";
System.out.println("Spell=" + CnToSpell.getFullSpell(str));

str = "啦啦,可耻下场。";
System.out.println("Spell=" + CnToSpell.getFullSpell(str));

str = "猪油,猪八戒。";
System.out.println("Spell=" + CnToSpell.getFullSpell(str));
}

private static void spellPut(String spell, int ascii) ...{
spellMap.put(spell, new Integer(ascii));
}
}  回复  更多评论
  

# re: Java实现汉字转换为拼音 2006-11-24 15:08 芦苇
根据汉字得到拼音的类库(三)
/// <summary>

/// 存放排好序的汉字-拼音对照字典,格式如下

/// 汉han

/// 字zi

/// 既汉字作为字典的Key,拼音作为value

/// </summary>

private SortedDictionary<Char, string> mSortDiction = new SortedDictionary<Char, string>() ;



private static SpellLib _Instance ;



/// <summary>

/// 取汉字拼音类的实例

/// </summary>

/// <returns></returns>

public static SpellLib Instance()

{

if (_Instance == null)

_Instance = new SpellLib();

return _Instance;

}



/// <summary>

/// 构造函数

/// </summary>

private SpellLib()

{

BuildSortDiction();

}



#region 提供的方法

/// <summary>

/// 把给定的字转化为拼音

/// </summary>

/// <param name="word">要转化的字</param>

/// <returns>字的拼音</returns>

/// <example>

/// string strCode = SpellLib.Instance().GetCodesByWord('字');

/// </example>

/// <remarks>如果该字不存在拼音,就返回该字本身</remarks>

public string GetCodeByWord(Char word)

{

if (mSortDiction.ContainsKey(word))

return mSortDiction[word];

else

return word.ToString();

}

/// <summary>

/// 取得字符串第一个字的拼音

/// </summary>

/// <param name="word">要转化的字符串</param>

/// <returns>字的拼音</returns>

/// <example>

/// string strCode = SpellLib.Instance().GetCodesByWord("汉字");

/// </example>

/// <remarks>如果第一个字不存在拼音,就返回该字本身</remarks>

public string GetCodeByWord(string word)

{

if (word == null)

throw new ArgumentNullException("word");



if (word.Length > 0)

return GetCodeByWord(word[0]);

else

return null;

}

/// <summary>

/// 取得一个字符串中所有字的拼音

/// </summary>

/// <param name="sentence"></param>

/// <returns></returns>

public string GetCodesByWord(string sentence)

{

if (sentence == null)

throw new ArgumentNullException("sentence");



bool blAddSpace = false;

StringBuilder sbResult = new StringBuilder();



foreach (Char chr in sentence)

{

string strCodes = GetCodeByWord(chr) ;



if (strCodes.Length > 1)

{

if (blAddSpace == false)

{

sbResult.Append(" ");

}

sbResult.Append(strCodes);

sbResult.Append(" ");

blAddSpace = true;

}

else

{

sbResult.Append(strCodes);

blAddSpace = false;

}

}

return sbResult.ToString();

}

/// <summary>

/// 构造排序字典对象

/// </summary>

private void BuildSortDiction()

{

// mSortDiction.

for (int i = 0; i < this.WordList.Length; i++)

{

string value = this.CodeList[i];

string strWord = WordList[i];



foreach (char key in strWord)

{

if (mSortDiction.ContainsKey(key))

{

continue;

}

else

{

mSortDiction.Add(key, value);

}

}//end foreach



}//end for

}

/// <summary>

/// 取得给定拼音的声母

/// </summary>

/// <param name="spell">拼音</param>

/// <returns>声母</returns>

/// <remarks>如果不存在声母就返回第一个字母,如啊返回a,嗯返回e</remarks>

public static string GetVoicePart(string spell)

{

string strVoicePart = null;

if (spell.Length == 1)

{

strVoicePart = spell;

}

else

{



char firstChr = spell[0];

char SecondChr = spell[1];

strVoicePart = firstChr.ToString();

if (SecondChr.Equals('h') || SecondChr.Equals('H'))

strVoicePart += "h";



switch (strVoicePart.ToLower(System.Globalization.CultureInfo.CurrentCulture))

{

case "b":

case "p":

case "m":

case "f":

case "d":

case "t":

case "n":

case "l":

case "g":

case "k":

case "h":

case "j":

case "q":

case "x":

case "r":

case "z":

case "c":

case "s":

case "zh":

case "ch":

case "sh":

break;

default:

strVoicePart = firstChr.ToString();

break;

}//end switch

}

return strVoicePart;

}

/// <summary>

/// 取得给定汉字的声母部分

/// </summary>

/// <param name="word"></param>

/// <returns></returns>

/// <example>

/// string strVoicePart = SpellLib.Instance().GetCodeOfVoicePart("字");

/// </example>

/// <remarks>如果不存在声母就返回第一个字母,如啊返回a,嗯返回e</remarks>

public string GetCodeOfVoicePart(string word)

{

return GetVoicePart(this.GetCodeByWord(word));

}

/// <summary>

/// 取得给定汉字的声母部分

/// </summary>

/// <param name="word"></param>

/// <returns></returns>

/// <remarks>如果不存在声母就返回第一个字母,如啊返回a,嗯返回e</remarks>

public string GetCodeOfVoicePart(Char word)

{

return GetVoicePart(this.GetCodeByWord(word));

}

#endregion



}//end class



}//end namespace




Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=605219
  回复  更多评论
  

# re: Java实现汉字转换为拼音 2006-11-24 15:09 芦苇
c#的汉字转拼音
/// <summary>
/// 获取一串汉字的拼音声母
/// </summary>
/// <param name="chinese">Unicode格式的汉字字符串</param>
/// <returns>拼音声母字符串</returns>
public static String Convert(String chinese)
{
char[] buffer = new char[chinese.Length];
for(int i=0; i<chinese.Length; i++)
{
buffer[i] = Convert(chinese[i]);
}
return new String(buffer);
}

/// <summary>
/// 获取一个汉字的拼音声母
/// </summary>
/// <param name="chinese">Unicode格式的一个汉字</param>
/// <returns>汉字的声母</returns>
public static char Convert(Char chinese)
{
Encoding gb2312 = Encoding.GetEncoding("GB2312");
Encoding unicode = Encoding.Unicode;

// Convert the string into a byte[].
byte[] unicodeBytes = unicode.GetBytes(new Char[] {chinese});
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, gb2312, unicodeBytes);

// 计算该汉字的GB-2312编码
int n = (int)asciiBytes[0]<<8;
n += (int)asciiBytes[1];

// 根据汉字区域码获取拼音声母
if (In(0xB0A1,0xB0C4,n)) return 'a';
if (In(0XB0C5,0XB2C0,n)) return 'b';
if (In(0xB2C1,0xB4ED,n)) return 'c';
if (In(0xB4EE,0xB6E9,n)) return 'd';
if (In(0xB6EA,0xB7A1,n)) return 'e';
if (In(0xB7A2,0xB8c0,n)) return 'f';
if (In(0xB8C1,0xB9FD,n)) return 'g';
if (In(0xB9FE,0xBBF6,n)) return 'h';
if (In(0xBBF7,0xBFA5,n)) return 'j';
if (In(0xBFA6,0xC0AB,n)) return 'k';
if (In(0xC0AC,0xC2E7,n)) return 'l';
if (In(0xC2E8,0xC4C2,n)) return 'm';
if (In(0xC4C3,0xC5B5,n)) return 'n';
if (In(0xC5B6,0xC5BD,n)) return 'o';
if (In(0xC5BE,0xC6D9,n)) return 'p';
if (In(0xC6DA,0xC8BA,n)) return 'q';
if (In(0xC8BB,0xC8F5,n)) return 'r';
if (In(0xC8F6,0xCBF0,n)) return 's';
if (In(0xCBFA,0xCDD9,n)) return 't';
if (In(0xCDDA,0xCEF3,n)) return 'w';
if (In(0xCEF4,0xD188,n)) return 'x';
if (In(0xD1B9,0xD4D0,n)) return 'y';
if (In(0xD4D1,0xD7F9,n)) return 'z';
return '\0';
}

private static bool In(int Lp, int Hp, int Value)
{
return ((Value<=Hp)&&(Value>=Lp));
}

转帖自7707(kingfisher)




Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=815541

  回复  更多评论
  

# re: Java实现汉字转换为拼音[未登录] 2007-11-15 19:40 allen
转 “做” 试试看?  回复  更多评论
  

# re: Java实现汉字转换为拼音 2007-11-28 19:43 防撒旦法
清远同学  回复  更多评论
  

# re: Java实现汉字转换为拼音 2007-11-29 22:31 fdsa
坚强的太久好疲惫,想在爱的人怀里,静静的睡……我爱着你是寂静的,遥远而且忧伤……  回复  更多评论
  

# re: Java实现汉字转换为拼音 2007-12-02 17:36 sdd
想回到过去  回复  更多评论
  

# re: Java实现汉字转换为拼音[未登录] 2007-12-07 00:57 ANDY
忘不了你 卓  回复  更多评论
  

# re: Java实现汉字转换为英文 2007-12-08 16:12 陈海洋
陈海洋  回复  更多评论
  

# re: Java实现汉字转换为拼音 2007-12-15 02:30 王刚
音乐
  回复  更多评论
  

# re: Java实现汉字转换为拼音 2007-12-15 02:30 王刚
音乐  回复  更多评论
  

# 哈尔滨实现汉字转换为拼音 2008-07-21 19:45 夏雨
转换字  回复  更多评论
  


只有注册用户登录后才能发表评论。


网站导航: