`

java 汉字转换成拼音

阅读更多
Java代码

   1. /**
   2.  *
   3.  * @author MoXie SysTem128(at)GMail.Com
   4.  */ 
   5. public class SpellCnHelper { 
   6.  
   7.     private static int size = 7550; // (20319 - 10254) * 0.75 可以适当调小增加效率……调多小~自己算去~ 
   8.     private static String[] spellList = new String[size]; 
   9.     private static boolean isInited = false; 
  10.  
  11.  
  12.     static { 
  13.         if (!isInited) { 
  14.             initList(); 
  15.             isInited = true; 
  16.         } 
  17.  
  18.     } 
  19.  
  20.     /**
  21.      * 新增元
  22.      * @param key 
  23.      * @param value
  24.      */ 
  25.     private static void put(String key, String value) { 
  26.         if (key == null) { 
  27.             return; 
  28.         } 
  29.         int index = getIndex(key); 
  30.         spellList[index] = value; 
  31.     } 
  32.  
  33.     /**
  34.      * 获取元
  35.      * @param key
  36.      * @return
  37.      */ 
  38.     private static String get(int key) { 
  39.         return get(String.valueOf(key)); 
  40.     } 
  41.  
  42.     private static String get(String key) { 
  43.         String value = new String(); 
  44.         if (key == null) { 
  45.             return value; 
  46.         } 
  47.         int index = getIndex(key); 
  48.         /**
  49.          * 注释部分原用于寄存已未初始但已获取部分,由于效率不明显且占用内存所以删掉了。
  50.          */ 
  51. //        if (spellList[index] != null) { 
  52. //            value = spellList[index]; 
  53. //        } else { 
  54.         for (int i = index; i > 0; i--) { 
  55.             if (spellList[i] != null) { 
  56.                 value = spellList[i]; 
  57. //                    spellList[index] = value; 
  58.                 break; 
  59.             } 
  60.         } 
  61. //        } 
  62.         return value; 
  63.     } 
  64.  
  65.     /**
  66.      * 获取索引
  67.      * @param key
  68.      * @return
  69.      */ 
  70.     private static int getIndex(String key) { 
  71.         return (Integer.valueOf(key).intValue() % size) + size - 1; 
  72.     } 
  73.  
  74.     private static void initList() { 
  75.  
  76.         String[] keyList = new String[]{"-20319", "-20317", "-20304", "-20295", 
  77.             "-20292", "-20283", "-20265", "-20257", "-20242", "-20230", "-20051", 
  78.             "-20036", "-20032", "-20026", "-20002", "-19990", "-19986", "-19982", 
  79.             "-19976", "-19805", "-19784", "-19775", "-19774", "-19763", "-19756", 
  80.             "-19751", "-19746", "-19741", "-19739", "-19728", "-19725", "-19715", 
  81.             "-19540", "-19531", "-19525", "-19515", "-19500", "-19484", "-19479", 
  82.             "-19467", "-19289", "-19288", "-19281", "-19275", "-19270", "-19263", 
  83.             "-19261", "-19249", "-19243", "-19242", "-19238", "-19235", "-19227", 
  84.             "-19224", "-19218", "-19212", "-19038", "-19023", "-19018", "-19006", 
  85.             "-19003", "-18996", "-18977", "-18961", "-18952", "-18783", "-18774", 
  86.             "-18773", "-18763", "-18756", "-18741", "-18735", "-18731", "-18722", 
  87.             "-18710", "-18697", "-18696", "-18526", "-18518", "-18501", "-18490", 
  88.             "-18478", "-18463", "-18448", "-18447", "-18446", "-18239", "-18237", 
  89.             "-18231", "-18220", "-18211", "-18201", "-18184", "-18183", "-18181", 
  90.             "-18012", "-17997", "-17988", "-17970", "-17964", "-17961", "-17950", 
  91.             "-17947", "-17931", "-17928", "-17922", "-17759", "-17752", "-17733", 
  92.             "-17730", "-17721", "-17703", "-17701", "-17697", "-17692", "-17683", 
  93.             "-17676", "-17496", "-17487", "-17482", "-17468", "-17454", "-17433", 
  94.             "-17427", "-17417", "-17202", "-17185", "-16983", "-16970", "-16942", 
  95.             "-16915", "-16733", "-16708", "-16706", "-16689", "-16664", "-16657", 
  96.             "-16647", "-16474", "-16470", "-16465", "-16459", "-16452", "-16448", 
  97.             "-16433", "-16429", "-16427", "-16423", "-16419", "-16412", "-16407", 
  98.             "-16403", "-16401", "-16393", "-16220", "-16216", "-16212", "-16205", 
  99.             "-16202", "-16187", "-16180", "-16171", "-16169", "-16158", "-16155", 
100.             "-15959", "-15958", "-15944", "-15933", "-15920", "-15915", "-15903", 
101.             "-15889", "-15878", "-15707", "-15701", "-15681", "-15667", "-15661", 
102.             "-15659", "-15652", "-15640", "-15631", "-15625", "-15454", "-15448", 
103.             "-15436", "-15435", "-15419", "-15416", "-15408", "-15394", "-15385", 
104.             "-15377", "-15375", "-15369", "-15363", "-15362", "-15183", "-15180", 
105.             "-15165", "-15158", "-15153", "-15150", "-15149", "-15144", "-15143", 
106.             "-15141", "-15140", "-15139", "-15128", "-15121", "-15119", "-15117", 
107.             "-15110", "-15109", "-14941", "-14937", "-14933", "-14930", "-14929", 
108.             "-14928", "-14926", "-14922", "-14921", "-14914", "-14908", "-14902", 
109.             "-14894", "-14889", "-14882", "-14873", "-14871", "-14857", "-14678", 
110.             "-14674", "-14670", "-14668", "-14663", "-14654", "-14645", "-14630", 
111.             "-14594", "-14429", "-14407", "-14399", "-14384", "-14379", "-14368", 
112.             "-14355", "-14353", "-14345", "-14170", "-14159", "-14151", "-14149", 
113.             "-14145", "-14140", "-14137", "-14135", "-14125", "-14123", "-14122", 
114.             "-14112", "-14109", "-14099", "-14097", "-14094", "-14092", "-14090", 
115.             "-14087", "-14083", "-13917", "-13914", "-13910", "-13907", "-13906", 
116.             "-13905", "-13896", "-13894", "-13878", "-13870", "-13859", "-13847", 
117.             "-13831", "-13658", "-13611", "-13601", "-13406", "-13404", "-13400", 
118.             "-13398", "-13395", "-13391", "-13387", "-13383", "-13367", "-13359", 
119.             "-13356", "-13343", "-13340", "-13329", "-13326", "-13318", "-13147", 
120.             "-13138", "-13120", "-13107", "-13096", "-13095", "-13091", "-13076", 
121.             "-13068", "-13063", "-13060", "-12888", "-12875", "-12871", "-12860", 
122.             "-12858", "-12852", "-12849", "-12838", "-12831", "-12829", "-12812", 
123.             "-12802", "-12607", "-12597", "-12594", "-12585", "-12556", "-12359", 
124.             "-12346", "-12320", "-12300", "-12120", "-12099", "-12089", "-12074", 
125.             "-12067", "-12058", "-12039", "-11867", "-11861", "-11847", "-11831", 
126.             "-11798", "-11781", "-11604", "-11589", "-11536", "-11358", "-11340", 
127.             "-11339", "-11324", "-11303", "-11097", "-11077", "-11067", "-11055", 
128.             "-11052", "-11045", "-11041", "-11038", "-11024", "-11020", "-11019", 
129.             "-11018", "-11014", "-10838", "-10832", "-10815", "-10800", "-10790", 
130.             "-10780", "-10764", "-10587", "-10544", "-10533", "-10519", "-10331", 
131.             "-10329", "-10328", "-10322", "-10315", "-10309", "-10307", "-10296", 
132.             "-10281", "-10274", "-10270", "-10262", "-10260", "-10256", "-10254"}; 
133.         String[] valList = new String[]{"a", "ai", "an", "ang", "ao", "ba", "bai", 
134.             "ban", "bang", "bao", "bei", "ben", "beng", "bi", "bian", "biao", "bie", 
135.             "bin", "bing", "bo", "bu", "ca", "cai", "can", "cang", "cao", "ce", 
136.             "ceng", "cha", "chai", "chan", "chang", "chao", "che", "chen", "cheng", 
137.             "chi", "chong", "chou", "chu", "chuai", "chuan", "chuang", "chui", "chun", 
138.             "chuo", "ci", "cong", "cou", "cu", "cuan", "cui", "cun", "cuo", "da", 
139.             "dai", "dan", "dang", "dao", "de", "deng", "di", "dian", "diao", "die", 
140.             "ding", "diu", "dong", "dou", "du", "duan", "dui", "dun", "duo", "e", 
141.             "en", "er", "fa", "fan", "fang", "fei", "fen", "feng", "fo", "fou", 
142.             "fu", "ga", "gai", "gan", "gang", "gao", "ge", "gei", "gen", "geng", 
143.             "gong", "gou", "gu", "gua", "guai", "guan", "guang", "gui", "gun", 
144.             "guo", "ha", "hai", "han", "hang", "hao", "he", "hei", "hen", "heng", 
145.             "hong", "hou", "hu", "hua", "huai", "huan", "huang", "hui", "hun", 
146.             "huo", "ji", "jia", "jian", "jiang", "jiao", "jie", "jin", "jing", 
147.             "jiong", "jiu", "ju", "juan", "jue", "jun", "ka", "kai", "kan", 
148.             "kang", "kao", "ke", "ken", "keng", "kong", "kou", "ku", "kua", 
149.             "kuai", "kuan", "kuang", "kui", "kun", "kuo", "la", "lai", "lan", 
150.             "lang", "lao", "le", "lei", "leng", "li", "lia", "lian", "liang", 
151.             "liao", "lie", "lin", "ling", "liu", "long", "lou", "lu", "lv", 
152.             "luan", "lue", "lun", "luo", "ma", "mai", "man", "mang", "mao", 
153.             "me", "mei", "men", "meng", "mi", "mian", "miao", "mie", "min", 
154.             "ming", "miu", "mo", "mou", "mu", "na", "nai", "nan", "nang", 
155.             "nao", "ne", "nei", "nen", "neng", "ni", "nian", "niang", "niao", 
156.             "nie", "nin", "ning", "niu", "nong", "nu", "nv", "nuan", "nue", 
157.             "nuo", "o", "ou", "pa", "pai", "pan", "pang", "pao", "pei", "pen", 
158.             "peng", "pi", "pian", "piao", "pie", "pin", "ping", "po", "pu", "qi", 
159.             "qia", "qian", "qiang", "qiao", "qie", "qin", "qing", "qiong", "qiu", 
160.             "qu", "quan", "que", "qun", "ran", "rang", "rao", "re", "ren", "reng", 
161.             "ri", "rong", "rou", "ru", "ruan", "rui", "run", "ruo", "sa", "sai", 
162.             "san", "sang", "sao", "se", "sen", "seng", "sha", "shai", "shan", 
163.             "shang", "shao", "she", "shen", "sheng", "shi", "shou", "shu", "shua", 
164.             "shuai", "shuan", "shuang", "shui", "shun", "shuo", "si", "song", "sou", 
165.             "su", "suan", "sui", "sun", "suo", "ta", "tai", "tan", "tang", "tao", 
166.             "te", "teng", "ti", "tian", "tiao", "tie", "ting", "tong", "tou", "tu", 
167.             "tuan", "tui", "tun", "tuo", "wa", "wai", "wan", "wang", "wei", "wen", 
168.             "weng", "wo", "wu", "xi", "xia", "xian", "xiang", "xiao", "xie", "xin", 
169.             "xing", "xiong", "xiu", "xu", "xuan", "xue", "xun", "ya", "yan", "yang", 
170.             "yao", "ye", "yi", "yin", "ying", "yo", "yong", "you", "yu", "yuan", 
171.             "yue", "yun", "za", "zai", "zan", "zang", "zao", "ze", "zei", "zen", 
172.             "zeng", "zha", "zhai", "zhan", "zhang", "zhao", "zhe", "zhen", "zheng", 
173.             "zhi", "zhong", "zhou", "zhu", "zhua", "zhuai", "zhuan", "zhuang", 
174.             "zhui", "zhun", "zhuo", "zi", "zong", "zou", "zu", "zuan", "zui", 
175.             "zun", "zuo"}; 
176.         for (int i = 0; i < valList.length; i++) { 
177.             put(keyList[i], valList[i]); 
178.         } 
179.     } 
180.  
181.     /**
182.      * 和网上流传的其他版本一样
183.      * 
184.      * @param cn
185.      * @return
186.      */ 
187.     private static int getAscii(char cn) { 
188.         byte[] bytes = (String.valueOf(cn)).getBytes(); 
189.         if (bytes == null || bytes.length > 2 || bytes.length <= 0) { //错误 
190.             return 0; 
191.         } 
192.         if (bytes.length == 1) { 
193.             return bytes[0]; 
194.         } 
195.  
196.         if (bytes.length == 2) { 
197.             int hightByte = 256 + bytes[0]; 
198.             int lowByte = 256 + bytes[1]; 
199.             int ascii = (256 * hightByte + lowByte) - 256 * 256; 
200.             return ascii; 
201.         } 
202.  
203.         return 0; 
204.     } 
205.  
206.     /**
207.      * 和网上流传的其他版本一样
208.      *
209.      * @param ascii
210.      * @return
211.      */ 
212.     private static String getSpellByAscii(int ascii) { 
213.         if (ascii > 0 && ascii < 160) { //单字符 
214.             return String.valueOf((char) ascii); 
215.         } 
216.  
217.         if (ascii < -20319 || ascii > -10247) { //不知道的字符 
218.             return null; 
219.         } 
220.  
221.         return get(ascii); 
222.     } 
223.  
224.     /**
225.      * 和网上流传的其他版本一样
226.      *
227.      * @param ascii
228.      * @return
229.      */ 
230.     public static String getSpell( 
231.             String cnStr) { 
232.         if (null == cnStr || "".equals(cnStr.trim())) { 
233.             return cnStr; 
234.         } 
235.         char[] chars = cnStr.toCharArray(); 
236.         StringBuffer resultBf = new StringBuffer(); 
237.         for (int i = 0, Len = chars.length; i < 
238.                 Len; i++) { 
239.             int ascii = getAscii(chars[i]); 
240.             if (ascii == 0) { //取ascii时出错 
241.                 resultBf.append(chars[i]); 
242.             } else { 
243.                 String spell = getSpellByAscii(ascii); 
244.                 if (spell == null) { 
245.                     resultBf.append(chars[i]); 
246.                 } else { 
247.                     resultBf.append(spell); 
248.                 } // end of if spell == null 
249.  
250.             } // end of if ascii <= -20400 
251.         } // end of for 
252.  
253.         return resultBf.toString(); 
254.     } 
255. } 


Java代码

   1. import junit.framework.TestCase; 
   2.  
   3. /**
   4.  *
   5.  * @author MoXie SysTem128(at)GMail.Com
   6.  */ 
   7. public class SpellCnHelperTest extends TestCase { 
   8.  
   9.     public SpellCnHelperTest(String testName) { 
  10.         super(testName); 
  11.     } 
  12.  
  13.     /**
  14.      * Test of main method, of class SpellCnHelper.
  15.      * 正式使用时注意替换未转译字符
  16.      * 例如生成url时可以替换非 字母数字下划线减号 为 减号或下划线
  17.      */ 
  18.     public void testMain() { 
  19.         String str = null; 
  20.         str = 
  21.                 "赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜戚谢邹喻柏水"; 
  22. //                "窦章云苏潘葛奚范彭郎鲁韦昌马苗凤花方俞任袁柳酆鲍史唐费廉岑薛雷贺倪汤滕殷罗" + 
  23. //                "毕郝邬安常乐于时傅皮卞齐康伍余元卜顾孟平黄和穆萧尹姚邵湛汪祁毛禹狄米贝明臧" + 
  24. //                "计伏成戴谈宋茅庞熊纪舒屈项祝董梁杜阮蓝闵席季麻强贾路娄危江童颜郭梅盛林刁钟" + 
  25. //                "徐邱骆高夏蔡田樊胡凌霍虞万支柯昝管卢莫柯房裘缪干解应宗丁宣贲邓郁单杭洪包诸" + 
  26. //                "左石崔吉钮龚程嵇邢滑裴陆荣翁荀羊于惠甄曲家封芮羿储靳汲邴糜松井段富巫乌焦巴" + 
  27. //                "弓牧隗山谷车侯宓蓬全郗班仰秋仲伊宫宁仇栾暴甘钭历戎祖武符刘景詹束龙叶幸司韶" + 
  28. //                "郜黎蓟溥印宿白怀蒲邰从鄂索咸籍赖卓蔺屠蒙池乔阳郁胥能苍双闻莘党翟谭贡劳逄姬" + 
  29. //                "申扶堵冉宰郦雍却璩桑桂濮牛寿通边扈燕冀浦尚农温别庄晏柴瞿阎充慕连茹习宦艾鱼" + 
  30. //                "容向古易慎戈廖庾终暨居衡步都耿满弘匡国文寇广禄阙东欧殳沃利蔚越夔隆师巩厍聂" + 
  31. //                "晁勾敖融冷訾辛阚那简饶空曾毋沙乜养鞠须丰巢关蒯相查后荆红游竺权逮盍益桓公万" + 
  32. //                "俟司马上官欧阳夏侯诸葛闻人东方赫连皇甫尉迟公羊澹台公冶宗政濮阳淳于单于太叔" + 
  33. //                "申屠公孙仲孙轩辕令狐徐离宇文长孙慕容司徒司空"; 
  34. //        StringBuffer sb = new StringBuffer(); 
  35. //        for (int j = 0; j < 20; j++) { 
  36. //            sb.append(str); 
  37. //        } 
  38. //        str = sb.toString(); 
  39.         System.out.println(str.length()); 
  40.         long start = System.currentTimeMillis(); 
  41.         long i = 0L; 
  42.         do { 
  43.             i++; 
  44.             SpellCnHelper.getSpell(str); 
  45.         } while (i < 10000L); 
  46.         System.out.println("Spell=" + SpellCnHelper.getSpell(str)); 
  47.         System.out.println(System.currentTimeMillis() - start); 
  48.     /**
  49.      * 1 672ms
  50.      * 2 750ms
  51.      * 3 750ms
  52.      * 4 703ms
  53.      * 5 734ms
  54.      */ 
  55.     } 
  56. } 
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics