热门回答:
这个问题还挺不好回答的。因为不知道题主的意图。也不清楚是否要考虑多音字的问题。可能是我想多了。在这里我就给一个利用GB2312编码表查询拼音首字母的方案。
GB2312编码
GB2312编码共收录汉字6763个。其中一级汉字3755个。二级汉字3008个。另外还有682个全角字符。其中。一级汉字是按照拼音字母的顺序排列的。可直接用编码查询拼音首字母。不过。二级汉字是按照偏旁部首排列的。没法查。这部分汉字只能自己做一份对照表了。
一级汉字查询
根据GB2312编码规则。可按下表查询。
1601-1636 a
1637-1832 b
1833-2077 c
2078-2274 d
……(略)
百度一下可以找到完整的编码表。
二级汉字
这三千多个字只能自己做表了。我有一个暗黑的方法。就是找到拼音输入法的数据表。整理一下拿来用。这个方法有可能涉及到版权问题。我就不细说了。
Javascript的限制
Javascript是在浏览器上执行的。携带一份巨大的对照表可能严重影响网页的下载速度。建议只对应一级汉字。另外。JS没有编码转换函数。应尽量避免编码转换。实在不能避免的话。只能自己写转换函数了。网上虽有不少例子。都不是很可靠。要有个别编码存在转换错误的觉悟。
算法的考虑
如果携带二级汉字对照表。则需要考虑提高查询速度。二叉树算法是个不错的选择。
您还感兴趣的文章推荐以上就是由互联网推广工程师 网创网 整理编辑的,如果觉得有帮助欢迎收藏转发~
本文标题:如何用java、javascript和python获取中文的拼音首字母?
本文地址:https://www.wangchuang8.com/258446.html,转载请说明来源于:网创推广网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系进行处理。分享目的仅供大家学习与参考,不代表本站立场。
本文地址:https://www.wangchuang8.com/258446.html,转载请说明来源于:网创推广网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系进行处理。分享目的仅供大家学习与参考,不代表本站立场。
评论(2)
汉字,码表,对照表,全角,算法,函数,拼音,首字母,多音字,是个
没想到大家都对如何用java、javascript和python获取中文的拼音首字母?感兴趣,不过这这篇解答确实也是太好了
这个问题还挺不好回答的。因为不知道题主的意图。也不清楚是否要考虑多音字的问题。可能是我想多了。在这里我就给一个利用GB2