大家好,欢迎来到Crossin的编程教室!
有时在处理文件时候,我们需要将中文汉字转换为拼音或者拼音首字母的需求;还有的时候,我们需要对汉字进行按拼音字母排序(汉字的默认排序是编码序而非拼音序)。针对类似的转换需求,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!一、xpinyin
开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可?pipinstallxpinyin-i/simple--trusted-
接着导入xpinyin下的 Pinyin 方法如下fromxpinyinimportPinyin
首先试试中文名转拼音,p=Pinyin()
result1=p.get_pinyin('叶伏天')
result1
结果如下:'ye-fu-tian'
tone_marks可以显示声调result2=p.get_pinyin('叶伏天',tone_marks='marks')
结果如下:'yè-fú-tiān'
去掉空格?s=result1.split('-')
result3=s[0].capitalize()+''+''.join(s[1:]).capitalize()
result3
结果如下:
'YeFutian'
有时需要中文名转拼音首字母,也很简单?
二、pypinyin
另一种方法是使用pypinyin,安装同样可以使用pip#安装
pipinstallpypinyin-i/simple--trusted-
直接导入就行?importpypinyin
再来看看中文名转拼音的实现办法result1=pypinyin.pinyin('叶庭云',style=pypinyin.NORMAL)
result1
结果如下:[['ye'],['ting'],['yun']]
启用多音节来实现声调result2=pypinyin.pinyin('叶庭云',heteronym=True)
result2
结果如下:[['yè','xié'],['tíng'],['yún']]
因为返回的是一个嵌套的list,所以需要简单调整一下result_=[i[0]foriinresult1]
result3=result_[0].capitalize()+''+''.join(result_[1:]).capitalize()
result3
结果如下:'YeTingyun'
启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!
下面是中文名转拼音首字母的方法
三、snownlp
最后一种办法是使用snownlp,同样的pip安装与导入如下:#安装
pipinstallsnownlp-i/simple--trusted-
#导入
fromsnownlpimportSnowNLP
中文名转拼音?s=SnowNLP('叶庭云')
s.pinyin
结果如下:['ye','ting','yun']
将list转为字符串result4=s.pinyin[0].capitalize()+''+''.join(s.pinyin[1:]).capitalize()
result4
结果如下:'YeTingyun'
最后是中文名转拼音首字母