ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

实用小技巧,Python一秒将全部中文姓名转为拼音!

2020-11-25 14:32:59  阅读:326  来源: 互联网

标签:拼音 Python pinyin pypinyin 如下 一秒 result capitalize


有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!

一、xpinyin

开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可

pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 

接着导入xpinyin下的 Pinyin 方法如下

from xpinyin import Pinyin 

首先试试中文名转拼音,

p = Pinyin() 
result1 = p.get_pinyin('叶伏天') 
result1 

结果如下:

'ye-fu-tian' 

tone_marks可以显示声调

result2 = p.get_pinyin('叶伏天', tone_marks='marks') 

结果如下:

'yè-fú-tiān' 

去掉空格

s = result1.split('-') 
result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize() 
result3 
 
结果如下: 
'Ye Futian' 

有时需要中文名转拼音首字母,也很简单

二、pypinyin

另一种方法是使用pypinyin,安装同样可以使用pip

# 安装 
pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 

直接导入就行

import pypinyin 

再来看看中文名转拼音的实现办法

result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL) 
result1 

结果如下:

[['ye'], ['ting'], ['yun']] 

启用多音节来实现声调

result2 = pypinyin.pinyin('叶庭云', heteronym=True) 
result2 

结果如下:

[['yè', 'xié'], ['tíng'], ['yún']] 

因为返回的是一个嵌套的list,所以需要简单调整一下

result_ = [i[0] for i in result1] 
result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() 
result3 

结果如下:

'Ye Tingyun' 

启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!

下面是中文名转拼音首字母的方法

三、snownlp

最后一种办法是使用snownlp,同样的pip安装与导入如下:

# 安装 
pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 
# 导入 
from snownlp import SnowNLP 

中文名转拼音

s = SnowNLP('叶庭云') 
s.pinyin 

结果如下:

['ye', 'ting', 'yun'] 

将list转为字符串

result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize() 
result4 

结果如下:

'Ye Tingyun' 

最后是中文名转拼音首字母

四、批量将中文名转换成拼音

现在,掌握了基本使用后,我们就能利用批量操作来解放双手

import pypinyin 
import pandas as pd 
 
df = pd.read_excel('学生名单_test.xls') 
df.head() 

先导入一份学生名单如下

下面是使用pypinyin批量将全部学生的中文姓名转换为拼音

pinyin_name = [] 
first_pinyin = [] 
for i in df['姓名']: 
    result = pypinyin.pinyin(i, style=pypinyin.NORMAL) 
    result_ = [i[0] for i in result] 
    result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() 
    result3 = ''.join([i[0].upper() for i in result_]) 
    print(result2, i, sep=' ') 
    pinyin_name.append(result2) 
    first_pinyin.append(result3) 
     
df['英文名'] = pinyin_name 
df['拼音首字母'] = first_pinyin 
df.head() 

或者是转换为拼音首字母,运行结果如下:

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

 

标签:拼音,Python,pinyin,pypinyin,如下,一秒,result,capitalize
来源: https://blog.csdn.net/pythonlaodi/article/details/110128527

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有