ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python将中文数字转化成阿拉伯数字

2021-03-10 11:58:19  阅读:254  来源: 互联网

标签:中文数字 一二三四五 python 阿拉伯数字 time1 NUM str new


python将中文数字转化成阿拉伯数字

正则表达式提取文本中的数字

这里演示一下文本中提取中文年份

import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字

提取年份如:‘1949’, ‘1990’, ‘1996’
这里给出许多正则表达式的样例:example

中文转化成阿拉伯数字

创建一个字典然后讲数字进项匹配:

CN_NUM = {
    '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
    '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}

for i in range(len(time1)):
    new_str = ''
    for j in time1[i]:
        new_str +=  str(CN_NUM[j])
    time1[i] = new_str
time1

这样结果就出来啦,成功将上文例子中文年份转化成阿拉伯数字:‘1949’, ‘1990’, ‘1996’

完整代码

# 2、将句子中年份的大写数字改为阿拉伯数字
import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
CN_NUM = {
    '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
    '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}

for i in range(len(time1)):
    new_str = ''
    for j in time1[i]:
        new_str +=  str(CN_NUM[j])
    time1[i] = new_str
time1

标签:中文数字,一二三四五,python,阿拉伯数字,time1,NUM,str,new
来源: https://blog.csdn.net/qq_45458674/article/details/114631853

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有