ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python处理excel-根据全称自动填写简称

2021-03-09 23:32:28  阅读:253  来源: 互联网

标签:表格 Python 全称 excel 简称 填写 data1


Python处理excel-根据全称自动填写简称 

在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理。

  1. 需求

  根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。

                                         

    2.脚本思路

  首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。

  然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。

    3.代码

# -*- coding: utf-8 -*-
"""
Created on Thu Mar  4 21:25:05 2021

@author: ruofei
"""

import pandas as pd


#填写待处理文件和对应关系的excel文件路径
#注意:脚本运行时需保证被使用excel文件处于关闭状态
file1 = r'待处理文件.xlsx'
file2 = r'对应关系.xlsx'


#填写待处理文件中  全称所在的列名和简称要放置的列名
qc1="供应商"
jc1="简称"

#填写对应关系中    全称所在的列数和简称所在的列数
qc2="全称"
jc2="简称"


#填写读取excel文件的sheet表名
sheet1="Sheet1"
sheet2="Sheet1"

#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)

#print("输出表格所有")
#print(data1)

row1 = data1.shape[0]#行数
col1=data1.shape[1]#列数

row2 = data2.shape[0]#行数
col2=data2.shape[1]#

#print("表格文件有"+str(row1)+"行,"+str(col1)+"列")

duiying=dict()

#生成对应关系的字典
for i in range(row2):
    
    quancheng=data2.loc[i,qc2]
    jiancheng=data2.loc[i,jc2]
    
    duiying[quancheng]=jiancheng
    
    
    #print(quancheng)

#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2))

for i in range(row1):
    
    a=data1.loc[i,qc1]
    #[qc1-1]
    #print(str(a))
    
    jiancheng=duiying.get(a)
    if a in duiying.keys():
     
        #print(jiancheng)
        data1.loc[i,jc1]=jiancheng 
    else:
        
        
        #此处修改没有简称赋予值,若赋予全称值则=a,若为空则="   "
        data1.loc[i,jc1]=a

data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')

    4.实现功能

  根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原样照填。

   5.存在问题

  在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。

 

 

标签:表格,Python,全称,excel,简称,填写,data1
来源: https://blog.csdn.net/qq_33169543/article/details/114605319

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有