ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

学习pandas数据透视表

2020-02-20 15:06:11  阅读:371  来源: 互联网

标签:df 透视 df1 display 学习 pd pivot table pandas


1、excel中做数据透视表
1)步骤如下
① 选中整个数据源;

② 依次点击“插入”—“数据透视表”

③ 选择在Excel中的哪个位置,插入数据透视表

④ 然后根据实际需求,从不同维度展示结果

⑤ 结果如下

2、pandas中使用pivot_table()做数据透视表
1)语法格式
pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc=‘mean’,
margins=False,margins_name=‘All’,
dropna=True,fill_value=None)
1
2
3
4
2)对比excel,说明上述参数的具体含义

参数说明:

data 相当于Excel中的"选中数据源";
index 相当于上述"数据透视表字段"中的行;
columns 相当于上述"数据透视表字段"中的列;
values 相当于上述"数据透视表字段"中的值;
aggfunc 相当于上述"结果"中的计算类型;
margins 相当于上述"结果"中的总计;
margins_name 相当于修改"总计"名,为其它名称;
下面几个参数,用的较少,记住干嘛的,等以后需要就百度。

dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;
fill_value 表示将缺失值,用某个指定值填充。
3、案例说明
1)求出不同品牌下,每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

2)求出不同品牌下,每个地区、每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=[“销售区域”,“月份”],
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

3)求出不同品牌不同地区下,每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=[“品牌”,“销售区域”],columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

4)求出不同品牌下的“销售数量之和”与“货号计数”
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=[“销售数量”,“货号”],
aggfunc={“销售数量”:“sum”,“货号”:“count”},
margins=True,margins_name=“总计”)
display(df1)
1
2
3
4
5
6
7
8
9
10
11
结果如下:

————————————————
版权声明:本文为CSDN博主「Huang supreme」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_41261833/article/details/104371241

snow54678 发布了8 篇原创文章 · 获赞 0 · 访问量 161 私信 关注

标签:df,透视,df1,display,学习,pd,pivot,table,pandas
来源: https://blog.csdn.net/snow54678/article/details/104410622

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有