ICode9

精准搜索请尝试: 精确搜索
  • 1.准备工作——Pandas官方文档学习2022-05-27 02:00:34

    0. 前言 2022年5月,再次提起勇气来开始学习pandas。下面是后面我认为可能需要的 知识储备: 自带明确的需求 SQL 数据库 python 学习资源: 官方文档: pandas documentation — pandas 1.4.2 documentation 中文翻译: Pandas 中文 1. 安装 环境:Vscode+Pyhton3.

  • pandas美化excel高亮某行2022-05-25 15:34:40

    代码 from pathlib import Path import pandas as pd import datetime # 精简报告内容 today = datetime.date.today() df = pd.read_excel('/Users/soymilk/Documents/records.xlsx') df_beautiful = pd.DataFrame() df_beautiful['功能点'] = df['NUMBER&#

  • pandas2022-05-23 22:03:25

    pandas 数据去重:pd.Series(list(s)).unique() ,或者set() DataFrame取行、列:数字、名称两种索引方式 取行 df[2:6] df[:3] 名字:df.loc[“A”]、df.loc[“A”:"D"]、df.loc[[“A”,"D"]] 数字:df.iloc[1]、df.iloc[1:3]、df.iloc[[1,3]] 取列 df[[2,4,6] df.loc[:,"Y"]、df.loc[:,&quo

  • 使用Pandas进行Excel读写2022-05-23 21:01:09

    Excel读写(Pandas) 1、Series 一维数据,一列带索引 pandas.Series(data, index, dtype, name, copy) 一组数据、索引、数据类型、设置名称、拷贝数据(默认为False) import pandas as pd a = ["Go", "Python", "C#"] myvar = pd.Series(a) #指定索引 myvar2 = pd.Series(a, index = [&qu

  • Pandas 与 CSV2022-05-23 18:04:00

    import pandas as pd DataFrame 与 CSV 相互转换 #读取 CSV 文件 df = pd.read_csv('./nba.csv') print(df) # 此时仅显示前五行和后五行 print(df.to_string()) # 此方法会显示表中所有行 # 将 DataFrame 保存为 CSV 文件 gradeList = { 'Students' : [

  • Pandas 数据清洗之处理空值2022-05-23 18:02:53

    本文参考自菜鸟教程。 数据清洗是对一些没有用的数据进行处理的过程。 即处理数据集中数据缺失、数据格式错误、错误数据或重复数据的情况。 import pandas as pd df = pd.read_csv('./property-data.csv') print(df.to_string()) print(df.info()) 清洗空值 检查空值----isnull

  • Pandas的使用2022-05-21 21:32:48

    在数据分析工作中,Pandas 的使用频率是很高的,一方面是因为 Pandas 提供的基础数据结构 DataFrame 与 json 的契合度很高,转换起来很方便。另一方面,如果日常的数据清理工作不是很复杂的话,通常用几句 Pandas 代码就可以对数据进行规整。 基本数据结构 Series 和 DataFrame是pandas的两

  • pandas:聚合统计、数据分箱、分组可视化2022-05-21 18:02:59

    1、聚合统计 1.1描述统计 #df.describe(),对数据的总体特征进行描述 df.groupby('team').describe() df.groupby('team').describe().T #列数太多,进行转置 1.2统计函数 #对分组对象直接使用统计函数,分组内数据进行计算,返回df形式的数据 #计算平均数 df.groupby('

  • Python数据科学手册-Pandas:数值运算方法2022-05-18 23:33:10

    Numpy 的基本能力之一是快速对每个元素进行运算 Pandas 继承了Numpy的功能,也实现了一些高效技巧。 对于1元运算,(函数,三角函数)保留索引和列标签 对于2元运算,(加法,乘法),Pandas 会自动对齐索引进行计算。 通用函数:保留索引 对ser对象或 df对象使用Numpy通用函数,生成的结果是另一个保

  • ML第6周学习小结2022-05-14 20:00:51

    本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第六章:Pandas分组聚合 6.1概述 6.2分组 6.3分组对象的操作

  • pandas tricks2022-05-14 01:03:34

    # Check for equality# 创建DataFramedf = pd.DataFrame({'a':[10, 40, np.nan], 'b':[10, 40, np.nan]})print('data:\n', df)print()# 查看a列与b列是否相同print('df.a == df.b:')print(df.a == df.b)print()# 查看两个空值是否相同,返回Falseprint(

  • pandas csv reference2022-05-10 21:05:08

    https://blog.csdn.net/asdfgh0077/article/details/106947477/ https://blog.csdn.net/u010665216/article/details/78559091 https://www.csdn.net/tags/MtTaMg1sMTc1ODI3LWJsb2cO0O0O.html https://www.pythonheidong.com/blog/article/472551/34bd354bebf3d91551da/ https

  • 7、Spark SQL2022-05-10 13:00:07

    1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 spark产生:为了替代Mapreduce,解决Mapreduce计算短板     随着Spark的发展,Shark对于Hive的太多依赖(如采用Hive的语法解析器、查询优化器等等),制约了Spark的One Stack Rule Them All的既定方针,制约了Spark各个组件的相互集

  • python及pandas怎么检测空值即nan值2022-05-10 09:02:14

    引言:在输出处理与分析中,往往会遇到空值的情况,影响我们的数据处理结果,那么怎么检测和处理空值呢,本文先介绍三种检测单个空值的方法 一、单个空值的检测 1.使用python自带的math模块的内置方法 for i in df['B1'].values: if isnan(i): print(True) 2.使用numpy的isnan(

  • Python_pandas处理数据格式和统计频次2022-05-09 18:34:43

    Pandas 数据处理 Pandas 数据预处理--格式问题 知识点说明 读入和写出 结构化数据--处理-清洗-变换 enumerate zip sorted reversed import numpy as np Numpy -- ndarray --数组计算框架 np.array -- 向量化运算 数组的切片、数组子集-视图--对视图的修改会影响到

  • ML第5周学习小结2022-05-07 14:03:36

    本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第五章:Pandas高级操作的两个内容 数据迭代 函数应用

  • 【Pandas vs SQL】数据分析代码逐行比对,孰优孰劣?2022-05-04 05:31:06

    在数据分析领域,pandas是python数据分析基础工具,SQL是数据库最常用分析语言。二者有相通的地方,也有很大的语法不同,做起数据分析来,谁将更胜一筹呢? 做过业务开发、跟数据库打交道比较多的小伙伴,经常会提到”增删改查“操作,分别对应数据的增加、删除、修改、查询,这4个操作。 下面,我将

  • pandas子集选取的三种方法:[]、.loc[]、.iloc[]2022-05-03 20:34:46

    pandas读取Excel、csv文件中的数据时,得到的大多是表格型的二维数据,在pandas中对应的即为DataFrame数据结构。在处理这类数据时,往往要根据据需求先获取数据中的子集,如某些列、某些行、行列交叉的部分等。可以说子集选取是一个非常基础、频繁使用的操作,而DataFrame的子集选取看似简

  • Pandas 对数值进行分箱操作的4种方法总结对比2022-05-03 11:00:49

    分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。 我们创建以下合成数据用于演示 import pandas as pd # version 1.3.5 import numpy as np def

  • python:pandas中dataframe的基本用法汇总2022-05-03 00:05:03

    更加详细的内容可以查看:https://blog.csdn.net/hhtnan/article/details/80080240 (基本函数整理) 一.  DataFrame的创建 创建一个空的dataframe  df=pd.DataFrame(columns={"a":"","b":"","c":""},index=[0]) out: a c b 0

  • ML第4周学习小结2022-05-01 10:31:06

    本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第五章:Pandas高级操作的两个内容 添加修改数据 高级过滤

  • Pandas:添加修改、高级过滤2022-04-30 16:00:44

    1、添加修改数据 Pandas 的数据修改是进行赋值,先把要修改的数据筛选出来,然后将同结构或者可解包的数据赋值给它: 修改数值 df.Q1 = [1, 3, 5, 7, 9] * 20 # 就会把值进行修改 df.loc[1:3, 'Q1':'Q2'] = 99 # 这个范围的数据会全变成 99 df.loc[df.name=='Arry', 'Q1':'Q4'] =

  • Python将数据库的数据导出为Excel2022-04-29 10:33:59

    本文使用pandas来获取数据库的数据并生成Excel表格,以下用PostgreSQL数据库为例 安装第三方库 pip3 install sqlalchemy psycopg2 pandas openpyxl 数据库中有student数据表,如下 id name age sex 1 Tony 18 male 2 Jane 16 female 3 Jack 15 male 导出excel表的代码

  • pandas:字典转dataframe的注意事项2022-04-25 18:01:19

    推荐写法 参考链接 https://blog.csdn.net/u013061183/article/details/79497254

  • Pandas复杂查询、数据类型转换、数据排序2022-04-23 21:00:16

    Pandas高级操作 1、复杂查询 (1)逻辑运算 以DataFrame其中一列进行逻辑计算,会产生一个对应的bool值组成的Series 于是我们可以利用返回的bool列表进行一系列的数据查询 (2)逻辑筛选数据 df[df['Q1'] == 8] # Q1 等于8 df[~(df['Q1'] == 8)] # 不等于8

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有