ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python数据预处理

2019-10-26 13:39:55  阅读:239  来源: 互联网

标签:删除 python 数据 dropna 缺失 ## csv data 预处理


  1. #1.处理缺失数据
  2. ##识别出数据中的缺失值:以逗号分隔符(csv)文件为例
    
import pandas as pd
csv_data=pd.read_csv('./data/mydata.csv')
print(csv_data)

在这里插入图片描述
从输出结果我们可以看到,缺失的单元格数据被NaN所取代

`csv_data.isnull().sum()#输出每列缺失值

##删除缺失值
删除行(删除某个样本)
csv_data.dropna(axis=0)
删除列(删除某个特征)
csv_data.dropna(axis=1)
##填补缺失值
虽然删除缺失值使得数据处理非常分方便,但是缺点还是有的,比如因为删除过多而导致分析边的不可靠,删除太多特征列而导致无法获得有价值的信息。所以建议使用插值技术。
##填补缺失的数据
均值插补技术:用整个列的均值插补空缺的值
最方便的实现方式是用skitlearn的Imputer

标签:删除,python,数据,dropna,缺失,##,csv,data,预处理
来源: https://blog.csdn.net/iambaixiaocheng/article/details/102755359

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有