首页

文章

python中利用pandas怎么处理缺省值

发布网友 发布时间:2022-04-20 03:07

我来回答

2个回答

懂视网 时间:2022-05-10 20:11

下面就为大家分享一篇python解决pandas处理缺失值为空字符串的问题,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧

踩坑记录:

用pandas来做csv的缺失值处理时候发现奇怪BUG,就是excel打开csv文件,明明有的格子没有任何东西,当然,我就想到用pandas的dropna()或者fillna()来处理缺失值。

但是pandas读取csv文件后发现那个空的地方isnull()竟然是false,就是说那个地方有东西。。。

后来经过排查发现看似什么都没有的地方有空字符串,故pandas认为那儿不是缺失值,所以就不能用dropna()或者fillna()来处理。

解决思路:先用正则将空格匹配出来,然后全部替换为NULL,再在用pandas读取csv时候指定 read_csv(na_values='NULL')就是将NULL认为是nan处理,接下来就可以用dropna()或者fillna()来处理了

以上这篇python解决pandas处理缺失值为空字符串的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。



热心网友 时间:2022-05-10 17:19

null/None/NaN
null经常出现在数据库中
None是Python中的缺失值,类型是NoneType
NaN也是python中的缺失值,意思是不是一个数字,类型是float
在pandas和Numpy中会将None替换为NaN,而导入数据库中的时候则需要把NaN替换成None
找出空值
isnull()
notnull()
添加空值
numeric容器会把None转换为NaN
In [20]: s = pd.Series([1, 2, 3])

In [21]: s.loc[0] = None

In [22]: s
Out[22]:
0 NaN
1 2.0
2 3.0
dtype: float641234567891012345678910

object容器会储存None
In [23]: s = pd.Series(["a", "b", "c"])

In [24]: s.loc[0] = None

In [25]: s.loc[1] = np.nan

In [26]: s
Out[26]:
0 None
1 NaN
2 c
dtype: object123456789101112123456789101112

空值计算
arithmetic operations(数学计算)
NaN运算的结果是NaN
statistics and computational methods(统计计算)
NaN会被当成空置
GroupBy
在分组中会忽略空值
清洗空值
填充空值
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
参数
value : scalar, dict, Series, or DataFrame
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None(bfill使用后面的值填充,ffill相反)
axis : {0 or ‘index’, 1 or ‘columns’}
inplace : boolean, default False
limit : int, default None
downcast : dict, default is None
返回值
filled : DataFrame
Interpolation
replace
删除空值行或列
DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
参数
axis : {0 or ‘index’, 1 or ‘columns’}, or tuple/list thereof
how : {‘any’, ‘all’}
thresh : int, default None
subset : array-like
inplace : boolean, default False
返回
dropped : DataFrame
八月中国最凉快的地方 八月份哪里最凉快,去哪旅游好?美丽的地方 乱字同韵字是什么意思 华硕笔记本电脑触摸板怎么开笔记本电脑触摸板怎么开启和关闭_百度知 ... 陕西职务侵占案立案准则 结婚后我的恋情维系了十年,怎么做到的? 玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 【译】将HTML转为PDF的几种实现方案 变形金刚08动画怎么样 变形金刚08动画的问题 变形金刚08动画日语版剧情介绍 高分!换显卡nvidia控制面板被我卸了,重新安装显卡驱动后没了nvidia控... 我的nvidia控制面板被卸载了 怎么找回啊 卸载后 这个画面看着很奇怪_百 ... 李卓彬工作简历 林少明工作简历 广东工业职业技术学院怎么样 郑德涛任职简历 唐新桂个人简历 土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 Python,Pandas,创建了Series之后,dtype=np.int... python pandas dataframe的object怎么转换成python... 如何注销京东金条 以京东金条注销,微信转帐他人银行卡的钱要的回来吗 京东金条注销后还可以开结清证明吗 京东金条怎么注销 京东金条注销后能查到如何注销的嘛 京东金条注销账号后结清证明还能开吗 京东金融金条注销的话,是所有信息都删除了吗? 京东金条注销了能恢复吗 京东金条账户注销了还能开结清证明吗 注销京东金条等于这号废了 京东金条注销可以反悔吗? 京东金条注销后其他银行什么时候可以贷款 关闭京东金条有什么影响 iqoo怎么看到哪些应用可以分屏 最新一季开心宝贝五超人的技能都有什么,天使之翼... iqooneo5如何分屏 如何才能解除微信与电力户号的绑定关系? 微信怎么开通交电费业务 python中,用pandas将字符串数据类型转换成浮点数... python pandas groupby分组后的数据怎么用 python pandas中如何将dataframe中的一列字符串类... 在Python中出现了KeyError: ''怎么解决? python pandas 怎样把数字读成字符串格式 Python的pandas 数组如何得到索引值,如图,我要得... 怎么将python时间段(Timedelta)转化为int或float... python中ValueError: could not convert string to... python pandas中describe()各项含义及求值 python输出AttributeError: 'str' object has no a... TypeError: 'numpy.ndarray' object is not callab... 怎么使用Python中Pandas库Resample,实现重采样,... pandas将某一行设置为列索引(python) python pandas dataframe结构中,一列数据是身份证... python 错误提示TypeError: unsupported operand t... pandas.dataframe怎么把列变成索引 iQOO怎么分屏玩光遇 申万宏源证券怎么下载 我的声望宏源证券怎么找不到了在哪里找啊 申万宏源证券下载的软件老被杀毒软件删除怎么办
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com