对于不能使用astype强制转换的值,请使用NaN

Use NaN for values that can#39;t be cast using astype(对于不能使用astype强制转换的值,请使用NaN)
本文介绍了对于不能使用astype强制转换的值,请使用NaN的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个非常大的Pandas DataFrame,看起来像这样:

>>> d = pd.DataFrame({"a": ["1", "U", "3.4"]})
>>> d
     a
0    1
1    U
2  3.4

当前该列设置为object

>>> d.dtypes
a    object
dtype: object

我想将此列转换为浮点型,以便我可以使用groupby()并计算平均值。当我尝试使用astype时,我正确地得到了一个错误,因为字符串不能强制转换为浮点型:

>>> d.a.astype(float)
ValueError: could not convert string to float: 'U'

我想做的是将所有元素强制转换为浮点型,然后替换不能被nans强制转换的元素。

如何执行此操作?

我尝试设置raise_on_error,但不起作用,dtype仍然object

>>> d.a.astype(float, raise_on_error=False)
0      1
1      U
2    3.4
Name: a, dtype: object

推荐答案

使用to_numeric并指定errors='coerce'强制将无法解析为数值的字符串转换为NaN

>>> pd.to_numeric(d['a'], errors='coerce')
0    1.0
1    NaN
2    3.4
Name: a, dtype: float64

这篇关于对于不能使用astype强制转换的值,请使用NaN的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Leetcode 234: Palindrome LinkedList(Leetcode 234:回文链接列表)
How do I read an Excel file directly from Dropbox#39;s API using pandas.read_excel()?(如何使用PANDAS.READ_EXCEL()直接从Dropbox的API读取Excel文件?)
subprocess.Popen tries to write to nonexistent pipe(子进程。打开尝试写入不存在的管道)
I want to realize Popen-code from Windows to Linux:(我想实现从Windows到Linux的POpen-code:)
Reading stdout from a subprocess in real time(实时读取子进程中的标准输出)
How to call type safely on a random file in Python?(如何在Python中安全地调用随机文件上的类型?)