您现在的位置是:网站首页> 编程资料编程资料

Pandas 如何处理DataFrame中的inf值_python_

2023-05-26 307人已围观

简介 Pandas 如何处理DataFrame中的inf值_python_

如何处理DataFrame的inf值

在用DataFrame计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。

为了方便后续处理,可以利用numpy,将这些inf值进行替换。

1. 将某1列(series格式)中的 inf 替换为数值。

import numpy as np   df['Col'][np.isinf(df['Col'])] = -1

2. 将某1列(series格式)中的 inf 替换为NA值。

import numpy as np   df['Col'][np.isinf(df['Col'])] = np.nan

3. 将整个DataFrame中的 inf 替换为数值(空值同理)。#感谢评论区的补充

import numpy as np   df.replace(np.inf, -1) #替换正inf为-1   #替换正负inf为NA,加inplace参数  df.replace([np.inf, -np.inf], np.nan, inplace=True)

DataFrame有关inf的处理技巧

numpy中inf的相关文档

什么是inf?

IEEE 754浮点表示(正)无穷大。

为什么会产生?

>>> np.NINF -inf >>> np.inf inf >>> np.log(0) -inf >>> np.array([1,2])/0 #碰到的最多的情况 array([ inf,  inf])

产生inf有什么好处?

目前没看到有什么好处,只是单纯用inf表示无穷大,方便理解和表示。

产生inf有什么坏处?

对用户而言,对inf需要特殊处理,加大了工作量。

为什么需要特殊处理?因为许多机器学习算法库并不支持对inf的处理。

怎么处理?

常见的处理方法:

  • 不处理
  • 替换

怎么获取到inf的所在位置并进行填补?

  • isinf:显示哪些元素为正或负无穷大
  • isposinf:显示哪些元素为正无穷大
  • isneginf:显示哪些元素为负无穷大
  • isnan:显示哪些元素不是数字
  • isfinite:显示哪些元素是有限的(不是非数字,正无穷大和负无穷大中的一个)
''' >>> np.isinf(np.inf) #其他函数同理使用,isinf使用最多。 True >>> np.isinf(np.array([1,np.inf])) array([False,  True], dtype=bool) >>>np.isinf(pd.DataFrame(np.array([1,np.inf])))        0 0  False 1   True >>>s1 = pd.Series([1,2,3,np.inf]) >>>s1 0    1.0 1    2.0 2    3.0 3    NaN dtype: float64 #对inf填补 999 >>>s1[np.isinf(s1)] = 999 >>>s1 0    1.0 1    2.0 2    3.0 3  999.0 dtype: float64 #对inf填补np.nan (较为常用) >>>s1[np.isinf(s1)] = np.nan >>>s1 0    1.0 1    2.0 2    3.0 3    NaN dtype: float64

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

您可能感兴趣的文章:

-六神源码网