根据列之间的差异过滤数据帧[不是下一列]

本文介绍了根据列之间的差异过滤数据帧[不是下一列]的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我有一个唯一的数据帧df：

name         val_1       val_2      val_3     val_4

AAA            1          2           3         11       
BBB            2          3           5         9
CCC            6          4           15        10

我只需要保留其中任何右侧val列从前面的任何val列增加10的名称，否则删除它们。

我知道diff()和ge()在这里会有帮助，但不确定如果不是关于下一列之间的差异，它们将如何工作。

所需输出：

name

AAA #val_4 increases by 10 from val_1  
CCC #val_3 increases by 11 from val_2

做这件事最聪明的方式是什么？如有任何建议，我们将不胜感激。谢谢！

推荐答案

我认为它正在做所需的工作。请注意，我将val_1的第二个值更改为20，这样我们就可以确保我们不会得到从左到右的差异，而不仅仅是从右到左的差异。

import pandas as pd

df = pd.DataFrame(
    {
        'name': ['AAA', 'BBB', 'CCC'],
        'val_1': [1, 20, 6],
        'val_2': [2, 3, 4],
        'val_3': [3, 5, 15],
        'val_4': [11, 9, 10]
    }
)

df = df.set_index("name")

f = lambda x: max( [ x[:i][-1] - min(x[:i][:-1]) for i in range(2,len(x)+1)] )

df = df[df.apply(f, axis=1) >= 10]

print(df.index.to_list())

这篇关于根据列之间的差异过滤数据帧[不是下一列]的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除！

根据列之间的差异过滤数据帧[不是下一列]

问题描述

推荐答案

相关文档推荐