大 pandas 成群结队,每一群都被视为一个独特的群体

Pandas groupby with each group treated as a unique group(大 pandas 成群结队,每一群都被视为一个独特的群体)
本文介绍了大 pandas 成群结队,每一群都被视为一个独特的群体的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

请协助。如何获取 pandas Groupby的累积和,但我的数据是布尔值0和1。我希望将每组0或1视为唯一值,并在满足新值时重置计数。

我目前有一个汇总了所有1和0的

df['grp'] = df.groupby("dir")["dir"].cumsum())

我想要的输出

df  = pd.DataFrame({"dir":[1,1,1,1,0,0,0,1,1,1,1,0,0,0],
                  "grp": [1,2,3,4,1,2,3,1,2,3,4,1,2,3,]})

推荐答案

使用:

In [1495]: df['grp'] = df.groupby((df['dir'] != df['dir'].shift(1)).cumsum()).cumcount()+1

In [1496]: df
Out[1496]: 
    dir  grp
0     1    1
1     1    2
2     1    3
3     1    4
4     0    1
5     0    2
6     0    3
7     1    1
8     1    2
9     1    3
10    1    4
11    0    1
12    0    2
13    0    3

这篇关于大 pandas 成群结队,每一群都被视为一个独特的群体的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Leetcode 234: Palindrome LinkedList(Leetcode 234:回文链接列表)
How do I read an Excel file directly from Dropbox#39;s API using pandas.read_excel()?(如何使用PANDAS.READ_EXCEL()直接从Dropbox的API读取Excel文件?)
subprocess.Popen tries to write to nonexistent pipe(子进程。打开尝试写入不存在的管道)
I want to realize Popen-code from Windows to Linux:(我想实现从Windows到Linux的POpen-code:)
Reading stdout from a subprocess in real time(实时读取子进程中的标准输出)
How to call type safely on a random file in Python?(如何在Python中安全地调用随机文件上的类型?)