大 pandas 长到宽的多栏重塑

pandas long to wide multicolumn reshaping(大 pandas 长到宽的多栏重塑)
本文介绍了大 pandas 长到宽的多栏重塑的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个 pandas 数据框,如下所示:

 request_id     crash_id           counter  num_acc_x  num_acc_y  num_acc_z
    745109.0    670140638.0        0      0.010      0.000     -0.045
    745109.0    670140638.0        1      0.016     -0.006     -0.034
    745109.0    670140638.0        2      0.016     -0.006     -0.034
我的id变量是:"请求_id"和"崩溃_id",目标变量是nu_acc_x、num_acc_y和num_acc_z 我想创建一个新的DataFrame,其中的目标变量被广泛重塑,即添加max(Count)*3个新变量,如num_acc_x_0、num_acc_x_1、...Num_acc_y_0、num_acc_y_1、...Num_acc_z_0、num_acc_z_1可能没有透视表作为最终结果(我希望像R中那样为True DataFrame)。

提前感谢您的关注

推荐答案

我认为您需要set_indexunstack,最后一次创建列名来自MultiIndexbymap

df = df.set_index(['request_id','crash_id','counter']).unstack()
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
   request_id     crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_2  
0    745109.0  670140638.0         0.01        0.016        0.016   

   num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_1  
0          0.0       -0.006       -0.006       -0.045       -0.034   

   num_acc_z_2  
0       -0.034  

另一个具有聚合功能的解决方案与pivot_table重复:

df = df.pivot_table(index=['request_id','crash_id'], columns='counter', aggfunc='mean')
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
   request_id     crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_2  
0    745109.0  670140638.0         0.01        0.016        0.016   

   num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_1  
0          0.0       -0.006       -0.006       -0.045       -0.034   

   num_acc_z_2  
0       -0.034  

df = df.groupby(['request_id','crash_id','counter']).mean().unstack()
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
   request_id     crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_2  
0    745109.0  670140638.0         0.01        0.016        0.016   

   num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_1  
0          0.0       -0.006       -0.006       -0.045       -0.034   

   num_acc_z_2  
0       -0.034  

这篇关于大 pandas 长到宽的多栏重塑的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Leetcode 234: Palindrome LinkedList(Leetcode 234:回文链接列表)
How do I read an Excel file directly from Dropbox#39;s API using pandas.read_excel()?(如何使用PANDAS.READ_EXCEL()直接从Dropbox的API读取Excel文件?)
subprocess.Popen tries to write to nonexistent pipe(子进程。打开尝试写入不存在的管道)
I want to realize Popen-code from Windows to Linux:(我想实现从Windows到Linux的POpen-code:)
Reading stdout from a subprocess in real time(实时读取子进程中的标准输出)
How to call type safely on a random file in Python?(如何在Python中安全地调用随机文件上的类型?)