在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?

Can one perform a left join in pandas that selects only the first match on the right?(在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?)
本文介绍了在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在 pandas 中,是否可以只选择右侧的第一个匹配项进行左联接?示例:

left            = pd.DataFrame()
left['age']     = [11, 12]
right           = pd.DataFrame()
right['age']    = [10, 11, 11]
right['salary'] = [ 100, 150, 200 ]
left.merge( right, how='left', on='age' )

退货

   age  salary
0   11     150
1   11     200
2   12     NaN

但我想要的是保留左边的行数,只取第一个匹配。即:

   age  salary
0   11     150
2   12     NaN

所以我一直在使用

left.merge( right.drop_duplicates(['age']), how='left', on='age')

但我相信这是Right的完整副本。而且闻起来很怪。

有没有更优雅的方式?

推荐答案

可以,您可以使用GROUPBY删除重复行。做你所做的一切来定义左和右。现在,我在您的最后一行定义了一个新的数据帧:

left2=left.merge( right, how='left', on='age' )
df= left2.groupby(['age'])['salary'].first().reset_index()
df

一开始我使用的是.min(),它会给出每个年龄的最低工资,如下所示:

df= left2.groupby(['age'])['salary'].min().reset_index()

但你特别问的是第一场比赛。为此,您可以使用.first()选项。注意:末尾的.Reset_index()只是将groupby的输出重新格式化为DataFrame。

这篇关于在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Leetcode 234: Palindrome LinkedList(Leetcode 234:回文链接列表)
How do I read an Excel file directly from Dropbox#39;s API using pandas.read_excel()?(如何使用PANDAS.READ_EXCEL()直接从Dropbox的API读取Excel文件?)
subprocess.Popen tries to write to nonexistent pipe(子进程。打开尝试写入不存在的管道)
I want to realize Popen-code from Windows to Linux:(我想实现从Windows到Linux的POpen-code:)
Reading stdout from a subprocess in real time(实时读取子进程中的标准输出)
How to call type safely on a random file in Python?(如何在Python中安全地调用随机文件上的类型?)