本文介绍了从 pandas 数据框列中查找相交或最近的地理坐标的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我在 pandas 数据帧中有经度、经度和地址。用户输入一个地址,我想根据最后的Long从 pandas 数据框中查找相关的详细信息。以下是我的代码:
import pandas as pd
df_geo = pd.DataFrame({'Address': ['Addr1','Addr2','Addr3'],
'Value': [100, 101, 103],
'Lat': [33.515226, 33.51529, 33.515230],
'Long': [-112.094456, -112.094459, -112.094464]})
我使用API对地址进行了地理编码,并获得了LATH、LONG列表。
[33.515227, -112.094457]
如何在Pandas DataFrame和PullAddress
和Value
字段中找到交点或最近的坐标?我们有地理编码API。 pandas DataFrame可能会相当大,因此如果可能的话,请使用其中一个python geo库来寻找高效的解决方案。
推荐答案
使用BallTree
来自sklearn
:
import pandas as pd
import numpy as np
from sklearn.neighbors import BallTree
df_geo = pd.DataFrame({'Address': ['Addr1','Addr2','Addr3'],
'Value': [100, 101, 103],
'Lat': [33.515226, 33.51529, 33.515230],
'Long': [-112.094456, -112.094459, -112.094464]})
coords = [33.515227, -112.094457]
X = np.deg2rad(df_geo[['Lat', 'Long']].values)
y = np.deg2rad(np.array([coords]))
tree = BallTree(X, leaf_size=2)
dist, ind = tree.query(y)
输出:
>>> df_geo[['Address', 'Value']].iloc[ind[0][0]].tolist()
['Addr1', 100]
>>> dist
array([[2.46826831e-08]])
>>> ind
array([[0]])
这篇关于从 pandas 数据框列中查找相交或最近的地理坐标的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!