在Python中使用factorize()后如何获取原始值？

本文介绍了在Python中使用factorize()后如何获取原始值？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我是一个初学者，正在尝试使用Python中的随机森林，使用训练和测试数据集来创建预测模型。序列["允许/阻止"]可以取4个预期值中的1个(所有字符串)。测试["允许/阻止"]是需要预测的。

y,_ = pd.factorize(train["ALLOW/BLOCK"])

y
Out[293]: array([0, 1, 0, ..., 1, 0, 2], dtype=int64)

我使用predict进行预测。

clf.predict(test[features])

clf.predict(test[features])[0:10]
Out[294]: array([0, 0, 0, 0, 0, 2, 2, 0, 0, 0], dtype=int64)

如何获取原始值而不是数值？以下代码是否确实比较了实际值和预测值？

z,_= pd.factorize(test["AUDIT/BLOCK"])

z==clf.predict(test[features])
Out[296]: array([ True, False, False, ..., False, False, False], dtype=bool)

推荐答案

首先，您需要将pd.factorize返回的label保存如下：

y, label = pd.factorize(train["ALLOW/BLOCK"])

得到数值预测后，您可以通过label[pred]：

提取相应的标签

pred = clf.predict(test[features])
pred_label = label[pred]

pred_label包含具有原始值的预测。

不，您不应该重新分解测试预测，因为标签很可能是不同的。请考虑以下示例：

pd.factorize(['a', 'b', 'c'])
# (array([0, 1, 2]), array(['a', 'b', 'c'], dtype=object))

pd.factorize(['c', 'a', 'b'])
# (array([0, 1, 2]), array(['c', 'a', 'b'], dtype=object))

因此标签取决于元素的顺序。

这篇关于在Python中使用factorize()后如何获取原始值？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除！

在Python中使用factorize()后如何获取原始值？

问题描述

推荐答案

相关文档推荐