本文介绍了哈希不匹配的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在散列相同的值,但得到不同的结果。
这里有一个简单的例子来解释我遇到的问题:
我有一个维度表,如下所示:
性别 | Gender_id |
---|---|
男性 | 1 |
女性 | 0 |
性别的数据类型为NVARCHAR(6),Gender_id为int
当我执行以下任何查询时,我都会得到相同的哈希:
**Scenario 1:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, cast(gender_id as int))))
FROM demographic
WHERE gender = 'Male';
输出:‘0x6B216D8BB993AA263265CCF645C282B100000000’
**Scenario 2:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, CAST(gender_id AS NVARCHAR(1)))))
FROM demographic
WHERE gender = 'Male';
输出:‘0x6B216D8BB993AA263265CCF645C282B100000000’
在场景1中,我将Gender_id强制转换为int,在场景2中,我将Gender_id强制转换为NVARCHAR。在这两种情况下,哈希是相同的。当我执行查询调用维度中的特定值而不是列时,我的哈希是不同的:
**Scenario 3:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as INT))));
输出:‘0x048A5F0EE2D2B4070CFF8A38CB6DAC7100000000’
**Scenario 4:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as NVARCHAR(1)))));
输出:‘0x6B216D8BB993AA263265CCF645C282B100000000’
在场景3中,我将1强制转换为int,就像我在场景1中所做的那样。在场景4中,我像在场景2中所做的那样,将1强制转换为NVARCHAR。然而,场景3和4具有不同的散列。除此之外,方案4的哈希与方案1和方案2的哈希一致。我很难理解为什么场景1、2和4的散列相同,而场景3的散列不同。在我的维度中,Gender_id是一个int。当我查询我的维度时,无论我如何转换它,散列总是相同的。在场景3和场景4中,当我用实际值替换列名时,结果会发生变化。场景3中的散列将与场景1和场景2不匹配,除非我将其转换为NVARCHAR。为什么会这样呢?因为Gender_id自然是整型的?
如果您有任何见解,我将不胜感激,如果需要,我很乐意提供更多说明。
谢谢!
推荐答案
'Male'
是ANSI值,而不是Unicode值。对于Unicode,您需要N'Male'
例如,我在此查询中得到以下结果:
select convert(varchar(20), cast('Male' as varbinary(20)), 1)
0x4D616C65
而这个,请注意在文字之前添加了N
:
select convert(varchar(20), cast(N'Male' as varbinary(20)), 1)
0x4D0061006C006500
这篇关于哈希不匹配的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!