小明:老师,有个问题不懂。
老师:什么问题,说吧。
小明:我最近在研究微信支付接口,发现它不仅支持MD5摘要的验签,还支持SHA-256摘要。这个SHA是什么鬼?
老师:和MD5算法类似,SHA(Secure Hash Algorithm)也是一种生成信息摘要的算法。
小明:可是我看到网上以SHA命名的算法五花八门,什么SHA-1,SHA2,SHA-256等等,为什么会有这么多名字呢?
老师:这是因为SHA算法分为很多版本。最大的版本分类是SHA-1和SHA-2,SHA-2又包含了很多子版本。
老师:SHA-2的子版本包括SHA-224,SHA-256,SHA-384,SHA-512。这些版本共同构成了SHA的大家族。
小明:SHA算法和MD5算法有什么区别呢?SHA的这么多版本之间又有什么不同?
老师:要回答这个问题,我们先从SHA-1说起吧。
SHA-1
SHA-1算法可以从明文生成160bit的信息摘要,示例如下:
给定明文:abcd
SHA-1摘要:81FE8BFE87576C3ECB22426F8E57847382917ACF
SHA-1 与 MD5的主要区别是什么呢?
1.摘要长度不同。
MD5的摘要的长度尽128bit,SHA-1摘要长度160bit。多出32bit意味着什么呢?不同明文的碰撞几率降低了2^32 = 324294967296倍。
2.性能略有差别
SHA-1生成摘要的性能比MD5略低。
小明:SHA-1这么强大,应该没人能**吧?
老师:很遗憾,早在2005年,人们就研究出了**SHA-1的方法。近期谷歌的Chrome小组也宣城要淘汰SHA-1。
小明:连SHA-1都不安全了,这可怎么办?
老师:别担心,我们还有更安全的算法SHA-2。
SHA-2
SHA-2是一系列SHA算法变体的总称,其中包含如下子版本:
SHA-256:可以生成长度256bit的信息摘要。
SHA-224:SHA-256的“阉割版”,可以生成长度224bit的信息摘要。
SHA-512:可以生成长度512bit的信息摘要。
SHA-384:SHA-512的“阉割版”,可以生成长度384bit的信息摘要。
显然,信息摘要越长,发生碰撞的几率就越低,**的难度就越大。但同时,耗费的性能和占用的空间也就越高。
小明:为什么SHA-2要有这么多的版本呢?只使用最长的一种不就行了吗?
老师:这是为了适应不同的应用场景,从而对安全、性能、空间等因素做出权衡。比如说过我的需求仅仅是验证数据完整性,使用SHA-512显然是浪费了。另外,如果想要追求安全性,也可以考虑把多种摘要算法结合使用。比如下面这样:
明文: abcd
MD5摘要:e2fc714c4727ee9395f324cd2e7f331f
SHA-256摘要:
88d4266fd4e6338d13b845fcf289579d209c897823b9217da3e161936f031589
合成摘要:e2fc714c4727ee93209c897823b9217da3e161936f031589
取MD摘要的前16和SHA-256摘要的后32位,拼成一个长度48位的合成摘要。这样除非知道拼接规则,否则外人是无从**的。
小明:还真是个好办法。最后一个问题,SHA-1和SHA-2系列算法生成摘要的底层原理是什么样呢?
老师:SHA算法的底层原理和MD5很相似,只是在摘要分段和处理细节上有少许差别。
我们先来回顾一下MD5算法的核心过程,简而言之,MD5把128bit的信息摘要分成A,B,C,D四段(Words),每段32bit,在循环过程中交替运算A,B,C,D,最终组成128bit的摘要结果。
再看一下SHA-1算法,核心过程大同小异,主要的不同点是把160bit的信息摘要分成了A,B,C,D,E五段。
再看一下SHA-2系列算法,核心过程更复杂一些,把信息摘要分成了A,B,C,D,E,F,G,H八段。
其中SHA-256的每一段摘要长度是32bit,SHA-512的每一段摘要长度是64bit。SHA-224和SHA-384则是在前两者生成结果的基础上做出裁剪。
几点补充:
SHA家族的最新成员SHA-3已经于2015年问世。关于SHA-3的细节,有兴趣的小伙伴们可以查询资料进一步学习。
关注微信公众号和今日头条,精彩文章持续更新中。。。。。