概括来说,哈希(Hash)是将目标文本转换成具有相同长度的、不可逆的杂凑字符串(或叫做消息摘要),而加密(Encrypt)是将目标文本转换成具有不同长度的、可逆的密文。
具体来说,两者有如下重要区别:
1、哈希算法往往被设计成生成具有相同长度的文本,而加密算法生成的文本长度与明文本身的长度有关。
一般来说,哈希的结果具有相同的长度,而加密的结果则长度不同。实际上,如果使用相同的哈希算法,不论你的输入有多么长,得到的结果长度是一个常数,而加密算法往往与明文的长度成正比。
2、哈希算法是不可逆的,而加密算法是可逆的。
对于hash算法,这里的不可逆有两层含义,一是“给定一个哈希结果R,没有方法将E转换成原目标文本S”,二是“给定哈希结果R,即使知道一段文本S的哈希结果为R,也不能断言当初的目标文本就是S”。而加密则不同,给定加密后的密文R,存在一种方法可以将R确定的转换为加密前的明文S。
哈希算法与加密算法的数学基础:
一个哈希算法是一个多对一映射,给定目标文本S,H可以将其唯一映射为R,并且对于所有S,R具有相同的长度。由于是多对一映射,所以H不存在逆映射使得R转换为唯一的S。
其基本特征是:
散列函数具有确定性的结果
如果同一个函数进行散列的两个散列值不同,则这两个散列值的原始输入也不同。
散列函数的输入输出不是一一对应的,如果两个散列值相同,两个输入值很可能是相同的。但并不能绝对肯定二者一定相等。
MD5 和 SHA1 可以说是目前应用最广泛的Hash算法。
一个加密算法是一个一一映射,其中第二个参数叫做加密密钥,E可以将给定的明文S结合加密密钥Ke唯一映射为密文R,并且存在另一个一一映射,可以结合Kd将密文R唯一映射为对应明文S,其中Kd叫做解密密钥。
HMAC
Hash-based message authentication code,散列消息鉴别码,利用哈希算法,以一个密钥和一个消息为输入,生成一个消息摘要作为输出。通信实体双方使用的一种验证机制,保证消息数据完整性的一种工具。
消息鉴别码实现鉴别的原理是,用公开函数和密钥产生一个固定长度的值作为认证标识,用这个标识鉴别消息的完整性。使用一个密钥生成一个固定大小的小数据块,即MAC,并将其加入到消息中,然后传输。接收方利用与发送方共享的密钥进行鉴别认证等。
1. 发送者通过MAC算法计算出消息的MAC值,并和消息一起发给收信者
2. 收信者用同样的MAC算法计算收到的消息的MAC值,并对比两者。