一、什么是MD5算法
Message Digest Algorithm MD5(中文: 消息摘要算法第五版)
为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。
该算法的文件号为RFC 1321(R.Rivest, MIT Laboratory for Computer Science and RSA Data Security Inc. April 1992)。
在90年代初由MIT Laboratory for Computer Science和RSA Data Security Ic,的Ronald L。 Rivest开发出来,经MD2、MD3和MD4发展而来。
它的作用是让大容量信息在用数字签名软件签署私人密钥前被”压缩”成一种保密的格式(就是把一个任意长度的字节串变换成一定长的大整数)。
不管是MD2、MD4还是MD5,它们都需要获得一个随机长度的信息并产生一个128位的信息摘要。
虽然这些算法的结构或多或少有些相似,但MD2的设计与MD4和MD5完全不同,那是因为MD2是为8位机器做设计优化的,而MD4和MD5却是面向32位的电脑。
这三个算法的描述和C语言源代码在Internet RFC 1321中有详细的描述,这是一份最权威的文档,由Ronald L。 Rivest在1992年8月向IETF提交。
MD5最广泛被用于各种软件的密码认证和钥匙识别上。
通俗的讲就是人们讲的序列号。
二、什么是MD2、MD4、MD5算法
MD2简介
Rivest在1989年开发出MD2算法。
MD2算法加密后结果是唯一的(即不同信息加密后的结果不同)。
在这个算法中,首先对信息进行数据补位,使信息的字节长度是16的倍数。
然后,以一个16位的检验和追加到信息末尾,并且根据这个新产生的信息计算出散列值。
后来,Rogier和Chauvaud发现如果忽略了检验将产生冲突。
MD4简介
为了加强算法的安全性,Rivest在1990年又开发出MD4算法。
MD4算法同样需要填补信息以确保信息的比特位长度加上448后能被512整除(信息比特位长度mod 512 = 448)。
然后,一个以64位二进制表示的信息的最初长度被添加进来。
信息被处理成512位damg?rd/merkle迭代结构的区块,而且每个区块要通过三个不同步骤的处理。
Den boer和Bosselaers以及其他人很快的发现了攻击MD4版本中第一步和第三步的漏洞。
Dobbertin向大家演示了如何利用一部普通的个人电脑在几分钟内找到MD4完整版本中的冲突
这个冲突实际上是一种漏洞,它将导致对不同的内容进行加密却可能得到相同的加密后结果。
毫无疑问,MD4就此被淘汰掉了。
尽管MD4算法在安全上有个这么大的漏洞,但它对在其后才被开发出来的好几种信息安全加密算法的出现却有着不可忽视的引导作用。
MD5简介
一年以后,即1991年,Rivest开发出技术上更为趋近成熟的md5算法。
它在MD4的基础上增加了”安全-带子”(safety-belts)的概念。
虽然MD5比MD4稍微慢一些,但却更为安全。
这个算法很明显的由四个和MD4设计有少许不同的步骤组成。
在MD5算法中,信息-摘要的大小和填充的必要条件与MD4完全相同。
Den boer和Bosselaers曾发现MD5算法中的假冲突(pseudo-collisions),但除此之外就没有其他被发现的加密后结果了。
Van oorschot和Wiener曾经考虑过一个在散列中暴力搜寻冲突的函数(brute-force hash function),而且他们猜测一个被设计专门用来搜索MD5冲突的机器
这台机器在1994年的制造成本大约是一百万美元可以平均每24天就找到一个冲突。
但单从1991年到2001年这10年间,竟没有出现替代MD5算法的MD6或被叫做其他什么名字的新算法这一点,我们就可以看出这个瑕疵并没有太多的影响MD5的安全性。
上面所有这些都不足以成为MD5的在实际应用中的问题。
并且,由于MD5算法的使用不需要支付任何版权费用的,所以在一般的情况下(即非绝密应用领域)。但即便是应用在绝密领域内,MD5也不失为一种非常优秀的中间技术),MD5怎么都应该算得上是非常安全的了。
MD5用的是哈希函数,在计算机网络中应用较多的不可逆加密算法有RSA公司发明的MD5算法和由美国国家技术标准研究所建议的安全散列算法SHA。
三、MD5算法有什么用?
普通文件的MD5效验(文件数字签名)
典型应用是对一段信息(Message)产生信息摘要(Message-Digest),以防止被篡改。
比如,在UNIX系统里很多软件在下载的时候都有一个文件名相同,文件扩展名为.md5的文件,在这个文件中通常只有一行文本,大致内容如下:
MD5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461
这就是tanajiya.tar.gz文件的数字签名。
MD5将整个文件当作一个大文本信息,通过其不可逆的字符串变换算法,产生了这个唯一的MD5信息摘要。
为了让读者朋友对MD5的应用有个直观的认识,笔者以一个比方和一个实例来简要描述一下其工作过程:
大家都知道,地球上任何人都有自己独一无二的指纹,这常常成为公安机关鉴别罪犯身份最值得信赖的方法;
与之类似,MD5就可以为任何文件(不管其大小、格式、数量)产生一个同样独一无二的“数字指纹”,如果任何人对文件做了任何改动,其MD5值也就是对应的“数字指纹”都会发生变化。
我们常常在某些软件下载站点的某软件信息中看到其MD5值,它的作用就在于我们可以在下载该软件后,对下载回来的文件用专门的软件(如Windows MD5 Check等)做一次MD5校验,以确保我们获得的文件与该站点提供的文件为同一文件。
利用MD5算法来进行文件校验的方案被大量应用到软件下载站、论坛数据库、系统文件安全等方面。
登录认证(MD5密码)
MD5还广泛用于操作系统的登陆认证上,如Unix、各类BSD系统登录密码、数字签名等诸多方。
如在UNIX系统中用户的密码是以MD5(或其它类似的算法)经Hash运算后存储在文件系统中。
当用户登录的时候,系统把用户输入的密码进行MD5 Hash运算,然后再去和保存在文件系统中的MD5值进行比较,进而确定输入的密码是否正确。
通过这样的步骤,系统在并不知道用户密码的明码的情况下就可以确定用户登录系统的合法性。
这可以避免用户的密码被具有系统管理员权限的用户知道。
MD5将任意长度的“字节串”映射为一个128bit的大整数,并且是通过该128bit反推原始字符串是困难的,
换句话说就是,即使你看到源程序和算法描述,也无法将一个MD5的值变换回原始的字符串,
从数学原理上说,是因为原始的字符串有无穷多个,这有点象不存在反函数的数学函数。
所以,要遇到了MD5密码的问题,比较好的办法是:你可以用这个系统中的md5()函数重新设一个密码,如admin,把生成的一串密码的Hash值覆盖原来的Hash值就行了。
正是因为这个原因,现在被黑客使用最多的一种破译密码的方法就是一种被称为”跑字典”的方法。
有两种方法得到字典,一种是日常搜集的用做密码的字符串表,另一种是用排列组合方法生成的,先用MD5程序计算出这些字典项的MD5值,然后再用目标的MD5值在这个字典中检索。
我们假设密码的最大长度为8位字节(8 Bytes),同时密码只能是字母和数字,共26+26+10=62个字符,排列组合出的字典的项数则是P(62,1)+P(62,2)….+P(62,8),那也已经是一个很天文的数字了,存储这个字典就需要TB级的磁盘阵列,而且这种方法还有一个前提,就是能获得目标账户的密码MD5值的情况下才可以。
这种加密技术被广泛的应用于UNIX系统中,这也是为什么UNIX系统比一般操作系统更为坚固一个重要原因。
暂无评论