由汇编内核的MD5算法编写谈代码优化.docx
《由汇编内核的MD5算法编写谈代码优化.docx》由会员分享,可在线阅读,更多相关《由汇编内核的MD5算法编写谈代码优化.docx(7页珍藏版)》请在三一文库上搜索。
1、由汇编内核的MD5算法编写谈代码优化作者:crazyd下载本文示例工程去年为了破解动网论坛,写了一个用于破解动网论坛的md5暴力破解程序(开始我们做个实验,先打开两个文档附带的程序,一个工程是MD5C,一个工程是MD5ASM,其中MD5C是从VCKBASE下载的md5算法的标准C语言原代码,MD5ASM是我修改后的md5算法原代码。我给这两个工程的main函数里面都添加了一段回朔代码,用来产生099999999的数字,然后用这两个工程里面的可执行文件去对每个数字md5加密。好了,经过一段时间的等待后,就可以看到类似的结果了:MD5ASM工程在我的机器上的结果是181秒,MD5C在我的机器上产生
2、的结果是999秒,呵呵,数字有点怪,不过我看了表的,差不多是这个时间,巨大的差距是怎样产生的,让我们接下来往下看吧。在开始正题之前,大家需要清楚一件事,就是MD5C里面的代码虽然效率不高,但绝对是优秀的,因为它主要在演示md5的算法,用的是纯粹的C,没有添加任何平台相干的代码,而我改写的MD5ASM是只能够运行于x86上的windows系统中。所以速度是以兼容性来交换的。一、算法优化先观察一下MD5C里面的一段代码:static void Encode (unsigned char *output, unsigned int *input, unsigned int len)unsigned
3、int i, j;for (i = 0, j = 0; j 8) & 0xff);outputj+2 = (unsigned char)(inputi 16) & 0xff);outputj+3 = (unsigned char)(inputi 24) & 0xff);这是一段将整数数组转换成为字符数组的代码,我们看看它到底做了些什么。假设主函数输入了一个整数0x30313233,那么这个子函数的调用就可以写成下面的样子:Encode (output, input, 1)Input指向一个整数数组,数组的第一个元素是0x30313233,我们接下来看函数转换i=0,j=0output0= (u
4、nsigned char)(input0& 0xff)=0x33output1= (unsigned char)(input0& 0xff)=0x32output2= (unsigned char)(input0& 0xff)=0x31output3= (unsigned char)(input0& 0xff)=0x30i=0,j=4 跳出循环output的内存排列顺序为+-+-+-+-+-|33|32|31|30|+-+-+-+-+-output现在大家注意了,input的排列顺序是什么?由计算机原理可知道,在计算机内部,数据的存放顺序是“高位对应高位,低位对应低位”,0x30313233中
5、的33因为是个位,是低位,所以对应内存单元的最低位,同理30在内存单元的最高位,由此推出0x30313233在数组中的排列顺序为:+-+-+-+-+-|33 32 31 30|+-+-+-+-+-input结果显而易见了,这个函数的功能只是将一个无符号整形数组转换成为了一个无符号字符形数组,作者的目的我虽然不清楚,但是这个地方确实可以优化如下:output=(unsigned char *)input;把这个地方叫作算法的优化可能有点牵强,但是算法的优化确实是最为重要的,比如说搜索算法,如果选择不当,可能要丧失很多的效率。二、内存拷贝优化再观察一下MD5C里面的一段代码:static void
6、 MD5_memcpy (unsigned char *output, unsigned int *input, unsigned int len) unsigned int i; for (i = 0; i len; i+) outputi = inputi;这处的为什么要修改是非常明显的,for循环是非常慢的,我们一般可以把类似的代码替换成为C的库函数或者操作系统的标准函数,如:CopyMemory ()memcpy()这种内存代码你也千万不要尝试自己去实现,那将是一种灾难,在每个操作系统中,内存拷贝可以说是非常频繁的,所以系统的内存拷贝函数基本上都是非常完美的,不信的话你可以自己写一段内
7、存拷贝函数,然后和系统的内存拷贝函数比较一下就知道了,具体原代码可以参考linux中string.lib的实现。这处代码是特别值得注意的地方,如果你在你的代码的运算密集处写出了类似MD5_memcpy的代码的化,那么性能将会急剧的下降,对你的系统将是灾难性的。三、使用汇编优化下面又一段MD5C里面的代码,这种代码每一次md5加密要运算64次,而我们要穷举8位数字的话,就需要运算64000000次,将下面的代码用汇编展开以后大概是23行的汇编代码,也就是这个转换将耗费0,即1472亿个指令周期。/参考test/test1的原代码#define UINT4 unsigned int#define
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汇编 内核 MD5 算法 编写 代码 优化
