标 题 : 【技术专题】软件漏洞分析入门_4_初级栈溢出C_修改程序流程 作 者 : failwest 时 间 : 2007 - 12 - 15 , 01 : 01 链 接 : http : //bbs.pediy.com/showthread.php?t=56582 第 4 讲 初级栈溢出C To be the apostrophe which changed “Impossible” into “I’m possible” —— failwest 没有星星的夜里,我用知识吸引你 上节课没有操练滴东西,不少蠢蠢欲动的同学肯定已经坐不住了。悟空,不要猴急,下面的两堂课都是实践课,用来在实践中深入体会上节课中的知识,并且很有趣味性哦 信息安全技术是一个对技术性要求极高的领域,除了扎实的计算机理论基础外、更重要的是优秀的动手实践能力。在我看来,不懂二进制就无从谈起安全技术。 缓冲区溢出的概念我若干年前已经了然于胸,不就是淹个返回地址把CPU指到缓冲区的shellcode去么。然而当我开始动手实践的时候,才发现实际中的情况远远比原理复杂。 国内近年来对网络安全的重视程度正在逐渐增加,许多高校相继成立了“信息安全学院”或者设立“网络安全专业”。科班出身的学生往往具有扎实的理论基础,他们通晓密码学知识、知道PKI体系架构,但要谈到如何真刀实枪的分析病毒样本、如何拿掉PE上复杂的保护壳、如何在二进制文件中定位漏洞、如何对软件实施有效的攻击测试……能够做到的人并不多。 虽然每年有大量的网络安全技术人才从高校涌入人力市场,真正能够满足用人单位需求的却聊聊无几。捧着书本去做应急响应和风险评估是滥竽充数的作法,社会需要的是能够为客户切实解决安全风险的技术精英,而不是满腹教条的阔论者。 我所知道的很多资深安全专家都并非科班出身,他们有的学医、有的学文、有的根本没有学历和文凭,但他们却技术精湛,充满自信。 这个行业属于有兴趣、够执着的人,属于为了梦想能够不懈努力的意志坚定者。如果你是这样的人,请跟着我把这个系列的所有实验全部完成,之后你会发现眼中的软件,程序,语言,计算机都与以前看到的有所不同——因为以前使用肉眼来看问题,我会教你用心和调试器以及手指来重新体验它们。 首先简单复习上节课的内容: 高级语言经过编译后,最终函数调用通过为其开辟栈帧来实现 开辟栈帧的动作是编译器加进去的,高级语言程序员不用在意 函数栈帧中首先是函数的局部变量,局部变量后面存放着函数返回地址 当前被调用的子函数返回时,会从它的栈帧底部取出返回地址,并跳转到那个位置(母函数中)继续执行母函数 我们这节课的思路是,让溢出数组的数据跃过authenticated,一直淹没到返回地址,把这个地址从main函数中分支判断的地方直接改到密码验证通过的分支! 这样当verify_password函数返回时,就会返回到错误的指令区去执行(密码验证通过的地方) 由于用键盘输入字符的ASCII表示范围有限,很多值如 0x11 , 0x12 等符号无法直接用键盘输入,所以我们把用于实验的代码在第二讲的基础上稍加改动,将程序的输入由键盘改为从文件中读取字符串。 #include < stdio . h > #define PASSWORD "1234567" int verify_password ( char * password ) { int authenticated ; char buffer [ 8 ]; authenticated = strcmp ( password , PASSWORD ); strcpy ( buffer , password ); //over flowed here! return authenticated ; } main () { int valid_flag = 0 ; char password [ 1024 ]; FILE * fp ; if (!( fp = fopen ( "password.txt" , "rw+" ))) { exit ( 0 ); } fscanf ( fp , "%s" , password ); valid_flag = verify_password ( password ); if ( valid_flag ) { printf ( "incorrect password!\n" ); } else { printf ( "Congratulation! You have passed the verification!\n" ); } fclose ( fp ); } 程序的基本逻辑和第二讲中的代码大体相同,只是现在将从同目录下的password . txt文件中读取字符串而不是用键盘输入。我们可以用十六进制的编辑器把我们想写入的但不能直接键入的ASCII字符写进这个password . txt文件。 用VC6 .0 将上述代码编译链接。我这里使用默认编译选项,BUILD成debug版本。鉴于有些同学反映自己的用的是VS2003和VS2005,我好人做到底,把我build出来的PE一并在附件中双手奉上——没话说了吧!不许不学,不许学不会,不许说难,不许不做实验!呵呵。 要PE的点这里: stack_overflow_ret . rar 在与PE文件同目录下建立password . txt并写入测试用的密码之后,就可以用OllyDbg加载调试了。 停~~~啥是OllyDbg,开玩笑,在这里问啥是Ollydbg分明是不给看雪老大的面子么!如果没有这个调试器的话,去工具版找吧,帖子附件要挂出个OD的话会给被人鄙视的。 在开始动手之前,我们先理理思路,看看要达到实验目的我们都需要做哪些工作。 要摸清楚栈中的状况,如函数地址距离缓冲区的偏移量,到底第几个字节能淹到返回地址等。这虽然可以通过分析代码得到,但我还是推荐从动态调试中获得这些信息。 要得到程序中密码验证通过的指令地址,以便程序直接跳去这个分支执行 要在password . txt文件的相应偏移处填上这个地址 这样verify_password函数返回后就会直接跳转到验证通过的正确分支去执行了。 首先用OllyDbg加载得到的可执行PE文件如图: 图 1 阅读上图中显示的反汇编代码,可以知道通过验证的程序分支的指令地址为 0x00401122 。 简单解释一下这段汇编与C语言的对应关系,其实凭着OD给出的注释,就算你没学过汇编语言,读懂也应该没啥问题。 0x00401102 处的函数调用就是verify_password函数,之后在 0x0040110A 处将EAX中的函数返回值取出 ,在 0x0040110D 处与 0 比较,然后决定跳转到提示验证错误的分支或提示验证通过的分支。提示验证通过的分支从 0x00401122 处的参数压栈开始。 啥?用OllyDbg加载后找不到verify_password函数的位置?这个嘛,我这里只说一次啊。 OllyDbg在默认情况下将程序中断在PE装载器开始处,而不是main函数的开始。如果您有兴趣的话可以按F8单步跟踪一下看看在main函数被运行之前,装载器都做了哪些准备工作。一般情况下main函数位于GetCommandLineA函数调用后不远处,并且有明显的特征:在调用之前有 3 次连续的压栈操作,因为系统要给main传入默认的argc、argv等参数。找到main函数调用后,按F7单步跟入就可以看到真正的代码了。 我相信你,你一定行的,找到了吗?什么?还找不到?好吧,按ctr + g后面输入截图中的地址 0x00401102 ,这回看到了吧。建议你按F2下个断点记住这个位置,别一会儿又在PE里边迷路了。 这步完成后,您应该对这个PE的主要代码有了一个把握了。这才牙长一点指令啊,真正的漏洞要对付的是软件,那个难缠~~~好,不泼冷水了 如果我们把返回地址覆盖成这个地址,那么在 0x00401102 处的函数调用返回后,程序将跳转到验证通过的分支,而不是进入 0x00401107 处分支判断代码。这个过程如下图所示: 图 2 通过动态调试,发现栈帧中的变量分布情况基本没变。这样我们就可以按照如下方法构造password . txt中的数据: 仍然出于字节对齐、容易辨认的目的,我们将“ 4321 ”作为一个输入单元。 buffer [ 8 ] 共需要 2 个这样的单元 第 3 个输入单元将authenticated覆盖 第 4 个输入单元将前栈帧EBP值覆盖 第 5 个输入单元将返回地址覆盖 为了把第 5 个输入单元的ASCII码值 0x34333231 修改成验证通过分支的指令地址 0x00401122 ,我们采取如下方式借助 16 进制编辑工具UltraEdit来完成( 0x40 , 0x11 等ASCII码对应的符号很难用键盘输入)。 步骤 1 :创建一个名为password . txt的文件,并用记事本打开,在其中写入 5 个“ 4321 ”后保存到与实验程序同名的目录下: 图 3 步骤 2 :保存后用UltraEdit_32重新打开,如图: 图 4 啥?问啥是UltraEdit?去工具版找吧,多的不得了,这里是看雪! 步骤 3 :将UltraEdit_32切换到 16 进制编辑模式,如图: 图 5 步骤写到这个份上了,您不会还跟不上吧。 步骤 4 :将最后四个字节修改成新的返回地址,注意这里是按照“内存数据”排列的,由于“大顶机”的缘故,为了让最终的“数值数据”为 0x00401122 ,我们需要逆序输入这四个字节。如图: 图 6 步骤 5 :这时我们可以切换回文本模式,最后这四个字节对应的字符显示为乱码: 图 7 最终的password . txt我也给你附上。 要txt的点这里: password . txt 将password . txt保存后,用OllyDbg加载程序并调试,可以看到最终的栈状态如下表所示: 局部变量名 内存地址 偏移 3 处的值 偏移 2 处的值 偏移 1 处的值 偏移 0 处的值 buffer [ 0 ~ 3 ] 0x0012FB14 0x31 ( ‘ 1 ’ ) 0x32 ( ‘ 2 ’ ) 0x33 ( ‘ 3 ’ ) 0x34 ( ‘ 4 ’ ) buffer [ 4 ~ 7 ] 0x0012FB18 0x31 ( ‘ 1 ’ ) 0x32 ( ‘ 2 ’ ) 0x33 ( ‘ 3 ’ ) 0x34 ( ‘ 4 ’ ) authenticated (被覆盖前) 0x0012FB1C 0x00 0x00 0x00 0x01 authenticated (被覆盖后) 0x0012FB1C 0x31 ( ‘ 1 ’ ) 0x32 ( ‘ 2 ’ ) 0x33 ( ‘ 3 ’ ) 0x34 ( ‘ 4 ’ ) 前栈帧EBP (被覆盖前) 0x0012FB20 0x00 0x12 0xFF 0x80 前栈帧EBP (被覆盖后) 0x0012FB20 0x31 ( ‘ 1 ’ ) 0x32 ( ‘ 2 ’ ) 0x33 ( ‘ 3 ’ ) 0x34 ( ‘ 4 ’ ) 返回地址 (被覆盖前) 0x0012FB24 0x00 0x40 0x11 0x07 返回地址 (被覆盖后) 0x0012FB24 0x00 0x40 0x11 0x22 程序执行状态如图: 由于栈内EBP等被覆盖为无效值,使得程序在退出时堆栈无法平衡,导致崩溃。虽然如此,我们已经成功的淹没了返回地址,并让处理器如我们设想的那样,在函数返回时直接跳转到了提示验证通过的分支。 同学们,你们成功了么? 最后再总结一下这个实验的内容: 通过Ollydbg调试PE文件确定密码验证成功的分支的指令所处的内存地址为 0x00401122 通过调试确定buffer数组距离栈帧中函数返回地址的偏移量 在password . txt相应的偏移处准确的写入 0x00401122 ,当password . txt被读入后会同样准确的把verify_password函数的返回地址从分支判断处修改到 0x00401122 (密码正确分支) 函数返回时,笨笨的返回到密码正确的地方 程序继续执行,但由于栈被破坏,不再平衡,故出错 试想一下,如果我们在buffer [] 中填入一些可执行的机器码,然后用溢出的数据把返回地址指向buffer [] ,那么函数返回后这些代码是不是就会执行了? 答案是肯定的,下一讲我将用类似的叙述方式,同样手把手的和您一起完成这段机器代码的编写,并把它们准确的布置在password . txt中,这样原本用来读取密码文件的程序读了这样一个精心构造的“黑文件”之后,就会做出一些“出格”的事情了。 明天见,顺便说一下,我一般会在凌晨 1 点左右发文,想坐沙发的同学注意了呦。