软件漏洞分析入门[初级栈溢出C_修改程序流程](ZT)


				标 题
				: 
				【技术专题】软件漏洞分析入门_4_初级栈溢出C_修改程序流程

作 者
				: 
				failwest

时 间
				: 
				2007
				-
				12
				-
				15
				,
				01
				:
				01

				链 接
				: 
				http
				:
				//bbs.pediy.com/showthread.php?t=56582


				第
				4
				讲  初级栈溢出C


To be the apostrophe which changed “Impossible” into “I’m possible”

—— failwest


没有星星的夜里，我用知识吸引你


上节课没有操练滴东西，不少蠢蠢欲动的同学肯定已经坐不住了。悟空，不要猴急，下面的两堂课都是实践课，用来在实践中深入体会上节课中的知识，并且很有趣味性哦



  信息安全技术是一个对技术性要求极高的领域，除了扎实的计算机理论基础外、更重要的是优秀的动手实践能力。在我看来，不懂二进制就无从谈起安全技术。



  缓冲区溢出的概念我若干年前已经了然于胸，不就是淹个返回地址把CPU指到缓冲区的shellcode去么。然而当我开始动手实践的时候，才发现实际中的情况远远比原理复杂。


  国内近年来对网络安全的重视程度正在逐渐增加，许多高校相继成立了“信息安全学院”或者设立“网络安全专业”。科班出身的学生往往具有扎实的理论基础，他们通晓密码学知识、知道PKI体系架构，但要谈到如何真刀实枪的分析病毒样本、如何拿掉PE上复杂的保护壳、如何在二进制文件中定位漏洞、如何对软件实施有效的攻击测试……能够做到的人并不多。


  虽然每年有大量的网络安全技术人才从高校涌入人力市场，真正能够满足用人单位需求的却聊聊无几。捧着书本去做应急响应和风险评估是滥竽充数的作法，社会需要的是能够为客户切实解决安全风险的技术精英，而不是满腹教条的阔论者。



  我所知道的很多资深安全专家都并非科班出身，他们有的学医、有的学文、有的根本没有学历和文凭，但他们却技术精湛，充满自信。


  这个行业属于有兴趣、够执着的人，属于为了梦想能够不懈努力的意志坚定者。如果你是这样的人，请跟着我把这个系列的所有实验全部完成，之后你会发现眼中的软件，程序，语言，计算机都与以前看到的有所不同——因为以前使用肉眼来看问题，我会教你用心和调试器以及手指来重新体验它们。


首先简单复习上节课的内容：


高级语言经过编译后，最终函数调用通过为其开辟栈帧来实现


开辟栈帧的动作是编译器加进去的，高级语言程序员不用在意


函数栈帧中首先是函数的局部变量，局部变量后面存放着函数返回地址


当前被调用的子函数返回时，会从它的栈帧底部取出返回地址，并跳转到那个位置（母函数中）继续执行母函数


我们这节课的思路是，让溢出数组的数据跃过authenticated，一直淹没到返回地址，把这个地址从main函数中分支判断的地方直接改到密码验证通过的分支！


这样当verify_password函数返回时，就会返回到错误的指令区去执行（密码验证通过的地方）



由于用键盘输入字符的ASCII表示范围有限，很多值如
				0x11
				，
				0x12
				等符号无法直接用键盘输入，所以我们把用于实验的代码在第二讲的基础上稍加改动，将程序的输入由键盘改为从文件中读取字符串。


				#include 
				<
				stdio
				.
				h
				>

				#define 
				PASSWORD 
				"1234567"

				int 
				verify_password 
				(
				char 
				*
				password
				)

{

  
				int 
				authenticated
				;

  
				char 
				buffer
				[
				8
				];

  
				authenticated
				=
				strcmp
				(
				password
				,
				PASSWORD
				);

  
				strcpy
				(
				buffer
				,
				password
				);
				//over flowed here!  

  
				return 
				authenticated
				;

}

				main
				()

{

  
				int 
				valid_flag
				=
				0
				;

  
				char 
				password
				[
				1024
				];

  
				FILE 
				* 
				fp
				;

  
				if
				(!(
				fp
				=
				fopen
				(
				"password.txt"
				,
				"rw+"
				)))

  {

    
				exit
				(
				0
				);

  }

  
				fscanf
				(
				fp
				,
				"%s"
				,
				password
				);

  
				valid_flag 
				= 
				verify_password
				(
				password
				);

  
				if
				(
				valid_flag
				)

  {

    
				printf
				(
				"incorrect password!\n"
				);

  }

  
				else

  
				{

    
				printf
				(
				"Congratulation! You have passed the verification!\n"
				);

  }

  
				fclose
				(
				fp
				);

}


  
				程序的基本逻辑和第二讲中的代码大体相同，只是现在将从同目录下的password
				.
				txt文件中读取字符串而不是用键盘输入。我们可以用十六进制的编辑器把我们想写入的但不能直接键入的ASCII字符写进这个password
				.
				txt文件。

  

  用VC6
				.0
				将上述代码编译链接。我这里使用默认编译选项，BUILD成debug版本。鉴于有些同学反映自己的用的是VS2003和VS2005，我好人做到底，把我build出来的PE一并在附件中双手奉上——没话说了吧！不许不学，不许学不会，不许说难，不许不做实验！呵呵。


要PE的点这里： stack_overflow_ret
				.
				rar




在与PE文件同目录下建立password
				.
				txt并写入测试用的密码之后，就可以用OllyDbg加载调试了。


停～～～啥是OllyDbg，开玩笑，在这里问啥是Ollydbg分明是不给看雪老大的面子么！如果没有这个调试器的话，去工具版找吧，帖子附件要挂出个OD的话会给被人鄙视的。


  在开始动手之前，我们先理理思路，看看要达到实验目的我们都需要做哪些工作。


  要摸清楚栈中的状况，如函数地址距离缓冲区的偏移量，到底第几个字节能淹到返回地址等。这虽然可以通过分析代码得到，但我还是推荐从动态调试中获得这些信息。

  要得到程序中密码验证通过的指令地址，以便程序直接跳去这个分支执行

  要在password
				.
				txt文件的相应偏移处填上这个地址


  这样verify_password函数返回后就会直接跳转到验证通过的正确分支去执行了。



  首先用OllyDbg加载得到的可执行PE文件如图：


				
						

图
				1  




  
				阅读上图中显示的反汇编代码，可以知道通过验证的程序分支的指令地址为
				0x00401122
				。


简单解释一下这段汇编与C语言的对应关系，其实凭着OD给出的注释，就算你没学过汇编语言，读懂也应该没啥问题。


				0x00401102
				处的函数调用就是verify_password函数，之后在
				0x0040110A
				处将EAX中的函数返回值取出 ，在 
				0x0040110D
				处与
				0
				比较，然后决定跳转到提示验证错误的分支或提示验证通过的分支。提示验证通过的分支从
				0x00401122
				处的参数压栈开始。


啥？用OllyDbg加载后找不到verify_password函数的位置？这个嘛，我这里只说一次啊。


OllyDbg在默认情况下将程序中断在PE装载器开始处，而不是main函数的开始。如果您有兴趣的话可以按F8单步跟踪一下看看在main函数被运行之前，装载器都做了哪些准备工作。一般情况下main函数位于GetCommandLineA函数调用后不远处，并且有明显的特征：在调用之前有
				3
				次连续的压栈操作，因为系统要给main传入默认的argc、argv等参数。找到main函数调用后，按F7单步跟入就可以看到真正的代码了。


我相信你，你一定行的，找到了吗？什么？还找不到？好吧，按ctr
				+
				g后面输入截图中的地址
				0x00401102
				，这回看到了吧。建议你按F2下个断点记住这个位置，别一会儿又在PE里边迷路了。


这步完成后，您应该对这个PE的主要代码有了一个把握了。这才牙长一点指令啊，真正的漏洞要对付的是软件，那个难缠～～～好，不泼冷水了


如果我们把返回地址覆盖成这个地址，那么在
				0x00401102 
				处的函数调用返回后，程序将跳转到验证通过的分支，而不是进入
				0x00401107
				处分支判断代码。这个过程如下图所示：


  

				
						

图
				2




  
				通过动态调试，发现栈帧中的变量分布情况基本没变。这样我们就可以按照如下方法构造password
				.
				txt中的数据：


  仍然出于字节对齐、容易辨认的目的，我们将“
				4321
				”作为一个输入单元。


  buffer
				[
				8
				]
				共需要
				2
				个这样的单元

  第
				3
				个输入单元将authenticated覆盖

  第
				4
				个输入单元将前栈帧EBP值覆盖

  第
				5
				个输入单元将返回地址覆盖


  为了把第
				5
				个输入单元的ASCII码值
				0x34333231
				修改成验证通过分支的指令地址
				0x00401122
				，我们采取如下方式借助
				16
				进制编辑工具UltraEdit来完成（
				0x40
				，
				0x11
				等ASCII码对应的符号很难用键盘输入）。

  

  步骤
				1
				：创建一个名为password
				.
				txt的文件，并用记事本打开，在其中写入
				5
				个“
				4321
				”后保存到与实验程序同名的目录下：

 

				
						

图
				3




				步骤
				2
				：保存后用UltraEdit_32重新打开，如图：

 


				
						

图
				4



				啥？问啥是UltraEdit？去工具版找吧，多的不得了，这里是看雪！



步骤
				3
				：将UltraEdit_32切换到
				16
				进制编辑模式，如图：

 

				
						

图
				5


				步骤写到这个份上了，您不会还跟不上吧。



  步骤
				4
				：将最后四个字节修改成新的返回地址，注意这里是按照“内存数据”排列的，由于“大顶机”的缘故，为了让最终的“数值数据”为
				0x00401122
				，我们需要逆序输入这四个字节。如图：

 

				
						

图
				6




				步骤
				5
				：这时我们可以切换回文本模式，最后这四个字节对应的字符显示为乱码：

 

				
						

图
				7




				最终的password
				.
				txt我也给你附上。


要txt的点这里：  password
				.
				txt


将password
				.
				txt保存后，用OllyDbg加载程序并调试，可以看到最终的栈状态如下表所示：


局部变量名  内存地址  偏移
				3
				处的值  偏移
				2
				处的值  偏移
				1
				处的值  偏移
				0
				处的值

buffer
				[
				0
				~
				3
				]  
				0x0012FB14  0x31 
				(
				‘
				1
				’
				)  
				0x32 
				(
				‘
				2
				’
				)  
				0x33 
				(
				‘
				3
				’
				)  
				0x34 
				(
				‘
				4
				’
				)

				buffer
				[
				4
				~
				7
				]  
				0x0012FB18  0x31 
				(
				‘
				1
				’
				)  
				0x32 
				(
				‘
				2
				’
				)  
				0x33 
				(
				‘
				3
				’
				)  
				0x34 
				(
				‘
				4
				’
				)

				authenticated

（被覆盖前）  
				0x0012FB1C  0x00  0x00  0x00  0x01

				authenticated

（被覆盖后）  
				0x0012FB1C  0x31 
				(
				‘
				1
				’
				)  
				0x32 
				(
				‘
				2
				’
				)  
				0x33 
				(
				‘
				3
				’
				)  
				0x34 
				(
				‘
				4
				’
				)

				前栈帧EBP

（被覆盖前）  
				0x0012FB20  0x00  0x12  0xFF  0x80

				前栈帧EBP

（被覆盖后）  
				0x0012FB20  0x31 
				(
				‘
				1
				’
				)  
				0x32 
				(
				‘
				2
				’
				)  
				0x33 
				(
				‘
				3
				’
				)  
				0x34 
				(
				‘
				4
				’
				)

				返回地址

（被覆盖前）  
				0x0012FB24  0x00  0x40  0x11  0x07

				返回地址

（被覆盖后）  
				0x0012FB24  0x00  0x40  0x11  0x22



				程序执行状态如图：


				
						

						

  由于栈内EBP等被覆盖为无效值，使得程序在退出时堆栈无法平衡，导致崩溃。虽然如此，我们已经成功的淹没了返回地址，并让处理器如我们设想的那样，在函数返回时直接跳转到了提示验证通过的分支。



同学们，你们成功了么？


最后再总结一下这个实验的内容：

通过Ollydbg调试PE文件确定密码验证成功的分支的指令所处的内存地址为
				0x00401122

				通过调试确定buffer数组距离栈帧中函数返回地址的偏移量

在password
				.
				txt相应的偏移处准确的写入
				0x00401122
				，当password
				.
				txt被读入后会同样准确的把verify_password函数的返回地址从分支判断处修改到
				0x00401122
				（密码正确分支）

函数返回时，笨笨的返回到密码正确的地方

程序继续执行，但由于栈被破坏，不再平衡，故出错


试想一下，如果我们在buffer
				[]
				中填入一些可执行的机器码，然后用溢出的数据把返回地址指向buffer
				[]
				，那么函数返回后这些代码是不是就会执行了？


答案是肯定的，下一讲我将用类似的叙述方式，同样手把手的和您一起完成这段机器代码的编写，并把它们准确的布置在password
				.
				txt中，这样原本用来读取密码文件的程序读了这样一个精心构造的“黑文件”之后，就会做出一些“出格”的事情了。


明天见，顺便说一下，我一般会在凌晨
				1
				点左右发文，想坐沙发的同学注意了呦。
发表于 2007-12-28 15:39 009 阅读(1533) 评论(0) 编辑收藏所属分类: 系统编程、黑客技术
公告

常用链接

留言簿(113)

随笔分类

随笔档案

文章分类

相册

Link

搜索

最新评论

阅读排行榜

评论排行榜

酒水不犯茶水叶的离去，是风的追求还是树的不挽留？
BlogJava \| 首页 \| 发新随笔 \| 发新文章 \| 联系 \| 聚合 \| 管理	随笔：326 文章：0 评论：612 引用：0