教你如何分析未文档化的数据结构
原始连接:http://www.x86asm.com/DisplayArticle.asp?BoardID=3&ArticleID=108
Editor:admin Time:2005-8-20 23:22 Read:9985 Score:8 Print
Writer:HSLY
Excerpt:80x86汇编小站
[标题] 教你如何分析未文档化的数据结构
[作者] hsly110 或者 猪头三
[个人网站] http://www.x86asm.com 80x86汇编小站
[Email] pliceman_110@163.com PS:本文如果有错漏请来信指出
[范围] 逆向工程
[目的] 分享逆向技术心德
[目标API] 未文档化的RtlInitializeGenericTable
[参考文献] Secrets of Reverse Engineering
[备注] 欢迎转载该文章,只要保留完整内容即可
2005-08-20 撰写
2005-08-21 修正
2005-08-23 修正
------------------------------------------------------
1 前言:
这2天看了Secrets of Reverse Engineering一书,对分析未文档化的API的技术比较有心得,希望各位看了下面的教程,能抛砖引玉灵活的应用在逆向工程和破解技术上,方法是死的,但是人的思维是活,最重要是灵活应用。
2 实践:
用OllyDbg对NTDLL.DLL进行反汇编,前提你要加入NTDLL.DLL的符号表,这样你才能更好的对未文档化的API进行反汇编,你们到微软官方网站获取相应版本Windows系统的系统符号表。
下面是RtlInitializeGenericTable函数的反汇编代码:
01 MOV EDI, EDI ;
//压入堆栈,保存EBP的数值
02 PUSH EBP ;
03 MOV EBP, ESP ;
// 获取[ESP+8]的数值传入EAX
// 此处指令我们可以翻译为:
// MOV EAX, DWORD PTR SS:[ESP+8]
// 含义: 把当前堆栈顶向下偏移8h处的值赋给EAX,也就是该函数的第1个参数
// 声明:我喜欢用ESP指针来想象堆栈。但是CPU处理的话,是用EBP来进行偏移处理
04 MOV EAX, DWORD PTR SS:[EBP+8] ;
05 XOR EDX, EDX ;
// EAX+4的数值当作指针传入ECX
06 LEA ECX, DWORD PTR DS:[EAX+4] ;
// EDX的数值传入[EAX],说明EAX的值是某个结构的指针
// 假设pUnknowStruct的地址为 EAX的数值
// 07的汇编指令对应的C语言: pUnknowStruct->member1 = 0 ;
07 MOV DWROD PTR DS:[EAX], EDX ;
// 此处指令我们可以翻译为:
// MOV DWORD PTR DS:[EAX+8], EAX+4 ;
// 备注: [EAX] 为某结构的第1个变量
// [EAX+4]为某结构的第2个变量
// [EAX+8]为某结构的第3个变量
// 含义:该结构的第3个成员变量被赋于指向该结构的第2个成员变量的指针数值
// 08的汇编指令对应的C语言: pUnknowStruct->member3 = &pUnknowStruct->member2
08 MOV DWORD PTR DS:[ECX+4], ECX ;
// 此处指令我们可以翻译为:
// MOV DWORD PTR DS:[EAX+4], EAX+4 ;
// 09的汇编指令对应的C语言: pUnknowStruct->member2 = &pUnknowStruct->member2
09 MOV DWORD PTR DS:[ECX], ECX ;
// 此处指令我们可以翻译为:
// MOV DWORD PTR DS:[EAX+C], EAX+4 ;
// 10的汇编指令对应的C语言: pUnknowStruct->member4 = &pUnknowStruct->member2
10 MOV DWORD PTR DS:[EAX+C], ECX ;
// 此处指令我们可以翻译为:
// MOV ECX, DWORD PTR SS:[ESP+C]
// 含义: 把当前堆栈顶向下偏移Ch处的值赋给ECX,也就是该函数的第2个参数
11 MOV ECX, DWORD PTR SS:[EBP+C] ;
// 含义: 把第2个参数传送给某结构的第7个成员变量
// 12的汇编指令对应的C语言为: pUnknowStruct->member7 = Param2
12 MOV DWORD PTR DS:[EAX+18], ECX ;
// 此处指令我们可以翻译为:
// MOV ECX, DWORD PTR SS:[ESP+10]
// 含义: 把当前堆栈顶向下偏移10h处的值赋给ECX,也就是该函数的第3个参数
13 MOV ECX, DWORD PTR SS:[EBP+10] ;
// 含义:把参数3传给某结构的第8个成员变量
// 14的汇编指令对应的C语言为: pUnknowStruct->member8 = Param3
14 MOV DWORD PTR DS:[EAX+1C], ECX ;
// 此处指令我们可以翻译为:
// MOV ECX, DWORD PTR SS:[ESP+14]
// 含义: 把当前堆栈顶向下偏移14h处的值赋给ECX,也就是该函数的第4个参数
15 MOV ECX, DWORD PTR SS:[EBP+14] ;
// 含义:把参数3传给某结构的第9个成员变量
// 16的汇编指令对应的C语言为: pUnknowStruct->member9 = Param4
16 MOV DWORD PTR DS:[EAX+20], ECX ;
// 此处指令我们可以翻译为:
// MOV ECX, DWORD PTR SS:[ESP+18]
// 含义: 把当前堆栈顶向下偏移18h处的值赋给ECX,也就是该函数的第5个参数
17 MOV ECX, DWORD PTR SS:[EBP+18] ;
// 含义:把EDX的数值赋给某结构的第6个成员变量
// 18的汇编指令对应的C语言为: pUnknowStruct->member6 = 0
18 MOV DWORD PTR DS:[EAX+14], EDX ;
// 含义:把EDX的数值赋给某结构的第6个成员变量
// 19的汇编指令对应的C语言为: pUnknowStruct->member5 = 0
19 MOV DWORD PTR DS:[EAX+10], EDX ;
// 含义:把参数5传给某结构的第10个成员变量
// 29的汇编指令对应的C语言为: pUnknowStruct->member10 = Param5
20 MOV DWORD PTR DS:[EAX+24], ECX ;
21 POP EBP
22 RET 14
3 逆出伪代码:
说明: 反汇编分析出如下关键指令
04 MOV EAX, DWORD PTR SS:[EBP+8] ;
11 MOV ECX, DWORD PTR SS:[EBP+C] ;
13 MOV ECX, DWORD PTR SS:[EBP+10] ;
15 MOV ECX, DWORD PTR SS:[EBP+14] ;
17 MOV ECX, DWORD PTR SS:[EBP+18] ;
可以看得出,该函数使用了5个参数,可以假设为: Param1...5 ;
struct UnknowStruct
{
UNKNOWN Member1 ;
UNKNOWN_PTR Member2 ;
UNKNOWN_PTR Member3 ;
UNKNOWN_PTR Member4 ;
UNKNOWN Member5 ;
UNKNOWN Member6 ;
UNKNOWN Member7 ;
UNKNOWN Member8 ;
UNKNOWN Member9 ;
UNKNOWN Member10 ;
} ;
struct UnknowStruct *pUnknowStruct ;
pUnknowStruct = Param1 ;
pUnknowStruct->Member1 = 0 ;
pUnknowStruct->Member3 = &pUnknowStruct->Member2 ;
pUnknowStruct->Member2 = &pUnknowStruct->Member2 ;
pUnknowStruct->Member4 = &pUnknowStruct->Member2 ;
pUnknowStrcut->Member7 = Param2 ;
pUnknowStruct->Member8 = Param3 ;
pUnknowStruct->Member9 = Param4 ;
pUnknowStruct->Member6 = 0
pUnknowStruct->Member5 = 0
pUnknowStruct->Member10 = Param5 ;
4: 图片分析流程
获取参数流程图
结构赋值流程图
5:总结
经过反汇编分析,虽然只有22行代码,但是完成了这个结构的初始化工作,该结构的指针存放在EAX寄存器,赋值时,就是对EAX存放的地址进行偏移处理。大家可以查看流程图来思考一下。
6:遗憾
由于时间有限,未能写出下一篇: 教你如何分析结构成员变量的类型
我尽量吧~~~~~~~工作太忙了!