oracle数据库空间估算
如何计算存储空间,整理了一下
我们在设计一个数据库的时候除了考虑数据块的大小,可能还要和开发沟通,这个数据库要存储多少数据,那么这个数据库应该具备多大的容量来满足一个应用的存储呐?DBA就需要计算一下这个应用占用多大的存储空间
首先我们来看一下几个换算的单位:
1K=1024Bytes;
1M=1024K
1G=1024M
1T=1024G
而我们的表里一个字段能占用多大的空间呐?我们先看一下字段的类型:
1. 变成:number(),varchar2 (),long ,blob等都是变成 (单位都是Bytes)
2. 定长:date (7bytes) ,char()
根据经验:
1.对于变长字段的处理:
我们在估算一行所占用空间的时候只能是取最大值,比如x number(20),这个字段,我们不管插入x列里的内容是否真正的满足20个bytes,我们都按照20来计算;
2.对于定长字段的处理:
这个就直接取实际长度就ok了;
具个例子来计算一下平均行占用的存储空间:
Create table test (x number(20),y varchar2(20),z date ,char(20));
那么这个表平均每行最大使用的空间为:
(20+20+7+20)=67 (Bytes)
假设这个表里有20000000条数据,那么这个表所使用的净空间(pur_stroage)为:
(20+20+7+20)*20000000 (Bytes)=1278M
但是ORACLE在组织存储的时候是有空间结构的,oracle要把一部分空间分配给数据库作为结构存储(str_storage),不会把所有的空间都分配给我们用来数据存储,这么大的数据量我们要给多少真正的存储空间(real_stroage)?
我们可以用下边这个简单的公式来计算:
real_stroage= str_storage+ pur_stroage
上边这个公式中,我们已知了pur_stroage 要求出real_stroage就需要知道str_storage,ok现在我们来了解一下每个块的存储形式下图是个block的结构图
_______________________________________________________________________
| | |
| 1fixed | |
| header | |
|___________| |
| | |
| 2. variable | |
| trans_header | 5- available_block |
|___________ | |
| | |
| 3.table dir | |
| | |
|___________| |
| | |
| 4.row dir | |
| | |
|___________|___________________________________________________________|
1-4部分组成了一个数据块的块头(block_header)
5 是数据块的块身(block_body)
一个一个说吧:
1. 定长的数据块头 57bytes
2. 块中事务并发使用空间,这个值是有可能变化的,如果多个事务并发,那么这个块的大小会发生改变,一个事务是23*1 bytes,2个事务是23*2 bytes,依次类推,一般我们计算的似乎后按照23*1来计算
3. 使用块的表 4 bytes
4. 使用块的行 2 *n bytes 这个块的列使用情况在于有多少行如果有4行数据存储在这个块里那么n=4
5. 才是表和索引能使用的存储空间
那么是不是5里的空间我们能够完全使用呐?
非也,拿上边的例子来说吧,假设有一行数据里test.x里存储的数值是1,这个时候有一个语句来执行:
Update test set x=100000000,而恰好这个时候此行数据所在的block满了怎么办?
Oracle为了避免这种情况的发生,引入了两个概念:
PCTUSED和PCTFREE,这两个值相当于2个水位线,我们拿一个杯子来比喻数据块,那么PCTUSED控制这个杯子什么时候可以继续倒水;而PCTUSED表示什么时候这个杯子不能再倒水了
假设PCTUSED设置成了6,PCTFREE设置成了2 ,那么它就表示,当一个杯子达到了60%空的时候可以再继续使用,当杯子的水达到80%的时候就不能再倒水了,而这个值全部都记录在数据块的freelist列表里;
所以可见,5里的初次使用率最高也不会超过available_block*PCTFREE
str_storage=(fix_header+trans_header+table_dir+row_dir*N)*pctfree/10
real_stroage= str_storage+ pur_stroage
=(fix_header+trans_header+table_dir+row_dir*N)*pctfree/10+(20+20+7+20)* N
N=该表里的数据量
当然这个值所求出来的也是个近似的值;
posted on 2009-11-10 09:05
xnabx 阅读(751)
评论(0) 编辑 收藏