hgc-ghc
Good Good Study!!! Day Day Up!!!
posts - 40,comments - 3,trackbacks - 0

Oracle大数据量数据生成器Data Generator的使用

首先测试环境建立:dept表

CREATETABLE dept

      ( deptno   NUMBER(6),

        dname    VARCHAR2(20),

        loc       VARCHAR2(20));

    以下实验就是像dept表中插入大量的数据。

数据生成器允许创建演示和测试数据。对于测试应用程序和查看它们怎样执行大量的数据,这很有帮助的。可以在PL/SQL Developer的工具菜单的下面找到数据生成器:Data Generator。 

基本上,定义由一个或多个表、要生成的记录数量和字段数据定义构成。左上部的按钮允许打开和保存定义。

 

在上面,可以看到提供的 dept演示,这个演示是为 dept表创建数据。在这一页中,发现有下列项目: 

          •表 表的名称。 

          •记录数 要生成的记录数。这可以是数字,也可以是象 10..100 这样的范围。 

          •名称 字段名称。 

          •类型 字段的数据类型。 

          •大小 字段大小(在适当时)。对于数字字段,这将是数值范围、精度。 

          •数据 字段数据的定义(见下面)。 

          •主列 如果这个表是另一个表的明细,可以设置主列。对于每个已产生的记录,指定数量的明细记录将被生成。 

我们可以使用添加现有表按钮来添加一个现有的表,还可以从对象浏览器中拖放一个表。 

数据定义 

数据定义决定了被生成的数据。如果要创建简单的字符,可以在两个方括号之间输入字符定义:[数据]

数据可以是下列预先确定的集的混合体: 

          •  a: a..z (小写字符) 

          •  A: A..Z (大写字符) 

          •  @: A..Z 和 a..z (所有字符) 

          •  #: A..Z 和 a..z 和 0..9 (所有字符和数字) 

          •  *: #33..#126 (所有 ASCII 字符) 

          •  0: 0..9 (所有数字) 

          •  1: 1..9 (所有除了 0 之外的数字) 

          •  9: 0..9 (所有数字) 

 

例如: 

[Aaa00] 生成字符串如: Gxe21,Liy05 等。 

还可以在两个单引号之间添加文字文本。 

例如: 

[AA '-' 1000] 生成字符串如:CX-4903 ,SY-1044 等。 

在定义中空格字符是被忽略的,除非它们在引号中。 

如果要一个字符重复许多次,可以在字符的后面两个括号之间添加次数(n)。还可以添加一个随机数(最小..最大)。 

例如: 

[Aa(5..15) ' ' Aa(8..20)] 的结果就象这样:"Masfae Qwwecdsadif" 

定义中的文字文本不必被装入到括号中。换句话说,['hello'] 和 'hello' 是等效的。不带引号被输入的文本被认为是函数。 

有几个特定的函数是可用的: 

          •Signal(Min, Max, Delta, Noise) 返回技术测定数据(象温度这样的)。Min(最小)和 Max(最大)决定了范围, Delta(△)为最大更改量,还可以添加一些 Noise(噪声)。例如:Signal(-10, 20, 0.1, 0.1)。 

          •Random([Min], Max) 返回Min(最小)和 Max(最大)之间的随机数。如果只指定了 Max ,那么 Min 就被设为 0 。对于日期字段,可以输入Min(最小)和 Max(最大)的日期。 

          •Sequence(Start, [Inc], [WithinParent]) 返回序号。Start 为开始值,Inc 为增量(默认为 1)。对于明细表,可以再指定 WithinParent 关键词来指出序列应该为每个父记录进行重新安排。 

          •List('item'(weight), 'item'(weight), ...) 随机地返回指定项目(item)之一。加权数(weight)可以被添加到两个括号之间,允许特定项目比其他项目出现的几率更大。 例如:List('CLERK'(50), 'SALESMAN'(30), 'MANAGER'(10)) 

•List(select statement) 象前面的 List 函数,但项目是通过 SQL select statement(select 语句)返回的。 

• Text([Style], MaxCharacters, [WordsPerLine, LinesPerParagraph]) 这个函数返回文本。可选择的 Style(字体)参数可以是 LorumIpsum(默认)(怀疑是荷兰语。——译者姜华东注)、英语、德语或日语。它还可以是象 [aA] 这样的字符集,在这种情况下,词汇从指定的字符集中产生。 MaxCharacters 决定了生成的文本的最大大小,WordsPerLine 和 LinesPerParagraph 决定了行和段落的大小。指定的大小可以是指定的数字或范围(最小..最大)。 

 File(path, path, ...) 从特定的路径(path)中随机地选择一个文件,并插入内容。允许输入二进制数据(象图片这样的)到数据库中。路径可以使用通配符,象 d:\images\*.bmp 这样的。 

可以通过使用下列函数更改前面函数的文本结果: 

          •Uppercase() 

          •LowerCase() 

          •InitCaps() 

例如:InitCaps( List(select ename from emp) ) 

还有几个预先定义的数据集可用于生成或多或少的真实数据。可以使用下列定义: 

          •Firstname 一般列表中的名 

          •Lastname 一般列表中的姓 

          •Company 公司名(现有公司的随机列表) 

          •Address1 地址行 1 

          •Address2 地址行 2 

          •ZIP 邮政编码 

          •City 城市 

          •State 省 

          •Country 国家 

          •Email (被关联到 Firstname ,Lastname 和 Country) 

还有一些可用的实例自定义数据集: 

          •Components.Code 一般商品项目:商品代码 

          •Components.Description 商品描述(计算机部分) 

          •Components.Price 商品价格 

          •Elements.Name 化学元素(名称) 

          •Elements.Symbol 化学元素(符号) 

这些数据集可以在 DataGenerator\UserData 目录中被找到,文件名为elements.txt 和 components.txt 。如果需要,可以添加自己的集。添加一个逗号分隔的文件很简单,在文件中第一行两个方括号之间保存着描述。可以通过指定文件名.描述来使用的文件中的数据,就象两个例子那样。

上面提及的所有函数和数据都可以添加到一起,例如:Random(10..99) + '-' + [A(4)] 。 +是可选的,但那中至少应该有一个空格作为分隔符。 

 

选项 

选项标签页允许设置一些首选项,特别是数据生成器的定义。可以指定一个日期的格式(与被 Random 函数使用的例子一样)。还可以指定在多少条记录之后需要提交(设为 0 是一完成就提交)。延迟首选项仅仅用于一些实时测试,这中需要数据以指定的速度被插入。

 

自定义部分允许定义或越过被用于 [数据] 定义的字符集。项目总是单个字符,值是一个或多个空格分隔的字符范围,就象这样:A..Z a..z 0..9 #200..#220 。例如,要定义一个十六进制的字符集,可以指定 H 为项目,0..9 A..F 为值。 

初始化脚本部分允许指定在数据被插入到数据库中前应该被执行的 SQL 语句。在典型的情况下,这将是创建表或截短表、选择回滚段等的语句。多个语句需要用分号来分隔。 

通过按左边首选项按钮,在默认的情况下,对于所有数据生成器的一般选项可以被定义。如果数据生成器定义中相应的首选项也被设置了,这些首选项将被否决。 

 

生成数据 

在左下方有三个按钮可用于生成实际的数据: 

          •开始测试运行 这将在结果标签页上的表格中生成数据和显示结果。通过右键单击表格,可以以不同的格式导出这些结果。 

          •创建数据为 SQL 生成数据为 SQL 脚本。这仅仅工作于不用文件功能添加来自文件的数据的情况下。 

•在数据库中创建数据 生成数据到 Oracle 数据库中。
===================================================================================================================

注:该文并非完全原创,主要来源

http://www.cnblogs.com/Automation_software/archive/2011/01/27/1946366.html

Tools/Data Generator/

界面

数据定义

数据定义决定了被生成的数据。如果要创建简单的字符,可以在两个方括号之间输入字符定义:[数据]

数据可以是下列预先确定的集的混合体:

            a: a..z (小写字符)

            A: A..Z (大写字符)

            @: A..Z  a..z (所有字符)

            #: A..Z  a..z  0..9 (所有字符和数字)

            *: #33..#126 (所有 ASCII 字符)

            0: 0..9 (所有数字)

            1: 1..9 (所有除了 0 之外的数字)

            9: 0..9 (所有数字)

 例如:

[Aaa00] 生成字符串如: Gxe21Liy05 等。

还可以在两个单引号之间添加文字文本。

例如:

[AA '-' 1000] 生成字符串如:CX-4903 SY-1044 等。

在定义中空格字符是被忽略的,除非它们在引号中。

如果要一个字符重复许多次,可以在字符的后面两个括号之间添加次数(n)。还可以添加一个随机数(最小..最大)

例如:

[Aa(5..15) ' ' Aa(8..20)] 的结果就象这样:"Masfae Qwwecdsadif"

定义中的文字文本不必被装入到括号中。换句话说,['hello']  'hello' 是等效的。不带引号被输入的文本被认为是函数。

有几个特定的函数是可用的:

          Signal(Min, Max, Delta, Noise) 返回技术测定数据(象温度这样的)。Min(最小)和 Max(最大)决定了范围, Delta(△)为最大更改量,还可以添加一些 Noise(噪声)。例如:Signal(-10, 20, 0.1, 0.1)

          Random([Min], Max) 返回Min(最小)和 Max(最大)之间的随机数。如果只指定了 Max ,那么 Min 就被设为 0 。对于日期字段,可以输入Min(最小)和 Max(最大)的日期。

          Sequence(Start, [Inc], [WithinParent]) 返回序号。Start 为开始值,Inc 为增量(默认为 1)。对于明细表,可以再指定WithinParent 关键词来指出序列应该为每个父记录进行重新安排。

          List('item'(weight), 'item'(weight), ...) 随机地返回指定项目(item)之一。加权数(weight)可以被添加到两个括号之间,允许特定项目比其他项目出现的几率更大。 例如:List('CLERK'(50), 'SALESMAN'(30), 'MANAGER'(10))

List(select statement) 象前面的 List 函数,但项目是通过 SQL select statementselect 语句)返回的。

 Text([Style], MaxCharacters, [WordsPerLine, LinesPerParagraph]) 这个函数返回文本。可选择的 Style(字体)参数可以是LorumIpsum(默认)(怀疑是荷兰语。——译者姜华东注)、英语、德语或日语。它还可以是象 [aA] 这样的字符集,在这种情况下,词汇从指定的字符集中产生。 MaxCharacters 决定了生成的文本的最大大小,WordsPerLine  LinesPerParagraph 决定了行和段落的大小。指定的大小可以是指定的数字或范围(最小..最大)。

 File(path, path, ...) 从特定的路径(path)中随机地选择一个文件,并插入内容。允许输入二进制数据(象图片这样的)到数据库中。路径可以使用通配符像 d:\images\*.bmp 这样的。

可以通过使用下列函数更改前面函数的文本结果:

          Uppercase()

          LowerCase()

          InitCaps()

例如:InitCaps( List(select ename from emp) )

还有几个预先定义的数据集可用于生成或多或少的真实数据。可以使用下列定义:

          Firstname 一般列表中的名

          Lastname 一般列表中的姓

          Company 公司名(现有公司的随机列表)

          Address1 地址行 1

          Address2 地址行 2

          ZIP 邮政编码

          City 城市

          State 

          Country 国家

          Email (被关联到 Firstname Lastname  Country

还有一些可用的实例自定义数据集:

          Components.Code 一般商品项目:商品代码

          Components.Description 商品描述(计算机部分)

          Components.Price 商品价格

          Elements.Name 化学元素(名称)

          Elements.Symbol 化学元素(符号)

这些数据集可以在 DataGenerator\UserData 目录中被找到,文件名为elements.txt  components.txt 。如果需要,可以添加自己的集。添加一个逗号分隔的文件很简单,在文件中第一行两个方括号之间保存着描述。可以通过指定文件名.描述来使用的文件中的数据,就象两个例子那样。

上面提及的所有函数和数据都可以添加到一起,例如:Random(10..99) + '-' + [A(4)]  +是可选的,但那中至少应该有一个空格作为分隔符。

 

自定义部分允许定义或越过被用于 [数据定义的字符集。项目总是单个字符,值是一个或多个空格分隔的字符范围,就象这样:A..Z a..z 0..9 #200..#220 。例如,要定义一个十六进制的字符集,可以指定 H 为项目,0..9 A..F 为值。

初始化脚本部分允许指定在数据被插入到数据库中前应该被执行的 SQL 语句。在典型的情况下,这将是创建表或截短表、选择回滚段等的语句。多个语句需要用分号来分隔。

通过按左边首选项按钮,在默认的情况下,对于所有数据生成器的一般选项可以被定义。如果数据生成器定义中相应的首选项也被设置了,这些首选项将被否决。

 

生成数据

在左下方有三个按钮可用于生成实际的数据:

          •开始测试运行 这将在结果标签页上的表格中生成数据和显示结果。通过右键单击表格,可以以不同的格式导出这些结果。

          •创建数据为 SQL 生成数据为 SQL 脚本。这仅仅工作于不用文件功能添加来自文件的数据的情况下。

•在数据库中创建数据 生成数据到 Oracle 数据库中。

选项

选项标签页允许设置一些首选项,特别是数据生成器的定义。可以指定一个日期的格式(与被 Random 函数使用的例子一样)。还可以指定在多少条记录之后需要提交(设为 0 是一完成就提交)。延迟首选项仅仅用于一些实时测试,这中需要数据以指定的速度被插入。有时候反复的设置还是挺麻烦的保存一下

重点:生成date类型

Date类型是这里的特例难以生成,如果生成固定格式可以拼接起来。如:Sequence(2011,0,1)'-'Sequence(03,0,1)'-'Sequence(01,0,1),插入指定的日期。Data Generator插入的日期格式会自动转换成默认dd-mm-yyyy格式。

可以事先设置时间生成格式

近似随机日期生成:

Signal(1990, 2013,23, 0) '/' Signal(1, 12,12, 0) '/' Signal(1, 31,31, 0) ' 'Signal(00, 23,23, 0) ':' Signal(00, 59,59, 0) ':' Signal(00, 59,59, 0)勉强可以模拟随机形成 yyyy-mm-dd HH:MI:SS”类型的的字符串(还有缺陷就是每个月都有31号,比如会形成1998/2/31,这样生成的sql语句有可能不会自动转换为时间类型)

Random(Min, Max)方法无法拼接,每个返回值会先强制转换成date类型再拼接。

posted on 2013-04-24 14:04 宏才 阅读(1054) 评论(0)  编辑  收藏 所属分类: 数据库相关