Informatica PowerCenter是世界级的企业数据集成平台,它在ETL领域中无论是执行能力还是战略远见方面都是佼佼者,是Informatica的核心产品。
1. Joiner组件跟Source Qualifier组件
Source Qualifier可实现N个同构的数据源关联,Joiner组件可实现2个异构的数据源关联。前者只能关联同构数据,是在源数据库中实现关联;后者也可关联同构数据,但主要是用来关联异构数据源,关联操作是在Informatica缓存中实现的。 N个异构数据源,需要N-1个Joiner组件实现关联。
2. Source Qualifier和Filter组件
Source Qualifier 用来从源表和源文件中抽取数据,它只能用来过滤源表的数据,而无法过滤文本的数据。为了提高性能,需尽量在Source Qualifier中将数据过滤掉。
Filter是用来过滤已经被Informatica读取过来的数据,针对文本文件只能使用Filter组件实现数据过滤。
3. lookup组件的两种用法
Cached Lookup 和 uncached Lookup缺省是cached lookup cached首先将记录读到内存中,如果lookup关联表的数据量比较大,如100万条记录以上,不推荐用cached lookup. cached估算:lookup数据量乘以字节数。
4. reusable组件 一次定义 多次使用。
5. 列到行转换用Normalizer组件。
6. 行到列转换 汇总用Transformation组件。