选择正确的整合工具
每次我谈到EII(enterprise information integration,企业信息整合)工具,人们都对EII工具在整合领域的地位感到迷惑。
人们通常都会问:
1) 这是否是整合领域的又一个促销的时髦词汇?
2) 你们要解决什么问题?
3) 我知道有一些成熟的整合产品,为什么我要使用新工具呢?(他们是指EAI(enterprise application integration,企业应用整合)、ETL(extract, transform and load,数据的抽取、转换和装载)工具等等)
依我看,大多数企业都抱有这3个疑问。但是软件领域有其特定的发展方式,5年前的范例解决方案如今可能已经成为最坏的解决方案,这使我们只能选择当前可用的最好的解决方案。
ETL工具的出现解决了数据管理领域的一个非常让人头痛的问题——从多个数据源提取数据。这些工具进行增量比较,并以批模式将数据转换为更有用的形式。ETL是“移动”数据的工具。但是现在这些工具受到了RDBMS中可以更有效地进行数据转换的进步技术的挑战。
EAI工具则引发了整合领域应用整合的另一场革命。EAI是“pull”技术,如新一代的ESB。处在监视下的应用程序的每次更改都会引起总线的更改。它不关心不基于应用程序的数据。
而EII工具则弥补了ETL和EAI所留下的空白。EII是一项“push”技术,数据是“随需应变”地抽取的。联邦查询经过优化、分段又被返回所有的数据源,而结果则汇入数据源的虚拟视图。“虚拟”是从数据通常都是驻留在数据源的意义上来说的。不像ETL工具,EII工具是“访问”而不是“移动”数据。
好的EII应该基于Model Driven Integration(模型驱动整合)方法来管理全部的数据源。还应将包含物理的数据源元数据、位置、安全性等等的元数据层与物理实体分离开来,以获得更好的灵活性。这样就提供了物理数据源的局部透明性。
EII是否会取代ETL工具?答案是:“不”。EII将补充而不是取代ETL。EII可以为ETL工具提供非基于标准的数据。而EII也可以将ETL作为一个数据源。“面向实时”意味着对大流量的数据处理,EII不是一个很好的选择。
一些新出现的供应商的Customer data integration(客户数据整合,CDI)解决方案使我有些迷惑。EII和CDI都是基于实时的“pull”技术。我认为两者之间几乎没有差别。
- 上一篇文章:企业应用集成的现状与发展趋势
- 下一篇文章:分析:中国企业需要怎样的BPM
