我的大多数公司使用powercenter信息,用于提取变换的负荷类型数据的工作之间的数据库。

然而项目,我有一个大的定义Perl的工作与一些Java在移动数据和引发一些其他的更新。

那里是帮你写的东西用powercenter相反,什么是人们的经验在这样一个项目,是否有意义?好像你贸易的很大的灵活性,在这样一个"现成"解决办法,但做ETL工具,你买多在生产率方面的例子吗?

有帮助吗?

解决方案

Informatica对运营团队有利。它允许非技术人员监视和重新运行作业。但是,它使任何任务变得比它需要的复杂得多。它是一个巨大的软件,需要一段时间才能学习,并且它在没有编程的情况下可以进行的转换受到限制。我当然会在“企业ETL”上使用Perl或编程语言。工具。

其他提示

我们从2001年开始使用Informatica和Tibco,人们可以轻松拿起Informatica(用于基本任务),但是Tibco很痛苦。 Tibco现在已经不见了,Informatica的足迹已经增长,其代码现在甚至被商业分析师所看到。

一旦你精通,你可以快速完成很多工作(我在一周内为多个来源做了3个事实表和12个维度,对于财务和PO数据集市),并且在更改代码,调度时更容易维护过渡到另一个开发者等等。减少玩乐的时间,更多的会议时间和组织的文书工作。

我们将它用于数据集市,数据移动和ASP接口。

如果你想做一些完全自定义的东西,而不是编译的C程序,那么它现在有了一个Java转换。

在您的情况下,我将转换为Informatica有两个原因:影响分析(SLA)和维护(监控,单个ETL工具)。可重用性是另一个好处。

特定于informatica:影响分析是一个很好的工具:它可以防止许多紧急修复,并帮助您保持SLA。对我而言,改进SLA是在灵活性之上。 Informatica中的监控功能也非常有用。

一般情况下:如果您的公司正在转向单个ETL工具,转换该作业将使其更易于维护。支持团队监控一个工具的效率和可靠性也更高。希望您的公司尝试使对象可重用,这使得转换更容易,并提高未来的生产力(您可以在转换过程中创建新的可重用对象)。

提醒一句:转换任务实际上很难估算。如果可以的话,将其作为一个独立的项目(不是更大的可交付成果的一部分)。

编码给了你很大的灵活性。它Perl,Python,C#、Java、SQL-什么的。你可以迅速和容易地建立一些数据的转换。为什么会有人打扰甚至看ETL软件,对吗?

让我们假设你已经得到了整个解决方案做好准备。所有你的脚本中的语言你们的选择。现在几个问题:

  • 如果数据数量增长并且你不能适应一切记忆,那里的高速缓存创建的?你能控制它?
  • 你怎么创造所有的记录?有你创造了这个?
  • 什么差错的处理?在错误的情况下(例如磁盘空间的问题,连接问题,ets。) 的根本原因是很容易的指示?
  • 你怎么做到的监视?是否有任何动态的仪表板?
  • 是聚类可能的,你的方案吗?
  • 是否可以运行的一些数据的转变在多线程,以使它运行速度更快?
  • 故障转移:你怎么处理故障?是否有可能重新启动工作,从失败?
  • 连通性:一个新的数据来源显示出来-说,Salesforce-多少时间,你需要增强剧本读写它?
  • 你可以连接到企业资源规划系统(如SAP?
  • 你可以得到的数据系和影响分析的剧本?

所有这些和更多的-你的时候你使用一些人后裔ETL软件。有人已经努力工作,多年来处理所有这些烦恼,并得到一些GUI。这就是差异。

现在:如果你需要的东西负载一个文件数据库一旦在一段时间-什么,将做的事。但是如果你的计划具有很大的那些ETL软件是值得考虑的。如果信息是已经存在,在你的公司,那么为什么任何和重新发明轮子呢?

如果你有无法编码的人,那么像Informatica这样的ETL工具可以让你获得生产力(以及漂亮的图片)。如果没有人可以维护代码,这是有道理的。对于那些可以编码的人来说,这就像是雇佣一只重500磅的大猩猩来移动一个小山丘。

参见:这篇文章这篇文章此主题

对于自动作业记录(你不必考虑你要记录的内容......它已经为你完成了很多)和运行时监控工具(我的工作流程有多远) ,它在哪里失败了?)。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top