Talend 简明教程

Talend - Components for Data Integration

Talend 中的所有操作都由连接器和组件执行。Talend 提供 800 多个连接器和组件来执行多个操作。这些组件显示在面板中,有 21 个组件所属的主类别。您可以选择连接器并将其拖放到设计器窗格中,它将自动创建 Java 代码,这些代码在您保存 Talend 代码时会得到编译。

包含组件的主类别如下所示 -

main categories

以下是 Talend Open Studio 中广泛用于数据集成的连接器和组件的列表 -

  1. tMysqlConnection - 连接到组件中定义的 MySQL 数据库。

  2. tMysqlInput − 针对某个数据库运行查询以读取该数据库并提取字段(表格、视图等)。

  3. tMysqlOutput − 用于写、更新、修改 MySQL 数据库中的数据。

  4. tFileInputDelimited − 按行读取带分隔符的文件,并将它们分成单独的字段,然后传递至下一个组件。

  5. tFileInputExcel − 按行读取 Excel 文件,并将它们分成单独的字段,然后传递至下一个组件。

  6. tFileList − 从给定的文件掩码模式获取所有文件和目录。

  7. tFileArchive − 将一组文件或文件夹压缩到 zip、gzip 或 tar.gz 存档文件中。

  8. tRowGenerator − 提供了一个编辑器,您可以在其中编写函数或选择表达式来生成示例数据。

  9. tMsgBox − 返回一个对话框框,其中包含指定的提示信息和一个“确定”按钮。

  10. tLogRow − 监控正在处理的数据。它在运行控制台中显示数据/输出。

  11. tPreJob − 定义在实际作业开始前运行的子作业。

  12. tMap − 作为 Talend Studio 中的插件。从一个或多个源获取数据,对其进行转换,然后将转换后的数据发送至一个或多个目标。

  13. tJoin − 通过执行主流程和查找流程之间的内部和外部连接来连接 2 个表。

  14. tJava − 使您能够在 Talend 程序中使用个性化的 java 代码。

  15. tRunJob − 通过逐个运行 Talend 作业来管理复杂的作业系统。