Talend 简明教程

Talend - Job Design

这是业务模型的技术实现/图形化表示。在此设计中,一个或多个组件相互连接以运行数据集成过程。因此,当您在设计面板中拖拽组件并使用连接器连接它们时,作业设计将所有内容转换为代码并创建一个完整的可运行程序,从而形成数据流。

Creating a Job

在存储库窗口中,右键单击作业设计并单击创建作业。

creating job

提供作业的名称、目的和描述,然后单击完成。

description of job

您会看到作业已在作业设计下创建。

job design

现在,让我们使用此作业来添加、连接和配置组件。在此,我们将使用 Excel 文件作为输入并生成包含相同数据的 Excel 文件作为输出。

Adding Components to a Job

调色板中有几个可供选择的组件。还有一个搜索选项,您可以在其中输入组件的名称以选择它。

palette

由于我们在此将 Excel 文件作为输入,因此我们将从调色板中将 tFileInputExcel 组件拖拽到设计器窗口中。

designer window

现在,如果您单击设计器窗口上的任意位置,将出现一个搜索框。找到 tLogRow 并选择它以将其带入设计器窗口。

search box

最后,从调色板中选择 tFileOutputExcel 组件,并将其拖拽到设计器窗口中。

file output excel

现在,组件添加已完成。

new job

Connecting the Components

添加组件后,您必须连接它们。右键单击第一个组件 tFileInputExcel,然后将主线绘制到 tLogRow,如下所示。

connecting components

同样,右键单击 tLogRow,然后在 tFileOutputExcel 上绘制一条主线。现在,您的组件已连接。

components conected
draw main line

Configuring the components

在作业中添加并连接组件后,您需要对其进行配置。为此,双击第一个组件 tFileInputExcel 以对其进行配置。在文件名/流中提供输入文件的路径,如下所示。

如果 excel 中的第 1 行有列名,请在 Header 选项中输入 1。

header option

单击编辑模式,然后根据输入的Excel文件添加列及其类型。添加模式后,单击“确认”。

adding schema

单击“是”。

propagate

In tLogRow component, click on sync columns and select the mode in which you want to generate the rows from your input. Here we have selected Basic mode with “,” as field separator.

progress information

Finally, in tFileOutputExcel component, give the path of file name where you want to store

sync columns

your output excel file with the sheet name. Click on sync columns.

Executing the Job

一旦您完成了添加,连接和配置您的组件,您就可以执行您的 Talend 作业了。点击 “运行” 按钮开始执行。

basic run
log row

您将以基本模式看到具有 “,” 分隔符的输出。

basic mode

您还可以看到您的输出保存在您提到的输出路径中的 Excel 表格中。

output path