Dynamodb 简明教程

DynamoDB - Data Pipeline

数据管道允许将数据导出和导入到表、文件或S3存储桶中。当然,这在备份、测试和类似需求或场景中被证明是有用的。

在导出中,您可以使用Data Pipeline控制台创建一个新的管道并启动Amazon EMR(Elastic MapReduce)群集以执行导出操作。EMR从DynamoDB读取数据并写入目标。我们将在本教程的后面详细讨论EMR。

在导入操作中,您可以使用Data Pipeline控制台,它会创建一个管道并启动EMR来执行导入操作。它从源读取数据并写入目标。

由于使用了S3和EMR等服务,因此导出/导入操作会产生一定的成本。

Using Data Pipeline

使用Data Pipeline时,必须指定操作和资源权限。您可以利用IAM角色或策略来定义它们。执行导入/导出操作的用户应注意,他们需要一个有效的访问密钥ID和密钥。

IAM Roles for Data Pipeline

您需要两个IAM角色才能使用Data Pipeline -

  1. - 这具有您允许管道为您执行的所有操作。

  2. - 允许管道为您调配的资源。

如果您是Data Pipeline的新手,则必须生成每个角色。由于现有的角色,所有先前用户都拥有这些角色。

使用IAM控制台为Data Pipeline创建IAM角色,并执行以下四个步骤 -

  • 登录位于以下位置的IAM控制台:

  • 从仪表板中选择角色。

  • 选择“创建角色”。然后在“角色名称”字段中输入“DataPipelineDefaultRole”,并选择“继续:权限”。在“权限策略”面板中的“分配权限”列表中,导航到“AWS服务”,并选择“Elastic MapReduce”。在“选择操作”面板中选择“全部操作”。

  • 选择“查看策略”。