AWS GLUE - 如何从 RDS 表读取数据并将数据作为 csv 文件复制到 S3 存储桶-解网

问：

AWS 胶水对我来说是新的。我正在使用 AWS Glue，我正在尝试从 RDS 数据库表中读取数据并将数据作为单个 csv 文件写入 s2 存储桶。我在 Glue 控制台中使用 Visual ETL 设置了一个 AWS Glue 作业，选择源作为关系数据库，选择目标作为带有表的 S3 存储桶（我为架构创建了一个爬网程序）。作业成功，但我注意到我在目标 s3 存储桶位置获得了 10 个单独的文件。有没有人知道如何以我在 s3 存储桶中只获得一个合并文件的方式实现这一目标。

网络服务亚马逊 -S3 AWS-胶水

但要小心：使用可能会减慢速度，尤其是在处理大量数据时，因为它涉及将数据洗牌到单个分区，从而可能影响性能。因此，这有点像在获取一个文件和保持快速发展之间找到平衡，具体取决于您拥有的数据量以及您需要对其进行的处理。coalesce

Spark - repartition（）与 coalesce（）

上一个：Micronaut 对象存储 - 如何为 AWS 和 Azure 实施 Micronaut 对象存储（不带 Aws/Azure 包）

下一个：hudi-flink-bundle 无法加载 s3-fs-hadoop 插件

AWS GLUE - 如何从 RDS 表读取数据并将数据作为 csv 文件复制到 S3 存储桶

AWS GLUE - How to read data from RDS table and copy to S3 bucket as csv file

评论