使用 AWS textract 从 pdf 中提取数据

Extracting data from pdf using AWS textract

提问人:Abdul Rehman Baber 提问时间:11/8/2023 更新时间:11/8/2023 访问量:21

问:

我有一个pdf,我可以从AWS textract中提取文本和其他数据,但有条形图,图形等,我也需要从中提取数据的方法,不仅仅是标签,还有这些图形所代表的内容。

我尝试使用 AWS Rekognition,但它也提供了标签。

amazon-web-services nlp 文本提取 amazon-rekognition amazon-textract

评论


答:

1赞 Leeroy Hannigan 11/8/2023 #1

这是 Textract 或 Rekognition 等 AWS 托管 AI 服务目前无法提供的。

为此,您需要在 SageMaker 上训练自己的模型来执行此类任务。

https://docs.aws.amazon.com/sagemaker/latest/dg/how-it-works-training.html