使用 AWS textract 从 pdf 中提取数据-解网

问：

我有一个pdf，我可以从AWS textract中提取文本和其他数据，但有条形图，图形等，我也需要从中提取数据的方法，不仅仅是标签，还有这些图形所代表的内容。

我尝试使用 AWS Rekognition，但它也提供了标签。

amazon-web-services nlp 文本提取 amazon-rekognition amazon-textract

评论

答：

1赞 Leeroy Hannigan 11/8/2023 #1

这是 Textract 或 Rekognition 等 AWS 托管 AI 服务目前无法提供的。

为此，您需要在 SageMaker 上训练自己的模型来执行此类任务。

https://docs.aws.amazon.com/sagemaker/latest/dg/how-it-works-training.html

上一个：如何使用python docx库在现有文档中的第二个表格之后在现有word文档中添加新表格？

下一个：代码在写在一行上时未检测到 Word 文档中的数字