我们如何找到标记的PDF文档的每个元素对象的图形状态 使用 PDFMarkedContentExtractor

How we find Graphic state of each element objects of tagged PDF document Using PDFMarkedContentExtractor

提问人:Nitish Kumar 提问时间:11/3/2023 更新时间:11/3/2023 访问量:11

问:

我想使用PDFMarkedContentExtractor按照阅读给定结构信息的顺序提取对象。但是这门课主要集中在文本上,所以使用图形处理我想 提取每个元素对象的图形状态,以便我可以为每个对象分配 z 顺序值,然后根据 z 顺序值获取读取顺序。 所以,请任何人通过分享一些例子或建议来帮助我。

我能够获得pdf文档每一页的图形状态。但是我期望结果能够获得每个页面的每个元素对象的图形状态。

PDFBOX Z-订单 标记-PDF

评论


答: 暂无答案