提问人:Nitish Kumar 提问时间:11/3/2023 更新时间:11/3/2023 访问量:11
我们如何找到标记的PDF文档的每个元素对象的图形状态 使用 PDFMarkedContentExtractor
How we find Graphic state of each element objects of tagged PDF document Using PDFMarkedContentExtractor
问:
我想使用PDFMarkedContentExtractor按照阅读给定结构信息的顺序提取对象。但是这门课主要集中在文本上,所以使用图形处理我想 提取每个元素对象的图形状态,以便我可以为每个对象分配 z 顺序值,然后根据 z 顺序值获取读取顺序。 所以,请任何人通过分享一些例子或建议来帮助我。
我能够获得pdf文档每一页的图形状态。但是我期望结果能够获得每个页面的每个元素对象的图形状态。
答: 暂无答案
评论