使用 Java 读取 PDF 中的二维码

Reading a QR code within a PDF using Java

提问人:ema 提问时间:11/7/2023 更新时间:11/7/2023 访问量:41

问:

我有一个包含二维码的单页PDF文件。这是一个图像,我假设它是一个 .png 文件。.

QR码中是我需要在扫描后处理的文本。

我一直在使用 PDFBox 从文件中提取文本并且进展顺利,有没有办法使用 PDFBox 来做到这一点,或者我是否也必须导入其他东西?

我在 PDFBox 网站上查看了示例,但我认为这些都不是我想要的。这是否意味着这是不可能的?我看到有人说他们使用 zxing 库。

Java PDF框

评论

1赞 Tilman Hausherr 11/7/2023
是的,渲染为 BufferedImage (300 dpi) stackoverflow.com/questions/23326562/...,然后使用 ZXIng stackoverflow.com/questions/18863466/... 进行读取。试试这些,如果它不起作用,那么用你使用的代码来改进你的问题。
0赞 mkl 11/7/2023
或者 - 如您所知,您的 PDF 包含 QR 码作为扫描页面位图图像的一部分 - 您可以直接提取这些图像并将 zxing 应用于它们。
0赞 ema 11/7/2023
@mkl所以你是说我应该只在 pdf 中的图像上应用 zxing,而不是将整个 pdf 转换为图像,然后扫描新图像?我该如何继续这样做?
1赞 mkl 11/7/2023
好吧,如果扫描仪只是扫描到一个简单的位图图像并将其嵌入到结果 PDF 中,它的质量会比重新渲染的图像更好,因此应该将 zxing 应用于该图像。另一方面,如果您有一个“智能”扫描仪,它可能会尝试将页面图像拆分为单独的部分以获得更好的可压缩性。在这种情况下,您最好将 PDF 页面重新渲染为新的单个位图。如何提取图像在 PDFBox 的工具中进行了说明。ExtractImages

答: 暂无答案