删除 PDF 中重复的嵌入字体子集
作者:ma hei pang 提问时间:10/31/2023
我正在使用 pdfbox-2.0.24 合并多个 PDF。但是,合并后的文件大小太大,因为它包含许多重复的嵌入字体子集。例如,我合并了 1 .pdf 和 2 .pdf,它显示了一些重复的字体列表,如图...
PDF 问答列表
作者:ma hei pang 提问时间:10/31/2023
我正在使用 pdfbox-2.0.24 合并多个 PDF。但是,合并后的文件大小太大,因为它包含许多重复的嵌入字体子集。例如,我合并了 1 .pdf 和 2 .pdf,它显示了一些重复的字体列表,如图...
作者:Qazazazaz 提问时间:10/28/2023
我有两个来自不同 TSP(比如 CredA 和 CredB)的基于 CSC 的凭据。我正在尝试使用这两个凭据执行 PDF 签名。 我以两种方式实现了相同的方法,一种是用的,另一种是用.PDFBoxIt...
作者:Hanzala Bin Omar 提问时间:10/31/2023
附加 PDF $message .= "--$boundary\r\n" . "Content-Type: application/pdf\r\n" . "Content-Disposition...
作者:pj43 提问时间:10/31/2023
我正在寻找一种方法,在将 epub 书籍转换为 pdf 时删除自动生成的标题(epub 有硬编码的,所以我在图像下有双字幕)。 我试过拼凑一个 lua 过滤器,但由于我基本上对 lua 一无所知,也...
作者:Chere 提问时间:10/30/2023
在我的页面中,我调用了一个位于函数.php中的函数,该函数使用AJAX来获取我需要的帖子类型(这是一个排序函数)。 结果,我得到这样的回应:$response .= '<a class="cs-ce...
作者:richardtallent 提问时间:10/24/2023
我正在尝试从此 PDF 文件中提取文本: http://www.in.gov/legislative/iac/T03270/A00200.PDF 我收到的错误: PDF Extraction E...
作者:marco77sa 提问时间:10/23/2023
有没有办法提取部分pdf文档并导出为文本文件? 我有一张通过 pdf 发送给我的发票,我希望有一种方法来“检测”要转换为文本的区域并将值存储到我的数据库中。 我发现了一些将所有文档转换为文本文件的脚...
作者:Mikołaj Sobczak 提问时间:10/29/2023
我正在编写一个程序。用户可以上传PDF文件。每个文件都有一个表。每个表都有列,例如(产品名称、单位、价格),有些文件可能不止这三列。我需要将每个pdf文件的三列数据保存到我的数据库中。 我的问题是我不...
作者:contributor 提问时间:10/28/2023
PDFBox 版本 3.0.0 请帮忙。尝试拆分 pdf 文件并引发异常: java.lang.NullPointerException 在 org.apache.pdfbox.cos.COSArra...
作者:malz 提问时间:10/31/2023
我目前正在使用 Apache PDFBox 3.0.0 在 Java 中实现 PDF 渲染器,我想添加使用 XOR(独占 OR)模式绘制 PDF 元素(如字符串、矩形和线条)的功能,以反转基础元素的颜...