提问人:Tranquilized 提问时间:3/26/2017 更新时间:3/26/2017 访问量:1621
如何使用 Apache POI 将包含 UTF-8 字符的 MS Word 文档转换为 PDF?
How to convert a MS Word doc containing UTF-8 characters to PDF with Apache POI?
问:
由于某种原因,我无法从 Apache POI 获取 PdfConverter 以在 Linux 机器上正确转换我的 MS Word 文档。在 Windows 和 MacOS 上,它似乎工作正常,但每当我在 Linux 机器上尝试它时,它基本上不会转换 UTF-8 字符。我还尝试配置可以传递给 PdfConverter 的 fontEncoding 选项,但这似乎没有帮助。
final InputStream in = new FileInputStream(new File("src/test/resources/SOMEDOC.docx"));
final XWPFDocument document = new XWPFDocument(in);
final OutputStream out = new FileOutputStream(new File("target/test.pdf"));
final PdfOptions options = PdfOptions.getDefault();
// This actually breaks the whole conversion. No text will be displayed if you set this font encoding option to UTF-8
options.fontEncoding("UTF-8");
PdfConverter.getInstance().convert(document, out, options);
有人知道我在这里做错了什么吗?
答: 暂无答案
评论