如何利用人类专业知识来增强 GPT 对 PDF 内容的理解?

How can I leverage human expertise to enhance GPT's understanding of PDF content?

提问人:Jakub Szlaur 提问时间:10/22/2023 更新时间:10/22/2023 访问量:24

问:

我想创建一个系统,其中 GPT 模型扫描多个 PDF,然后它应该询问有关文档的“信息差距”的问题。例如,将传递两个文档,文档 A 将讨论模块 A,文档 B 将讨论文档 B。但是没有关于文档如何连接的规范 - 那么人工智能应该提出一个问题“这两个文档如何关联?没有关于这个主题的规范。

我尝试过:

  • 我使用 langchain 库来读取 PDF 文件并创建矢量 数据存储。
  • 我使用用户问题实现了相似性搜索 FAISS 算法。
  • 我设置了一个基本的聊天界面,其中 GPT 模型可以与用户交互。

但是 FAISS 算法寻找相似之处,但我不是在寻找相似之处,而是在寻找文档之间的联系。

我怎样才能实现这个算法?

NLP openai-api langchain chatgpt-api gpt-4

评论

0赞 Jakub Szlaur 10/22/2023
这两个 PDF 将讨论一个模块,这些模块共同创建一个系统(这是有保证的)。但正如我所说:这只是一个示例问题/答案。我的观点是,我如何创建一个链,让 GPT 询问有关 PDF 的问题(它应该自己提出问题!
0赞 Jakub Szlaur 10/23/2023
是的 - 我确实从 PDF 中提取文本。我不在乎 XYZ 偏移量 - 我的错。

答: 暂无答案