language_tool_python - 如何添加 ngram?

language_tool_python - How do i add the ngrams?

提问人:Enzo Ferrari 提问时间:10/20/2023 最后编辑:Enzo Ferrari 更新时间:10/20/2023 访问量:46

问:

我不知道你们中的许多人是否曾经使用过库语言工具的这个 python 包装器。 正如我所读到的,与其 API 相比,languagetool 本身无法检测它应该检测的所有错误。这是因为它需要 n-gram,我不知道这是否是库没有给出良好校正的唯一原因,但至少我想正确加载 n-gram。

https://www.reddit.com/r/libreoffice/comments/vjojsv/living_without_grammar_checker/ https://dev.languagetool.org/finding-errors-using-n-gram-data.html

这就是我到目前为止所做的(请记住,我正在使用 colab)

!pip install language_tool_python
!wget https://languagetool.org/download/ngram-data/ngrams-en-20150817.zip
!unzip ngrams-en-20150817.zip -d ngrams
import language_tool_python
tool = language_tool_python.LanguageTool('en-US', config={ 'languageModel' : '/content/ngrams/en/'})
text = 'There sandwich was eaten'
matches = tool.check(text)
matches

返回:[]

如何添加 n-gram?正如我在配置文件的文档中读到的那样: https://github.com/jxmorris12/language_tool_python/blob/master/language_tool_python/config_file.py 这必须通过指定 ngram 文件夹的 languageModel 参数来完成。但似乎它不起作用。

编辑:我尝试的是:使用检查方法,希望语言工具将“那里”更正为“他们的”。还尝试加载配置字典中指定的 ngrams 文件,没有改进,如匹配响应(空列表)所示。

python 语法 n-gram 语言工具

评论


答: 暂无答案