WinError 10060 连接超时错误,在 NLTK 中下载“punkt”时出错

WinError 10060 Connection Timeout Error When Downloading 'punkt' in NLTK

提问人:Shounak Das 提问时间:11/12/2023 最后编辑:Goku - stands with PalestineShounak Das 更新时间:11/14/2023 访问量:61

问:

我在 Python 中遇到了 NLTK 库的问题,特别是在尝试下载“punkt”分词器模型时。这是我收到的错误消息:

上下文:我正在尝试使用以下代码下载包:punkt

import nltk
nltk.download('punkt')

Troubleshooting Steps I've Taken:

Checked my internet connection, which seems to be working fine.
Temporarily disabled firewall and antivirus software, but the issue persists.
Attempted to use a different internet connection (e.g., mobile hotspot), but faced the same error.
python-3.x jupyter-notebook nltk

评论


答:

0赞 CodeMaven42 11/12/2023 #1

尝试使用以下代码:

import nltk
import os

nltk.download('punkt', download_dir=os.getcwd(), quiet=True)

download_dir=os.getcwd():指定 nltk 资源的下载目录。在本例中,它被设置为当前工作目录(os.getcwd())。这意味着“punkt”资源将下载到 Python 脚本或 Jupyter 笔记本所在的同一目录。

quiet=True:此参数在下载过程中禁止输出,使其更安静。

评论

0赞 Community 11/13/2023
正如目前所写的那样,你的答案尚不清楚。请编辑以添加其他详细信息,以帮助其他人了解这如何解决所提出的问题。您可以在帮助中心找到有关如何写出好答案的更多信息。
1赞 Goku - stands with Palestine 11/12/2023 #2

一个非常奇怪的错误:

https://github.com/nltk/nltk/issues/1981#issuecomment-1804689730

https://github.com/nltk/nltk/issues/3104

似乎在某些网络上,我被告知“Jio”是其中之一,raw.githubusercontent.com 无法访问,例如:https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.xml