提问人:Shounak Das 提问时间:11/12/2023 最后编辑:Goku - stands with PalestineShounak Das 更新时间:11/14/2023 访问量:61
WinError 10060 连接超时错误,在 NLTK 中下载“punkt”时出错
WinError 10060 Connection Timeout Error When Downloading 'punkt' in NLTK
问:
我在 Python 中遇到了 NLTK 库的问题,特别是在尝试下载“punkt”分词器模型时。这是我收到的错误消息:
上下文:我正在尝试使用以下代码下载包:punkt
import nltk
nltk.download('punkt')
Troubleshooting Steps I've Taken:
Checked my internet connection, which seems to be working fine.
Temporarily disabled firewall and antivirus software, but the issue persists.
Attempted to use a different internet connection (e.g., mobile hotspot), but faced the same error.
答:
0赞
CodeMaven42
11/12/2023
#1
尝试使用以下代码:
import nltk
import os
nltk.download('punkt', download_dir=os.getcwd(), quiet=True)
download_dir=os.getcwd():指定 nltk 资源的下载目录。在本例中,它被设置为当前工作目录(os.getcwd())。这意味着“punkt”资源将下载到 Python 脚本或 Jupyter 笔记本所在的同一目录。
quiet=True:此参数在下载过程中禁止输出,使其更安静。
评论
1赞
Goku - stands with Palestine
11/12/2023
#2
一个非常奇怪的错误:
https://github.com/nltk/nltk/issues/1981#issuecomment-1804689730
https://github.com/nltk/nltk/issues/3104
似乎在某些网络上,我被告知“Jio”是其中之一,raw.githubusercontent.com 无法访问,例如:https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.xml
评论