提问人:angeliquelinde 提问时间:6/9/2021 更新时间:6/9/2021 访问量:15
Python nltk.util ngram 错误的输出格式
Python nltk.util ngram wrong output format
问:
我是 Python 的新手,正在做我的第一个课程作业练习。尝试将一些文本转换为卦标记,但我没有得到预期的输出:
from nltk.util import ngrams
def process_text(text, n = 1):
tokens = [token for token in text.split(" ") if token != ""]
tokenised = list(ngrams(tokens, n))
return tokenised
process_text("knife pot spoon hammer nail", 3)
输出:
[('knife', 'pot', 'spoon'),
('pot', 'spoon', 'hammer'),
('spoon', 'hammer', 'nail')]
输出应如下所示:
['knife pot spoon',
'pot spoon hammer',
'spoon hammer nail]
答: 暂无答案
上一个:如何将日期拆分为缺少日期部分的列
下一个:解析字符串列表并查找最大值
评论
tokenised = list(' '.join(k) for k in ngrams(tokens, n)))