提问人:Lance 提问时间:11/10/2023 更新时间:11/10/2023 访问量:23
如何在NLTK中打印所有NP / VP(名词短语,动词短语)和句子结构缩写?
How to print all the NP/VP (noun phrase, verb phrase) and sentence-structure abbreviations in NLTK?
问:
我看到了 NLTK 的所有可能的 POS 标签是什么? 列出可能的 POS 标签,但这些标签不包括短语结构语法、句子级标签,似乎是 VP(动词短语)和 NP(名词短语)等。我如何打印出所有这些,或者它们都记录在哪里?
我正在看这篇文章。看起来他们只是在用任意符号创建语法,但出于惯例,他们选择了 NP/etc:
>>> groucho_grammar = nltk.CFG.fromstring("""
... S -> NP VP
... PP -> P NP
... NP -> Det N | Det N PP | 'I'
... VP -> V NP | VP PP
... Det -> 'an' | 'my'
... N -> 'elephant' | 'pajamas'
... V -> 'shot'
... P -> 'in'
... """)
>>> sent = ['I', 'shot', 'an', 'elephant', 'in', 'my', 'pajamas']
>>> parser = nltk.ChartParser(groucho_grammar)
>>> for tree in parser.parse(sent):
... print(tree)
...
(S
(NP I)
(VP
(VP (V shot) (NP (Det an) (N elephant)))
(PP (P in) (NP (Det my) (N pajamas)))))
(S
(NP I)
(VP
(V shot)
(NP (Det an) (N elephant) (PP (P in) (NP (Det my) (N pajamas))))))
如果可能的话,我想找出所有符号是什么以及它们的含义(以及它们允许嵌套在其中的内容)。不过,打印它们将是一个很好的第一步。
答: 暂无答案
评论