Python Text Processing 简明教程

Python - Synonyms and Antonyms

同义词和反义词作为 WordNet 的一部分存在,WordNet 是一种英语词典数据库。它作为 nltk 语料库访问的一部分提供。在 WordNet 中,同义词是表示相同概念的单词,并且可以在许多上下文中互换,以便将它们分组为无序集(同义词集)。我们使用这些同义词集来导出同义词和反义词,如以下程序所示。

from nltk.corpus import wordnet

synonyms = []

for syn in wordnet.synsets("Soil"):
    for lm in syn.lemmas():
             synonyms.append(lm.name())
print (set(synonyms))

当我们运行以上程序时,我们得到了以下输出 −

set([grease', filth', dirt', begrime', soil',
grime', land', bemire', dirty', grunge',
stain', territory', colly', ground'])

要获得反义词,我们只需使用反义词函数。

from nltk.corpus import wordnet
antonyms = []

for syn in wordnet.synsets("ahead"):
    for lm in syn.lemmas():
        if lm.antonyms():
            antonyms.append(lm.antonyms()[0].name())

print(set(antonyms))

当我们运行以上程序时,我们得到以下输出:

set([backward', back'])