Natural Language Toolkit 简明教程

Natural Language Toolkit - Getting Started

为了安装 NLTK,我们必须在电脑上安装 Python。您可以访问链接 www.python.org/downloads 并为您的操作系统(即 Windows、Mac 和 Linux/Unix)选择最新版本。有关 Python 的基本教程,您可以参考链接 www.tutorialspoint.com/python3/index.htm

install natural language toolkit

现在,在您的计算机系统上安装 Python 之后,让我们了解如何安装 NLTK。

Installing NLTK

我们可以在不同的操作系统上安装 NLTK,如下所示:

On Windows

为了在 Windows 操作系统上安装 NLTK,请按照以下步骤操作:

  1. 首先,打开 Windows 命令提示符并导航到 pip 文件夹的位置。

  2. 接下来,输入以下命令来安装 NLTK:

pip3 install nltk

现在,从 Windows 开始菜单中打开 PythonShell,并输入以下命令来验证 NLTK 的安装:

Import nltk

如果未出现错误,则表示您已在具有 Python3 的 Windows 操作系统上成功安装了 NLTK。

On Mac/Linux

为了在 Mac/Linux 操作系统上安装 NLTK,请编写以下命令:

sudo pip install -U nltk

如果你电脑上没有安装 pip,请按照下面的说明安装 pip

首先,通过如下命令更新包索引 −

sudo apt update

现在,键入如下命令安装 Python 3 的 pip

sudo apt install python3-pip

Through Anaconda

要通过 Anaconda 安装 NLTK,请按照如下步骤操作 −

首先,安装 Anaconda,访问链接 https://www.anaconda.com/download 然后选择你需要安装的 Python 版本。

anaconda

你的电脑系统安装了 Anaconda 之后,转到其命令提示符然后输入如下命令 −

conda install -c anaconda nltk
anaconda command

你需要检查输出并输入“是”。NLTK 将下载并安装到你的 Anaconda 包中。

Downloading NLTK’s Dataset and Packages

现在我们已经安装了 NLTK,但是为了使用它,我们需要下载其数据组(语料库)。一些重要的数据组包括 stpwords, guntenberg, framenet_v15 等。

通过如下命令,我们可以下载所有 NLTK 数据组 −

import nltk
nltk.download()
natural language toolkit datasets

你会看到如下 NLTK 下载窗口。

natural language toolkit download

现在,点击下载按钮下载数据组。

How to run NLTK script?

下面是使用 PorterStemmer nltk 类实现 Porter Stemmer 算法的示例。利用此示例,你可以了解如何运行 NLTK 脚本。

首先,我们需要导入自然语言工具包 (nltk)。

import nltk

现在,导入 PorterStemmer 类来实现波特词干化器算法。

from nltk.stem import PorterStemmer

然后,按以下步骤创建波特词干化器类的实例 −

word_stemmer = PorterStemmer()

现在,输入你想提取词干的单词。−

word_stemmer.stem('writing')

Output

'write'
word_stemmer.stem('eating')

Output

'eat'