Natural Language Toolkit 简明教程
Natural Language Toolkit - Getting Started
为了安装 NLTK,我们必须在电脑上安装 Python。您可以访问链接 www.python.org/downloads 并为您的操作系统(即 Windows、Mac 和 Linux/Unix)选择最新版本。有关 Python 的基本教程,您可以参考链接 www.tutorialspoint.com/python3/index.htm 。
现在,在您的计算机系统上安装 Python 之后,让我们了解如何安装 NLTK。
Installing NLTK
我们可以在不同的操作系统上安装 NLTK,如下所示:
On Windows
为了在 Windows 操作系统上安装 NLTK,请按照以下步骤操作:
-
首先,打开 Windows 命令提示符并导航到 pip 文件夹的位置。
-
接下来,输入以下命令来安装 NLTK:
pip3 install nltk
现在,从 Windows 开始菜单中打开 PythonShell,并输入以下命令来验证 NLTK 的安装:
Import nltk
如果未出现错误,则表示您已在具有 Python3 的 Windows 操作系统上成功安装了 NLTK。
On Mac/Linux
为了在 Mac/Linux 操作系统上安装 NLTK,请编写以下命令:
sudo pip install -U nltk
如果你电脑上没有安装 pip,请按照下面的说明安装 pip −
首先,通过如下命令更新包索引 −
sudo apt update
现在,键入如下命令安装 Python 3 的 pip −
sudo apt install python3-pip
Through Anaconda
要通过 Anaconda 安装 NLTK,请按照如下步骤操作 −
首先,安装 Anaconda,访问链接 https://www.anaconda.com/download 然后选择你需要安装的 Python 版本。
你的电脑系统安装了 Anaconda 之后,转到其命令提示符然后输入如下命令 −
conda install -c anaconda nltk
你需要检查输出并输入“是”。NLTK 将下载并安装到你的 Anaconda 包中。
Downloading NLTK’s Dataset and Packages
现在我们已经安装了 NLTK,但是为了使用它,我们需要下载其数据组(语料库)。一些重要的数据组包括 stpwords, guntenberg, framenet_v15 等。
通过如下命令,我们可以下载所有 NLTK 数据组 −
import nltk
nltk.download()
你会看到如下 NLTK 下载窗口。
现在,点击下载按钮下载数据组。
How to run NLTK script?
下面是使用 PorterStemmer nltk 类实现 Porter Stemmer 算法的示例。利用此示例,你可以了解如何运行 NLTK 脚本。
首先,我们需要导入自然语言工具包 (nltk)。
import nltk
现在,导入 PorterStemmer 类来实现波特词干化器算法。
from nltk.stem import PorterStemmer
然后,按以下步骤创建波特词干化器类的实例 −
word_stemmer = PorterStemmer()
现在,输入你想提取词干的单词。−
word_stemmer.stem('writing')