Artificial Intelligence With Python 简明教程

AI with Python – Natural Language Processing

自然语言处理(NLP)是指使用自然语言(如英语)与智能系统通信的 AI 方法。

当您希望像机器人这样的智能系统根据您的说明执行操作时,当您希望从基于对话的临床专家系统中听到决策时,需要进行自然语言处理。

NLP 领域涉及使计算机使用人类使用的自然语言执行有用的任务。NLP 系统的输入和输出可以是:

  1. Speech

  2. Written Text

Components of NLP

在这一节,我们将学习 NLP 的不同组成部分。NLP 有两个组成部分。下面介绍这些组成部分:

Natural Language Understanding (NLU)

它涉及以下任务:

  1. 将给定的自然语言输入映射到有用的表示形式。

  2. 分析该语言的不同方面。

Natural Language Generation (NLG)

这是从某种内部表示中生成有意义的短语和句子的过程。它包括:

  1. Text planning - 这包括从知识库中检索相关内容。

  2. Sentence planning - 这包括选择所需的单词,形成有意义的短语并确定句子的语调。

  3. Text Realization - 这是将句子计划映射到句子结构。

Difficulties in NLU

NLU 的形式和结构非常丰富;然而它很模糊。可能有不同级别的模糊性:

Lexical ambiguity

它处于非常原始的级别,例如单词级别。例如,将单词“board”视为名词还是动词?

Syntax level ambiguity

可以以不同的方式解析句子。例如,“他用红帽子举起甲虫。” - 他是用帽子举起甲虫还是他举起了一只戴着红帽子的甲虫?

Referential ambiguity

使用代词指代某物。例如,Rima 去了 Gauri。她说,“我累了。” - 到底是谁累了?

NLP Terminology

现在让我们来看看 NLP 术语中的一些重要术语。

  1. Phonology - 这是按系统方式组织声音的研究。

  2. Morphology - 这是从原始有意义的单位构词的研究。

  3. Morpheme − 它是语言中意义的一个原始单位。

  4. Syntax − 它指的是排列词语以构成一个句子。它还涉及确定词语在句子和短语中的结构性作用。

  5. Semantics − 它涉及词语的含义以及如何将词语组合成有意义的短语和句子。

  6. Pragmatics − 它处理在不同情况下使用和理解句子,以及如何受句意的影响。

  7. Discourse − 它处理如何由直接前面的句子影响下一个句子的解释。

  8. World Knowledge − 它包括对世界的常识。

Steps in NLP

本部分显示了 NLP 中的不同步骤。

Lexical Analysis

它涉及识别和分析词语的结构。语言的词典表示语言中单词和短语的集合。词法分析正在将整个文本块划分为段落、句子和单词。

Syntactic Analysis (Parsing)

它涉及分析句子中词语的语法,并以一种显示词语之间关系的方式排列词语。像“The school goes to boy”这样的句子被英语句法分析器拒绝。

Semantic Analysis

它从文本中提取确切的含义或词典含义。文本的含义会得到检查。这是通过映射任务域中的句法结构和对象来完成的。语义分析器会忽略诸如“hot ice-cream”等句子。

Discourse Integration

任何句子的含义取决于它之前句子的含义。此外,它还会带来紧接着句子的含义。

Pragmatic Analysis

在此期间,重新解释所说的内容意味着实际要表达的意思。它涉及推导需要现实世界知识的语言那些方面。