自然语言处理(NLP)是指使用自然语言(如英语)与智能系统通信的 AI 方法。
当您希望像机器人这样的智能系统根据您的说明执行操作时,当您希望从基于对话的临床专家系统中听到决策时,需要进行自然语言处理。
NLP 领域涉及使计算机使用人类使用的自然语言执行有用的任务。NLP 系统的输入和输出可以是:
Components of NLP
在这一节,我们将学习 NLP 的不同组成部分。NLP 有两个组成部分。下面介绍这些组成部分:
Natural Language Understanding (NLU)
-
将给定的自然语言输入映射到有用的表示形式。
-
分析该语言的不同方面。
Natural Language Generation (NLG)
这是从某种内部表示中生成有意义的短语和句子的过程。它包括:
-
Text planning - 这包括从知识库中检索相关内容。
-
Sentence planning - 这包括选择所需的单词,形成有意义的短语并确定句子的语调。
-
Text Realization - 这是将句子计划映射到句子结构。
Difficulties in NLU
NLU 的形式和结构非常丰富;然而它很模糊。可能有不同级别的模糊性:
Lexical ambiguity
它处于非常原始的级别,例如单词级别。例如,将单词“board”视为名词还是动词?
Syntax level ambiguity
可以以不同的方式解析句子。例如,“他用红帽子举起甲虫。” - 他是用帽子举起甲虫还是他举起了一只戴着红帽子的甲虫?
Referential ambiguity
使用代词指代某物。例如,Rima 去了 Gauri。她说,“我累了。” - 到底是谁累了?
NLP Terminology
-
Phonology - 这是按系统方式组织声音的研究。
-
Morphology - 这是从原始有意义的单位构词的研究。
-
Morpheme − 它是语言中意义的一个原始单位。
-
Syntax − 它指的是排列词语以构成一个句子。它还涉及确定词语在句子和短语中的结构性作用。
-
Semantics − 它涉及词语的含义以及如何将词语组合成有意义的短语和句子。
-
Pragmatics − 它处理在不同情况下使用和理解句子,以及如何受句意的影响。
-
Discourse − 它处理如何由直接前面的句子影响下一个句子的解释。
-
World Knowledge − 它包括对世界的常识。
Steps in NLP
Lexical Analysis
它涉及识别和分析词语的结构。语言的词典表示语言中单词和短语的集合。词法分析正在将整个文本块划分为段落、句子和单词。
Syntactic Analysis (Parsing)
它涉及分析句子中词语的语法,并以一种显示词语之间关系的方式排列词语。像“The school goes to boy”这样的句子被英语句法分析器拒绝。
Semantic Analysis
它从文本中提取确切的含义或词典含义。文本的含义会得到检查。这是通过映射任务域中的句法结构和对象来完成的。语义分析器会忽略诸如“hot ice-cream”等句子。
Discourse Integration
任何句子的含义取决于它之前句子的含义。此外,它还会带来紧接着句子的含义。
Pragmatic Analysis
在此期间,重新解释所说的内容意味着实际要表达的意思。它涉及推导需要现实世界知识的语言那些方面。