Natural Language Processing 简明教程

Natural Language Processing - Semantic Analysis

语义分析的目的是从文本中提取确切的含义,或者你可以说词典含义。语义分析器的作用是检查文本的含义。

我们已经知道词法分析也处理单词的含义,那么词法分析和语义分析有什么不同呢?词法分析基于较小的标记,但另一方面,语义分析则关注较大的块。这就是为什么语义分析可以分为以下两部分:

Studying meaning of individual word

它是语义分析的第一部分,其中执行单个单词的含义的研究。这部分称为词法语义。

Studying the combination of individual words

在第二部分中,单个单词将被组合起来为句子提供含义。

语义分析最重要的任务是获得句子的恰当含义。例如,分析句子“在这句话中,说话者正谈论罗摩勋爵或一个叫罗摩的人。”这就是为什么语义分析器获得句子恰当含义的工作非常重要。

Elements of Semantic Analysis

以下是语义分析的一些重要元素:

Hyponymy

它可以被定义为泛词与泛词实例之间的关系。这里的泛词称为上位词,其实例称为下位词。例如,词“颜色”是上位词,而词“蓝色”、“黄色”等是下位词。

Homonymy

它可以被定义为拼写或形式相同但含义不同且不相关的词。例如,单词“Bat”是一个同音异义词,因为bat可以是击球的工具,也可以是夜间飞行的哺乳动物。

Polysemy

多义词是一个希腊词,意为“许多符号”。它是一个具有不同但相关意义的单词或短语。换句话说,我们可以说多义词具有相同的拼写但不同且相关的含义。例如,单词“bank”是一个多义词,具有以下含义:

  1. A financial institution.

  2. 此类机构所在的建筑物。

  3. “依靠”的同义词。

Difference between Polysemy and Homonymy

多义词和同音异义词都具有相同的语法或拼写。它们之间的主要区别在于,在多义词中,单词的含义是相关的,而在同音异义词中,单词的含义是不相关的。例如,如果我们谈论同一个单词“Bank”,我们可以写出“金融机构”或“河岸”的含义。在这种情况下,这将是同音异义词的例子,因为这些含义彼此无关。

Synonymy

它是指具有不同形式但表示相同或相近含义的两个词素之间的关系。示例有“作者/作家”、“命运/天命”。

Antonymy

它是指两个词素之间在其语义成分相对于某个轴对称的关系。反义词的范围如下所示:

  1. Application of property or not - 示例有“生活/死亡”、“确定性/不确定性”

  2. Application of scalable property - 示例有“富/穷”、“热/冷”

  3. Application of a usage - 示例有“父亲/儿子”、“月亮/太阳”。

Meaning Representation

语义分析创建句子的含义表示。但在进入与含义表示相关的概念和方法之前,我们需要了解语义系统的构建模块。

Building Blocks of Semantic System

在词语表示或词语含义的表示中,以下构建模块发挥着重要作用:

  1. Entities - 它表示个体,例如特定的人、地点等,例如,哈里亚纳邦。印度,罗摩都是实体。

  2. Concepts - 它表示个体的通用类别,例如人、城市等。

  3. Relations - 它表示实体和概念之间的关系。例如,罗摩是一个人。

  4. Predicates - 它表示谓语结构。例如,语义角色和格语法是谓词的示例。

现在,我们可以理解语义表征展示了如何将语义系统的构建模块放在一起。换句话说,它展示了如何将实体、概念、关系和谓词组合在一起,以描述一种情况。它还能够推理语义世界。

Approaches to Meaning Representations

语义分析使用以下方法来表征意义——

  1. 一阶谓词逻辑 (FOPL)

  2. Semantic Nets

  3. Frames

  4. Conceptual dependency (CD)

  5. Rule-based architecture

  6. Case Grammar

  7. Conceptual Graphs

Need of Meaning Representations

这里出现的一个问题是我们为什么需要语义表征?以下是原因——

Linking of linguistic elements to non-linguistic elements

第一个原因是借助语义表征,可以将语言元素与非语言元素联系起来。

Representing variety at lexical level

借助语义表征,可以在词汇层面上表征明确的规范形式。

Can be used for reasoning

能使用语义表征来推理,以验证世界中什么是真实的,以及从语义表征中推断知识。

Lexical Semantics

语义分析的第一个部分——研究各个单词的含义被称为词汇语义。它包括单词、子词、词缀(子单位)、复合词和短语。所有单词、子词等统称为词汇项。换句话说,可以说词汇语义是词汇项、句子含义和句子语法之间的关系。

以下是在词汇语义中涉及的步骤——

  1. 在词汇语义中执行单词、子词、词缀等词汇项的分类。

  2. 在词汇语义中执行单词、子词、词缀等词汇项的分解。

  3. 还分析不同词汇语义结构之间的差异和相似性。