“Context”是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。
维基百科将“context”定义为:
*在符号学、语言学、社会学和人类学中,语境(context)是指围绕一个焦点事件的对象或实体,在这些学科中通常是某种交际事件。语境是“围绕事件的一个框架,为事件的恰当解释提供资源”。*
能处理语境是AGI(Artificial general intelligence,通用人工智能)的一个重要特征,特别是对于会话型角色。从这个意义上说,语境可以粗略地描述为谈话所依据的轨道。例如,当我们正在讨论19世纪英国的住房问题时,我们不希望谈话会随机转移到南极洲的企鹅或核聚变。语境将可能发生的会话项(conversational items)的解空间(solution space)缩小到合理预期或相关的范围。
语境处理是令深度学习技术惨败的一个领域。虽然可以在文本语料库上训练深度学习网络来提取有意义或合乎逻辑的信息,但这种技术利用的是语言结构中的模式,而不是真正的语境处理。
真正的语境处理是计算密集型的,是在句子、短语、问题、周围信息等之间构建关系图谱,并使用统计分析技术缩小合适的语境范围。
一句像“I love you”这样的话,如果没有周围的信息就会显得模棱两可。表面上这是一种爱情的声明,但如果是跟对立的人说就可能代表讥讽,如果对朋友说又可能代表一种感激或深厚友谊。要搞清楚语境,必须追踪周围信息并与语句相关联。
AGI需要一个应用程序/引擎来跟踪语音/文本以及其他形式的相关信息,以便解析语境。周围的信息不局限于会话中提供的信息,还包括来自知识库和常识的信息。
让我们以一些随机的double entendres(双关语)为例,来说明语句中的歧义是通过知识来解决的:
1.Panda mating fails: veterinarian takes over.
2.Miners refuse to work after death.
3.New obesity study looks for larger test group.
4.Children make nutritious snacks.
5.Criminals get nine months in violin case.
在上述例子中,我们注意到歧义是通过应用我们称之为常识的知识来解决的。运用常识并不一定意味着我们会得到真相,因为奇怪的事情也会发生。例如,在正常的常识下,人类不吃儿童,所以说“Children make nutritious snacks.”在能让人不误解的同时表达出一种幽默感。但是,如果这是一本名为《食人时代》的出版物中的头条新闻,那很可能就是一个合理的
观点。
因此,在确定语境时,我们必须了解所有周围的信息,这些信息的地位高于一般预期。
语境也与memory(记忆或内存)有关。在许多情况下,语句里的上下文可以指代以前的对话,并且在某些情况下,可以不显式地引用。例如,类似“the pidgeon is in the bath”的暗号将指代事先约定的含义,而不是当前字面意思。因此,在不知道约定含义的情况下,对该陈述的分析就会导致无价值结果。引擎追踪语境必须足够灵活,以允许包含特设的上下文映射。
另一种场景是,手势、眼神、脱离语境陈述(out-of-context statements)等暗示了一种与先前语境的关系。例如,一场谈话可能关于某个家庭成员健康,几个小时后,可能会出现一个带有微笑的“he’s ok”的陈述。把前后这两种语境联系起来是一个统计学可能性的问题。语境引擎必须能够在较长的时间内连接上下文并保留所收集的信息。
Double entendres是语音/文本中另一类有趣的歧义。然而,在这里,真正的语境必须从呈现的画面中推断出来。例如,“he grasped the long hard cold steel rod firmly”。因此,任何语境引擎都必须能够将单词与画面联系起来,然后再与类似的项连接起来。在潜台词(sub-text)优先于字面意思(presented text)的语音或文本中,double entendres只是其中一类,此外还常见于带有政治色彩的作品,或是处理禁忌的作品。
语境引擎是一个高度复杂的
应用程序,很难实时运行。在某些情况下,可以通过额外的进程实现再解释(re-interpretations),并且在交互场景中,其必须作为修正引入AGI的会话语音中。如果AGI呈现为一个单独的实体,比如一个人,这可能意味着要等一会儿。但是,如果AGI呈现为多个实体,例如一群人,那么当数据变得可用并呈现为一个组讨论(group discussion)时,就可能会发生中断。
语境引擎依赖于坚实的知识库和关于世界及行为的常识信息。没有这一点,误解将频繁发生,自然语言处理/理解的目标将无法实现,AGI可能也将无法实现。
——End——
爱吧机器人网原创编译,转载需注明。