操作系统
并且突出显示导致计算机猜测的单词
发布者:admin     浏览次数:     发布时间:2019-08-15 13:11

  例如,如果作者写道“海顿哪些主题曲中的变化是由卡尔·费迪南德·波尔启发的?”,系统给出正确回答“约翰内斯勃拉姆斯”,界面突出显示“费迪南德波尔”这个词,以表明这句话触发了它的答案。

  如果谁能能够掌握这些问题,显然将会超越目前所有的计算机系统。这项工作在2019年出版的“计算语言学协会交易”期刊上发表。

  注:《危险边缘》(Jeopardy!),是由梅夫·格里芬在1964年创建的美国的电视智力竞赛节目,问题涉及历史、语言、文学、艺术、科技、流行文化、体育、地理、文字游戏等多方面内容。

  UMD计算机科学副教授,该论文的主要作者Jordan Boyd-Graber说:“大多数问答计算机系统从来没有解释过为什么他们这样回答而不是那样回答。但是我们的研究有助于了解计算机是如何思考、理解的。我们已经制作了一个数据集来测试计算机,这些数据集将揭示计算机语言系统是否实际上正在阅读并进行人类能够进行的相同类型的处理。”

  这六种现象分为两类。第一类是语言现象:释义(例如说跳下悬崖是leap from a precipice而不是jump from a cliff),分散注意力的语言或意外的背景(例如提及某些无关内容的线索)。第二类包括推理技巧:需要逻辑和计算的线索,问题中元素的心理三角测量、或组合多个步骤以形成结论。

  在新界面中,人类作者键入问题,而计算机的猜测在屏幕上按排名顺序出现,并且突出显示导致计算机猜测的单词。

  人工智能的圣杯是一台这样的机器:它能够真正理解人类语言并从复杂细致的段落中诠释其中含义。

  马里兰大学的研究人员已经找到了如何通过人机协作可靠地创建这些问题,并开发了一个包含1200多个问题的数据集。这些问题虽然对人类来说非常简单,却把当今最先进的计算机系统问的哑口无言。

  为了更好地理解语言,必须创建问题来挑战计算机,将其训练的能够应付人类提出的各种问题。

  通过共同努力,人类和计算机可靠地开发了1213个计算机难题,研究人员在竞争期间测试了经验丰富的人类玩家,从初级校队到《危险边缘》(Jeopardy!)冠军。即使是最弱的人类团队也击败了最强大的计算机系统。

  目前大多数改进的问答系统的工作都是使用人类作者或计算机来产生问题。这些方法的固有挑战是,当人们写问题时,他们不知道他们的问题的哪些具体要素会混淆计算机。

  但与我们通常看到的比如江苏卫视的《一站到底》、央视《中国诗词大会》等知识问答类节目不同,《危险边缘》采取一种独特的问答形式:参赛者须根据以答案形式提供的各种线索,以问题的形式作出正确的回答。因此难度要更大。

  “三四年来,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄,”U