当前位置:首页 > 企业新闻
机器阅读理解首次超越人类!云从科技创自然语言处理新纪录【千赢网页登录】
时间:2021-01-17 来源:首页 浏览量 28245 次
本文摘要:时隔棋、棋师、游戏等领域,人工智能首次在深度读者解读中打破人类。

时隔棋、棋师、游戏等领域,人工智能首次在深度读者解读中打破人类。2019年3月8日,中国人工智能国家队云从科学技术和上海交通大学领导宣布,在自然语言处理方面取得了重大突破,在大型深层读者解读任务数据集RACE数据集中获得了重大突破,在大型深层读者解读任务数据集中获得了RACE数据集中获得了世界首个多达人类名单的模型。有评论指出,这不是机器深入解读人类语言的开始。

在论文中,云从科学技术和上海交通大学基于原始DCMN算法,明确提出了新的模型,机器读者的解读精度提高了4.2个百分点,高中考试问题部分首次打破了人类(机器精度69.8%,普通人类69.4%)。该研究成果在应用领域配备文字识别OCR/语音识别技术后,NLP不协助机器更好地解读人类文字/语言,广泛应用于服务领域:协助企业识别客户风险,审查内部文件合规性,从语义层面查询相关信息突破语义解读瓶颈这次云从科学技术和上海交通大学在自然语言处理(NLP)领域的深度读者解读中排名第一。

RACE是一个大自初中考试题目的大型读者解读数据集,包括大约2.8万篇文章和近1万题。其形式与英语考试读者解读(选择问题)相似,通过读者解读文章,明确提出的问题(Question)从4个选项中自由选择正确的答案。这个问题类型的正确答案不一定要反映在文章中,不能从语义上理解文章,分析文章中的线索,根据上下文推理小说,投票决定正确答案。

对比以往的提取类读者解读,算法拒绝更高,被指为深度读者解读。RACE数据集的难题是,因为正确的回答不需要用于文章的话题,所以不需要从文章中搜索回答。必须从语义理解文章,就不能正确提问。

千赢网页登录

解决方案如何在相当大的问题库文章中(28000个)找到正确的答案?云从科学技术和上海交通大学开始了p、q、a之间的给定机制,被称为DualCo-Matching的Network(全称DCMN),基于这个机制的探索性研究了p、q、a的各种人群的给定战略。结果表明,使用PQ_A的给定战略,首先将P与Q连接,然后与A给定,战略取得了优异的结果。此外,模型(基于PQ_A战略)与其他未知模型和纯粹基于BERT的模型进行了比较,从RACE到leaderboard的结果可以得出以下结论:云从技术和上海交大的单体模型已经打破了所有单体或Ensemble模型的云从技术和上海交大的Ensemble模型在高中主题(RACE-H)部分高于人类结果。论文来自中国人工智能国家队云从科技和上海交通大学。

云从科技产卵在中国科学院,2017年3月,分担国家人工智能基础项目——人工智能基础资源公共服务平台建设任务。2018年10月国家人工智能基础资源与公共服务平台发布会上,云从科技创始人周赛明确提出人工智能发展五个阶段,核心技术闭环是五个阶段最重要的基础。从感觉到理解决策的一系列技术构成了核心技术闭环:1-感觉技术:面部识别、语音识别、文字识别OCR、体态识别、跨镜跟踪(ReID)、车辆识别等2-理解决策:自然语言处理(NLP)、大脑科学、大数据分析(风触、正确营销)等现在,云从科学技术分担了国家发展改革委员会和工信部的人工智能基础平台、人工智能应用于平台和人工智能的核心芯片平台项目在此基础上,云从科学技术致力于统一计算能力、智力、数据等资源及其成果,建立人工智能开放平台和生态,进一步提高人工智能在金融、安全、交通、零售、商业等最重要行业的落地和深度融合。

附件:论文理解1.DCMN给定机制以P和Q之间的给定为例,说明DCMN给定机制。右图为p和q之间的DCMN给定框架。云从科学技术和上海交通大学用于现在NLP最近的研究成果BERT分别是P和q中的Token开展代码。

基于BERT的代码,可以得到的代码是包括P和Q在内的上下文信息的代码,而不是同一个静态代码,如上图中的Hp和Hq;其次,通过Attention的方式构筑P和Q的给定。具体来说,是构筑p中Token在q中的Attendances,即Question-Aware的Passage,如上图中的Mp。这样得到的所有p的Token代码都包括与Question的给定信息,为了充分利用BERT给出的上下文信息和p和q给出的信息,将P中所有Token的BERT代码Hp与P中所有Token和q给出的代码Mp融合起来,对Hp和Mp进行元素的除法和乘法操作者,通过转录函数获得P和Q的最后融合应对,图中的应对是Spq2.各种给定战略研究除了p和a之间的给定外,还可以有q和a、p和q之间的给定,以及不同给定的给定方向之间的人,这些给定和人包含不同的给定战略。

7种不同的给定战略分别实验,寻找更合适的给定战略,分别是:[PP_Q;P_A;P_A;P_Q],[P_Q;P_A;P_A;[P_Q],[P_A;Q_A;Q_A;Q_A;[PQ]、[PQ_A]、[P_QA]、[P_QA]、[PA_Q]、[PA_Q]PA回应将P和A连接成一个序列,然后参与给定,PQ和QA一样。符号[;的反应将各种结果组合在一起。[P_Q;P_A;Q_A模型下的模型结构如下图所示:7种不同的策略通过测试,使用PQ_A的给定策略,即将P与Q连接,然后与A给定,无论是初中主题(RACE-M)、高中主题(RACE-H)还是整体(RACE),这种策略都优于结果。


本文关键词:千赢网页手机版,千赢网页登录,千赢网页首页

本文来源:千赢网页手机版-www.taiwanifa.com

版权所有中卫市千赢网页手机版科技股份有限公司 宁ICP备96407557号-2

公司地址: 宁夏回族自治区中卫市洛扎县明克大楼414号 联系电话:0663-82471833

Copyright © 2018 Corporation,All Rights Reserved.

熊猫生活志熊猫生活志微信公众号
成都鑫华成都鑫华微信公众号