中企动力 > 头条 > 百度阅读

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

百度阅读

2018机器阅读理解技术竞赛报名即将截止 百度邀你挑战中文机器阅读理解 互联网视频课程

img

Gong

关注
2018机器阅读理解技术竞赛在机器阅读理解领域掀起了热潮,自3月1日正式开放报名至今,已经有800多支团队或个人报名参赛。3月31日,竞赛将停止报名,同时开放百度DuReader新数据集,参赛者可登录竞赛官网(http://mrc2018.cipsc.org.cn/)下载,并开启竞赛任务。还未报名的研究团队,也可抓住最后的时间,登录官网报名参赛。3月31日报名的队伍当天即可下载新数据集。

2018机器阅读理解技术竞赛由百度公司、中国中文信息学会(CIPS)、中国计算机学会(CCF)联手举办,旨在为研究者提供学术交流平台,进一步提升阅读理解的研究水平,推动语言理解和人工智能领域技术和应用的发展,是中文机器阅读理解领域的重大赛事。

大赛信息一经公布,便受到了全球机器阅读理解领域研究者的广泛关注。截至3月25日,全球参与竞赛的队伍和个人注册报名数量达到824个,其中国际队伍109个,国内报名队伍715个。参赛的国际团队来自美国、英国、加拿大、新加坡等十余个国家。高校、科研院所和企业是参赛队伍中的主力,333支报名团队来自高校和科研院所,112支团队来自企业。据统计信息,全国116所211高校中,将近一半有研究团队报名参赛。

为了给本次参赛的研究者们提供有力的支撑,百度将提供来自搜索引擎真实应用场景的大规模中文阅读理解数据集DuReader,包含百度搜索用户的30万个真实问题,每个问题对应5个候选文档文本,以及人工撰写的优质答案。同时,数据集还标注了问题类型、实体和观点等丰富信息,并且划分为27万的训练集,1万开发集和2万测试集。其中,去年11月百度首批发布的DuReader数据集中的20万问题数据,参赛者可自由下载用于训练和测试,本次竞赛的30万数据集(包括新增的10万问题数据集)将于3月31日凌晨0点正式在官网数据下载区公布,参赛者可以重点关注。

机器阅读理解(MachineReadingComprehension)是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器智能水平、使机器具有持续知识获取能力具有重要价值,近年来受到学术界和工业界的广泛关注。百度在自然语言处理(NLP)领域已经过十余年积累与沉淀,具备了最前沿、最全面、最领先的技术布局,不仅专注于前瞻技术探索,更致力通过技术应用解决实际问题。

目前,世界机器阅读理解领域经典赛事多集中在英文领域,比如由斯坦福大学发起的SQuAD挑战赛以及微软的MSMARCO机器阅读理解测试,而基于百度DuReader的2018机器阅读理解技术竞赛无疑将成为中文机器阅读理解领域的一大盛事。报名地址及赛事详情可登录2018机器阅读理解技术竞赛官网了解。

近半211院校加入团战,百度2018机器阅读理解竞赛火热报名中 行业视频课程

img

诺伊豪斯

关注
由中国中文信息学会(CIPS)、中国计算机学会(CCF)和百度公司联手举办的“2018机器阅读理解技术竞赛”已于2018年3月1日正式启动,获胜团队将分享总额10万人民币的奖金,并将在第三届“语言与智能高峰论坛”上进行技术交流和颁奖。

自开启报名通道后,大赛已收获了海内外800多支队伍的积极响应。目前,大赛仍在火热报名中。截至3月25日,本届竞赛已有全球824个队伍和个人注册报名,其中333支团队来自海内外149所高校和科研院所、112支团队来自78家企业。据统计信息,全国211高校中将近一半的高校有研究团队报名参赛,成为参赛队伍的主力。。参赛的国际队伍有来自美国、英国、加拿大、新加坡等十余个国家的109个团队及个人,汇集了全球的AI技术优质人才。

3月31日,大赛报名将会截止,同时对报名者开放全部训练数据,参赛者可登录2018机器阅读理解技术竞赛官网(http://mrc2018.cipsc.org.cn/)下载,并开启竞赛任务。还未报名的个人及团队,请在规定时间内登录竞赛官网报名参赛,与海内外众多AI人才一较高下。3月31日报名的队伍当天即可下载新数据集。

机器阅读理解的任务就是让机器阅读文本,回答和阅读内容相关的问题,其中涉及到语言理解、知识推理、摘要生成等复杂技术,极具挑战。在当今互联网应用中,智能搜索、内容推荐、语音助手与智能客服等领域的发展,都大量依靠于机器阅读理解阅读真实问题、真实互联网材料,给出完整答案的AI能力。从海量真实数据中训练AI,是自然语言处理和人工智能领域的重要前沿课题。百度与CIPS、CCF联合举办2018机器阅读理解技术竞赛并开放数据集,旨在为研究者提供学术交流平台,进一步提升机器阅读理解技术的研究水平,并希望更多研究者能够利用数据集产出更好更优质的机器阅读理解模型,推动语言理解和人工智能领域技术研究和应用的发展。

为此,本次竞赛中将提供面向真实应用场景的大规模中文阅读理解数据集。数据集包含来自百度搜索的30万个真实问题,每个问题对应5个候选文档文本,以及人工撰写的优质答案。竞赛任务是对于给定问题q及其对应的文本形式的候选文档集合D=d1,d2,...,dn,要求参评阅读理解系统自动对问题及候选文档进行分析,输出能够满足问题的文本答案a。为了便于参赛选手快速了解竞赛任务,竞赛还提供了两个开源的阅读理解基线系统,并采用ROUGH-L和BLEU作为评价指标。

有数据显示,中国人工智能人才缺口超过500万,在自然语言处理技术成为人才竞争核心领域之一的今日,百度通过开展机器阅读理解技术竞赛、百度之星开发者大赛、PaddlePaddleAI大赛等多个人工智能行业竞赛并开放海量优质AI数据资源,正是希望携手并赋能AI行业的优质人才,进一步推动人工智能领域的技术交流和发展,为研究者提供强大的学习驱动力与创造力,培养与成就更多中国人工智能领域的精英技术人才,最终持续推进中国AI产业的发展,让越来越多的中国面孔亮相于人工智能领域的世界舞台。

同时,百度诚邀所有对AI有兴趣的技术人才了解和关注百度AI数据集,已公开的阅读理解数据集可以自由下载https://ai.baidu.com/broad/introduction?dataset=dureader,并通过平台提交算法模型,根据测试结果进行系统效果验证。除了阅读理解数据集,百度AI公开数据集计划BROAD(BaiduResearchOpen-AccessDataset)还发布了视频和图像数据集,更多数据集参见:https://ai.baidu.com/broad。

未来,百度将继续在AI人才培养中发挥重要作用,助力产学研各方开展研究,提升我国在机器阅读理解技术领域的影响力,让人才成为AI领域持续领跑的强力引擎。

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP