2021年第三届全国高校计算机能力挑战赛人工智能应用赛

2021-09-16 10:27:00    < >

2021年第三届全国高校计算机能力挑战赛


人工智能应用赛


报名时间:2021年8月25日--2021年11月30日
主办单位:全国高等学校计算机教育研究会


竞赛官网地址:
www.ncccu.org.cn/case2.html

 


一、赛题背景

日常生活中,我们经常会在微信、微博等社交工具、公众号文章、甚至新闻稿件中发现许多拼写、语法、标点等错误;经过初步统计:在微博等新媒体领域中,文本敏感和出错概率在2%左右;在语音识别领域中,出错率最高可达8-10%;而在某保险问答领域中,用户提问出错率在去重后仍高达9%,故本次人工智能应用赛的赛题为智能文本纠错。文本纠错作为自然语言处理最基础的模块,是实现中文语句自动检查、自动纠错的一项重要技术,其目的是提高语言正确性的同时减少人工校验成本,其重要程度不言而喻。

 


二、时间安排


报名时间:2021年8月25日--2021年11月30日

初赛开始时间:2021年11月15日15:00起开放数据集下载

初赛截止时间:2021年12月15日15:00截止提交

晋级决赛公示:2021年12月20日

决赛时间:另行通知

 


三、奖项设置

初赛成绩根据各区域考生成绩分别排名,分设一等奖、二等奖、三等奖和优秀奖各若干项,如下:

 

各区域获得初赛一、二等奖获奖选手将晋级决赛。决赛设一等奖、二等奖、三等奖各若干项,总获奖人数不超过总报名数的10%。分别如下:

 


四、赛题和数据

1.任务描述

(1)赛题任务

本次赛题聚焦智媒与文化领域文本数据,主要应用于媒体内容生产等场景,从中检测错误并纠正,提示修改建议。

错误类型:语法错误,包括多字、少字、乱序、标点等;拼写错误,包括同音字、近音字、形近字等。

(2)数据使用规则

本赛题允许使用外部数据。可参考公开数据集:


NLPCC2018语法纠错数据集:
http://tcci.ccf.org.cn/conference/2018/taskdata.php


2.数据集描述

本次挑战赛设置了更具挑战性的任务,提供测试集及少量训练集,会在数据开放下载后公布,总体为低资源的竞赛任务。

初赛:

数据集包含训练集和测试集,训练集用于选手的模型训练,测试集用于最终结果的评测提交。格式如下:

训练集包含三个字段:id,语句,修改后的语句

测试集包含三个字段:id,语句,分词后的语句

决赛:

数据集包含训练集和测试集,训练集用于选手的模型训练,测试集存在在服务器后台,用于最终结果的评测提交,不提供给选手。

训练集包含三个字段:id,语句,修改后的语句

测试集包含两个字段:id, 语句

 


五、评价标准

1.提交次数限制:每支团队每天最多提交3次。

2.评分指标:

主办方将对参赛队伍产生的测试结果与比赛主办方公布的标准结果进行一致性评估,最终得到各参赛队伍初赛作品的评测结果。

比赛使用MaxMatch (M2)记分器进行评估。M2算法是一种广泛应用的语法纠错评价方法。总的思路是计算源语句和系统输出之间的短语级编辑。具体来说,它将选择与注释器中的黄金编辑重叠最多的系统假设。扩展了M2的记分器,以处理多组可选的金标准注释,在这种情况下,对于当前的句子有多个合理的更正。

假设黄金编辑集是{g1, g2,…, gn},系统编辑集为{e1, e2,…,}。精度、查全率和F0.5定义如下:

 

参赛队伍请自行使用官网上的测评程序对测试数据集的输出结果进行评估,如参赛队伍产生的校对结果文件未能与官网上的评估程序相兼容,则需自行对结果格式进行调整和修改。

 


六、作品提交要求

初赛:提交的答案csv文件包含2个字段:id,修改后的语句,详见submit_example.csv文件,文件编码格式为utf-8。

开放提交后,会提供submit_example.csv文件。

复赛:提交模型及代码

1. 提交说明:提交需为zip压缩包,所有文件编码格式为utf-8,目录结构为:

-model

-requirements.txt

-run.py

-other files or folders

【requirements.txt】需包含所有依赖包,及其版本

【run.py】按照函数内部需求,不能修改固定区域的文件

【other files or folders】需要包含所有程序文件,如模型文件,如功能函数

2. 服务器参数

python版本3.7.3

NVIDIA-SMI 418.165.02   

Driver Version: 418.165.02   

CUDA Version: 10.1

3.模型输出文件demo:

   

开放提交后,会提供submit_example.zip文件。

 


七、其他规定

1.数据使用有哪些要求?

本次大赛提供的全部数据、信息等。未经允许,任何人不可以任何形式使用、传播、披露、授权他人使用。

2、限制原则是什么?

作品必须健康、合法、无任何不良信息及商业宣传行为,不违反任何中华人民共和国有关法律。须保证原创性,不侵犯任何第三方知识产权或其他权利;一经发现或经权利人指出,主办方将直接取消其参赛资格,主办方保留赛事解释权。

 


八、联系信息


竞赛官网地址:
www.ncccu.org.cn/case2.html

<  上一篇:2021年第三届全国高校计算机能力挑战赛—程序设计赛

>  下一篇:第七届上海公益微电影节

最专业、最权威的技术团队用心做事,为您抓住痛点、解决困惑。
  • 参品人员越来越多,
    作品量越来越大
  • 评审工作繁重复杂
    评委对目前的评审感到体力透支
  • 人工统计容易出错
    评审的公正性受到质疑
  • 评审结果统计繁杂,
    评审类目繁多时间长

迅速专家评审系统软件技术

卓越的技术,一流的团队,为您打造专家级评审系统软件。
本系统为B/S构架,采用微软的ASP+MSSQL技术,客户端页面使用html5页面,采用div+css、jQuery、js和flash技术。总共包含11种权限,10大系统,23个子系统。
迅速专家评审系统产品中心
成熟、稳定、高效

音乐评审系列

原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛

广告评审系列

原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛

项目评审系列

原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛、大学生音乐大赛、原创音乐大赛

专家评审系统软件优势

评审系统软件始终以满足顾客为己任,成就评审系统第一品牌。
评审操作简易快
方向键左右键控制评审翻页,下键投票,上键取消投票,操作简易快。
运营与技术并重
技术是基础,服务是保障。我们能做的不仅仅如此,我们致力于让每一位客户都能通过运营网站产生价值。
支持文件格式
作品上传格式支持jpg、gif图片文件,MP4、Flv视频文件,MP3音频文件,pdf文档,网页和flash动画。
不间断 服务支持
从售前到售后,均由专人一对一提供技术支持,及时为客户解决问题。指导客户更好的管理网站,已达更好的展示。

专家评审系统软件客户案例

专业的服务,高效的方案。

专家评审系统软件客户见证

评审系统软件始终以满足顾客为己任,成就评审系统第一品牌

专家评审系统评审步骤

  • 作品录入
  • 会场布置
  • 平面作品评审
  • 视频作品评审
  • 评审监控
  • 评审统计

迅速评审系统资质