2018年全国大学生大数据算法赛(全国大学生计算机技能应用大赛专项赛)
大赛主题:2018年全国大学生大数据比赛(全国大学生计算机技能应用大赛专项赛)报名截止日期:2018年11月15日一、大赛背景为贯彻习近平主席在十九大报告中关于“推动互联网、大数据、人工智能和实体经济深度融合”以及“善于运用互联网技术和信息化手段开展工作”等讲话精神,引导高校在校生学习掌握计算机与互联网知识,提高计算机的技能应用,中国软件行业协会培训中心将于2018年6月至12月举办全国大学生计算机技能应用大赛。大赛旨在增强广大在校大学生的IT应用技能,对于进一步落实学校培养应用型人才的目标要求,培育创新创业人才、促进产学研相结合有着重要意义。全国大学生大数据比赛为本次比赛专项赛之一。本次大赛是培养计算机教育实践平台的具体举措之一,目的是提高大学生综合素质,具体落实、进一步推动高校本科面向21世纪的计算机教学的知识体系、课程体系、教学内容和教学方法的改革,引导学生踊跃参加课外科技活动,激发学生学习计算机知识技能的兴趣和潜能,为培养德智体美全面发展、具有运用信息技术解决实际问题的综合实践能力、创新创业能力,以及团队合作意识的人才服务。二、组织单位主办单位:中国软件行业协会培训中心承办单位:全国百家高校团委、学生会、计算机类社团协办单位:我迅速评审系统软件、DataCastle数据城堡、新思路教育三、活动时间、地点活动时间:2018年8月——2018年12月活动地点:线上官网比赛四、大赛对象、内容(1)大赛的参赛对象是高校所有专业的在校生(含高职、大专、本科及研究生)。(2)大赛参赛内容为计算机技能应用,主要学习和考核的内容为大学生在学习和工作中使用频次最高,实际运用最广的软件基础知识和运用能力,主要科目有大数据算法赛,办公软件应用(Word、Excel、Powerpoint),高级语言程序(C语音),数据库四类。大赛有利于学生动手能力的提升,有利于创新创业人才的培养,提高未来就业竞争力。五、大赛详情:(1)赛事区域针对各省、自治区、直辖市、新疆生产建设兵团相关高校和单位在读的专科生,本科生及研究生。(2)大赛时间大赛报名:8月25日-11月15日初赛:11月17日-11月18日晋级名单公布:11月20日(注:大数据算法赛只有一轮,详情见下方)决赛:11月24日-11月25日获奖公示:12月1日-12月3日(3)奖项设置1、各专项赛根据科目分别评奖;2、初审选取每科目前60%晋级决赛,根据决赛成绩选取前30%颁发全国一二三等奖,比例为1:3:6(注:大数据算法赛无决赛,详情见下方);3、晋级决赛但决赛未获奖的同学,根据初赛成绩颁发若干名全国优秀奖。(4)大赛内容本次大赛共有4个专项赛,共计6个科目,参赛选手可在多个专项赛内任选其一或多个科目参赛,每个科目将独立排名和评奖。六、作品要求符合国家宪法和相关法律、法规;符合中华民族优秀文化传统、优良公共道德价值、行业规范等要求。实操题必须是在本机完成的原创作品,不得抄袭或者由他人代做。七、联系方式“全国大学生大数据算法赛”专项赛官网:http://www.cnccac.com/case1.php其他专项赛(办公软件应用Word、Excel、Powerpoint,C语言大赛,数据库)详情请见官网:www.cnccac.com联系人:蒋老师电话:17333271470QQ咨询:3253389152官方指导交流群:547366788(点击群号即可加群)“全国大学生大数据算法赛”专项赛详情:报名官网:http://www.cnccac.com/case1.php一、参赛内容大数据赛(参赛科目101)采用开放式专家命题,参赛者自主设计的比赛模式,本项赛程要求参赛者须在截止日期前完成考试内容并官网提交。参赛作品的内容要求符合《全国大学生计算机技能应用大赛规程》中的相关规定。二、参赛对象(1)大赛的参赛对象是高校所有专业的在校生(含高职、大专、本科及研究生);(2)学生自行组队参加,每支参赛队为3名学生(包括1名组长)。每支参赛队限1名指导教师,每名学生限参加1支参赛队。各高校参赛队数不限,允许跨校组队。三、参赛时间1、报名阶段:2018年8月28日-2018年11月15日2、提交阶段:2018年11月01日10:00--2018年11月27日10:003、评审阶段:2018年11月27日-11月30日4、获奖公示:2018年12月1日-2018年12月3日(比赛获奖公示,并接受异议、申诉和违规举报)四、奖项设置一等奖:不超过报名队数的5%,荣誉证书二等奖:不超过报名队数的10%,荣誉证书三等奖:不超过报名队数的20%,荣誉证书优秀奖:若干优秀协办单位:若干优秀志愿者:若干其他:三等奖以上获奖学生除获得相应证书外,并可获得免试申请专业技术证书的名额。五、参赛费用参赛者需缴纳报名、考试及评审费用共150元/队。费用用于大赛系统开发、场地、交通、设备、专家评委、交通餐补、获奖证书采购、寄送等。六、参赛说明1、大数据赛仅提交一次参赛作品,12月1日公布获奖名单;2、参赛选手可在多个专项赛内任选其一或多个科目参赛,每个科目将独立排名和评奖,但务必注意比赛时间节点,以免错过参赛时间;3、培训课程:报名参赛的队伍均可免费获得《数据挖掘竞赛入门——房价预测》课程上课码。本课程将带你从零开始上手数据挖掘竞赛,解锁一项新的技能,完成数据挖掘/机器学习的入门训练。你将利用美国KingCounty的房屋销售价格以及房屋的基本信息,通过分析和预测影响消费者购买房屋的主要因素,准确预测房屋的价格。并以此熟悉探索性分析、特征工程、模型训练及优化等流程,能够独立解决数据挖掘竞赛甚至实际业务中的预测问题。课程核心知识点如下:(1)问题分析:掌握数据类型基本情况,分析实验目的及可能用到方法、对目标的实现有一个整体的思路(2)Python数据准备:将训练数据转化成Python语言可以处理和分析的数据(3)描述性统计分析:通过对数据分布及数据不同统计指标的分析,得出数据本身的统计特性(4)数据挖掘和数据预处理:了解数据类型和变量关系,进行变量的编码处理(5)特征工程:变量编码、特征选择、训练集和数据集的划分(6)模型训练与参数调整:通过对比不同模型对相同数据的预测结果分析得到最好的训练模型4、参赛组队:参赛者可自行组队参加,每支参赛队为1-3名成员(包括1名组长)。每支参赛队限1名指导教师。每名学生限参加1支参赛队。各高校参赛队数不限,允许跨校组队5、参赛流程:团队人数上限3人。在第一阶段的最后3天无法新建队伍,但是可以加入其它队伍。在最后一个阶段最后3天无法新建队伍,无法加入队伍。竞赛进入历史阶段后可以新建队伍,但是已参赛队伍不可新增队员、不可解散队伍,注意:答辩队伍成员仅限活跃期间加入的成员。6、评分算法评分标准评分标准:算法通过计算预测值的对数和真实房租月租金的对数的均方根误差来衡量回归模型的优劣。均方根误差越小,说明回归模型越好。均方根误差计算公式如下:其中,RMSE是均方根误差,Xmodel,i是参赛者提交的房屋预测月租金取对数值,Xobs,i是对应房屋的真实月租金取对数值。(取log可以减小异常值对结果的影响)七、其他专项赛(办公软件应用Word、Excel、Powerpoint,C语言大赛,数据库)详情请见官网:www.cnccac.com全国大学生计算机技能应用大赛组委会2018年6月13日