首届腾讯社交广告高校算法大赛
大赛名称:首届腾讯社交广告高校算法大赛报名截止日期:5月31日12:00前大赛简介腾讯社交广告高校算法大赛是面向高校大学生的算法大赛,作为腾讯核心的广告业务单元,腾讯社交广告通过对海量社交数据进行深入分析,构建多样广告场景,与8亿用户连接对话。在大数据、机器学习领域的持续创新投入,驱动社交广告生态发展。本次大赛旨在开放腾讯在社交和数字广告领域的真实数据,面向高校学生征集最智慧的算法解决方案。大赛流程1.线上报名2017年4月12日~5月31日参赛者使用QQ号登录并完成注册认证2.身份认证2017年4月12日~5月31日参赛者提供身份证号码,并上传包含本人照片的有效身份证明,如身份证、护照、驾驶证等,以及学生证照片,完成实名身份认证3.初赛约1个月2017年5月10日~6月7日-初赛分为初赛A和初赛B两个阶段,登录并完成注册后,参赛队伍可进行数据下载及本地算法调试,每天(中午12点开始的24H内)限提交3次结果,系统将实时计算得到此次结果的评分,并在个人主页上显示-初赛开始后,系统每天进行一次排名。每天基于12:00前提交的结果,按照参赛队伍的历史最优成绩从高到低依次排序,并于13:00更新排行榜,此排行榜成绩不作最终排名计算-系统在初赛A阶段(5月10日12:00:00-2017年5月31日11:59:59)使用初赛测试集数据的30%来计算得分和排名,在初赛B阶段(2017年5月31日12:00:00-2017年6月07日11:59:59)使用初赛测试集数据剩余的70%来计算得分和排名,最终成绩排行榜将以初赛B阶段各参赛队伍的历史最好成绩进行排名-初赛最终结果提交时间为6月7日12:00,并于13:00更新排行榜。结束时,成绩排名前20%(最多不超过200支,具体根据报名数量确定,以大赛官网解释为准)的队伍进入决赛4.决赛约3周2017年6月8日~6月28日-决赛分为决赛A和决赛B两个阶段,决赛开始后,参赛队伍可进行数据下载及本地算法调试,每天(中午12点开始的24H内)限提交3次结果,系统将实时计算得到此次结果的评分,并在个人主页上显示-决赛开始后,系统每天进行一次排名。每天基于12:00前提交的结果,按照选手的历史最优成绩从高到低依次排序,于13:00更新排行榜,此排行榜成绩不作最终排名计算-系统在决赛A阶段(2017年6月08日12:00:00-2017年6月22日11:59:59)使用决赛测试集数据的30%来计算得分和排名,在决赛B阶段(2017年6月22日12:00:00-2017年6月28日11:59:59)使用决赛测试集数据剩余的70%来计算得分和排名,最终成绩排行榜将以决赛B阶段各参赛队的历史最好成绩进行排名-决赛最终结果提交时间为6月28日12:00,并于13:00更新排行榜。结束时,成绩排名前10名(含并列)的队伍进入答辩5.答辩7月上旬-参与答辩的队伍需提前准备评审材料(含答辩PPT,算法详细说明,团队分工,以及代码,现场核验有效证件)-现场将邀请最终决赛前10只队伍参加答辩,前3名队伍分别荣获冠亚季军,并颁发奖金及证书(未到现场视为放弃比赛)-除冠亚季军外,十强其余选手获得奖金和荣誉证书-决赛与答辩评分占比各50%,具体答辩细则届时详见大赛相关公告说明奖项设置冠军300,000RMBMacBookAir×1获奖证书亚军100,000RMBiPhone7Plus×1获奖证书季军50,000RMBiPadPro×1获奖证书参赛对象·参赛对象:在校生(包含本硕博)·报名截止时间:5月31日12:00前·账号体系:参赛者使用qq号注册,每个参赛队员均需注册报名·必填字段:邮箱、手机号码说明:在5月31日12:00前完成身份认证(包括身份证号码,上传包含本人照片的有效身份证件,如身份证、护照、驾驶证等,以及学生证照片)组队规则·组队规则:任何人都可以自由组建团队,未组建团队的,默认以个人参赛,组队的即为队长,任何人只能参加一支团队。·队长职责:队长负责邀请队员(通过团队密令),管理团队成员,以及提交比赛结果。·队员权利:申请加入队伍,提交比赛结果,退出队伍。·团队规模:团队最大人员限制为3人。·队伍成绩:队员提交的成绩属于队伍,只有在队期间提交的成绩才属于队伍成绩,加入队伍之前的成绩不会计入队伍成绩,如果某位队员中途退出队伍,该队员在队期间的成绩不会消失。·队伍变更截止时间:5月31日12:00前,之后将不能加入、退出队伍,也不能修改队伍名。赛题类FAQ1.什么是转化回流时间?App的激活定义为用户下载后启动了该App,即发生激活行为。从用户点击广告到广告系统得知用户激活了App(如果有),通常会有较长的时间间隔,主要由以下两方面原因导致:1)用户可能在下载之后过了很久才启动App;2)用户启动App的行为需要广告主上报回传给广告系统,通常会有一定的延时。这里回流时间表示了广告主把App激活数据上报给广告系统的时间,回流时间超过5天的数据会被系统忽略。值得注意的是,本次竞赛的训练数据提供的截止第31天0点的广告日志,因此,对于最后几天的训练数据,某些label=0并不够准确,可能广告系统会在第31天之后得知label实际上为1。2.原始时间信息抹掉了,关键数据源时间关系是什么?为了直观起见,如下图所示:3.初赛和复赛数据是如何选取的?从复赛数据中根据appID随机采样得到初赛数据。4.用户个人资料和App安装数据来源?数据来自腾讯业务产品历史上一段时间真实数据集合的小量随机采样,关键字段均经过加密处理,只提供ID字段表示,不提供具体含义。数据处理上为比赛用途单独设计,不考虑、也不作为其他用途。5.app_categories.csv中的非三位数字非0的表示什么意思?app_categories.csv中appCategory除0外的一位数字,如1,2,表示只有一级类目,没有二级类目;6.请问train.csv中出现的安装和用户安装流水user_app_actions.csv是什么关系?我发现在user_app_actions.csv中,27日只有两位用户安装3个应用,而在train.csv中则是多很多。user_app_actions.csv中用户的安装流水是通过腾讯的其他产品收集,采样和加密处理得到,是作为train.csv中用户安装数据的一个补充。27号数据较稀疏(其他日期的数据也有可能出现类似的情况),是由于上游任务延迟导致的,也是广告业务场景会碰到的真实场景,对特征抽取和模型训练来说会是一个挑战。7.训练集最后几天的label可能是不准的,那测试集的label是准确的吗?测试集的label是准确的,表示最终是否有转化。8.本次比赛是否允许使用外部数据?不允许使用外部数据。规则类FAQ1.如何参赛?2017年4月12日12:00启动报名,2017年5月31日12:00报名及认证截止,请在报名截止时间前访问大赛官网,注册并提交报名信息即可参赛。初赛在2017年6月7日12:00截止,决赛在2017年6月8日12:00启动,决赛会根据初赛的参赛队伍及排名,选取成绩排名前20%(最多不超过200支)的队伍进入决赛,具体请见大赛公告实时通知。2.参赛队伍可获得哪些奖励?推荐注册阶段推荐有奖(推荐报名人数最多的前30名),获得腾讯视频VIP会员一年或者200Q币报名注册且提交有效成绩的前300个团队或者个人,可获得大赛文化衫初赛1)共四周,每周周冠军(以每周三12:00更新成绩为准)队伍,奖励kindle一台2)初赛前50名,获得晋级荣誉证书以及大赛定制奖品一份决赛1)共三周,每周周冠军(以每周四12:00更新成绩为准)队伍,奖励kindle一台+决赛周冠军荣誉证书2)每周相比上周排名名次提升最大的队伍,奖励kindle一台(本周四12:00成绩对比上周四12:00成绩)3)决赛前20名,获得校园招聘(包括实习)免笔试绿色通道以及大赛定制奖品一份答辩冠军:一支队伍,奖金300000元,颁发荣誉证书;指导老师获得MacAir一台亚军:一支队伍,奖金100000元,颁发荣誉证书;指导老师获得iPhone7Plus一台季军:一支队伍,奖金50000元,颁发荣誉证书;指导老师获得iPadPro一台全国十强其他7支队伍:每支队伍获得奖金10000元,颁发荣誉证书3.如何获取各阶段比赛结果?各阶段比赛结果将于大赛官网公告栏进行公示,并通过邮件通知团队队长。4.为什么要实名认证?为了保证比赛的公平性,本次比赛仅针对在校学生;公司或相关业内从业人员可参与比赛但暂不参与评奖,发现有冒名或其他作弊行为的取消比赛成绩。其他赛事相关问题可以发送邮件到官网邮箱。所有获奖选手必须通过认证才能领奖,所有奖项的设置及其解释权归属腾讯社交广告。5.比赛结果提交错误怎么办?每天(中午12点开始的24H内)有三次机会提交比赛结果,提交后由系统自动打分。若出现其他异常错误,可以通过大赛官方邮箱、QQ联系主办方进行处理。大赛官方邮箱:TSA-Contest@tencent.comQQ:3349361056QQ群:150522270(进群请备注:姓名+学校+我迅速评审系统软件推荐)6.每支队伍人数有限制吗?如何加入其他团队?每支队伍不能多于3人,也可以单人组队;队长头衔可转让,如果是一个人的队伍,可通过团队密令加入其他团队。大赛官网:http://algo.tpai.qq.com/home/home/index.html媒体支持:我迅速评审系统软件http://ps.webxun.com