50000元奖金职位预测竞赛【新竞赛上线】
全国大数据挖掘竞赛第四站:简历数据的职位预测!
以前的比赛中,例如考试成绩预测,有全球近800支队伍参赛,成绩排名靠前的团队不仅获得了奖励,还可以申请到国外很好的大学。本次竞赛是基于简历数据的职位预测,参赛者通过对训练集数据进行学习、编码与测试,挖掘出职位路径的走向与规律,形成算法模型,再对测试集数据中置空的信息进行预测,预测准确度越高的参赛者排名越高。
详细情况请访问:www.pkbigdata.com
---- 情况简介 ----
【数据集描述】
训练集:匿名7万优质简历数据,标准json格式 包含字段:id,性别,年龄,专业,学历,工作经验(开始时间,结束时间,公司行业,公司规模,月薪,职位名称,部门,职位类型)
测试集:匿名2万优质简历数据,标准json格式 包含字段与测试集一样,只是将部分信息置空,需要参赛者进行预测
【竞赛奖励】
第1名:30000
第2名:10000
第3名:5000
第4名:3000
第5名:2000
注:本次竞赛还提供获奖证书及高级算法工程师职位
【作品提交】
线上环节(9月23日-12月20日)提交CSV结果文件,获得实时排名
线下答辩(12月下旬)提交算法说明文档等,并准备答辩材料进行线下答辩
【评分算法】
1.预测学位-A, 二值化0,1,相等给1分,否则0分;
2.预测公司规模-B,二值化0,1,相等给1分,否则0分;
3.薪水范围预测-C,二值化0,1,相等给1分,否则0分;
4.职位名称预测-D,二值化0,1,相等给1分,否则0分;
5.预测维度权值: wa=0.35 wb=0.86wc=0.74 wd=2.25 ;
一条预测的得分:one = (A*wa + B*wb + C*wc + D*wd)/(wa+wb+wc+wd)
最终得分:sum(ones)/20000
A,B,C,D 映射关系以及可能出现的值请参考平台“映射关系.txt”
---- 附录 ----
全国大数据挖掘竞赛第一站:个性化新闻推荐;
全国大数据挖掘竞赛第二站:图像搜索竞赛+学生成绩排名预测;
全国大数据挖掘竞赛第三站:验证码识别。