50000元大奖的数据挖掘比赛,欢迎大家参加!
周涛  |  2015-09-26  |  科学网  |  439次阅读

50000元奖金职位预测竞赛【新竞赛上线】



 

全国大数据挖掘竞赛第四站:简历数据的职位预测!

以前的比赛中,例如考试成绩预测,有全球近800支队伍参赛,成绩排名靠前的团队不仅获得了奖励,还可以申请到国外很好的大学。本次竞赛是基于简历数据的职位预测,参赛者通过对训练集数据进行学习、编码与测试,挖掘出职位路径的走向与规律,形成算法模型,再对测试集数据中置空的信息进行预测,预测准确度越高的参赛者排名越高。

 

详细情况请访问:www.pkbigdata.com  

 

---- 情况简介 ----

 

【数据集描述】

训练集:匿名7万优质简历数据,标准json格式 包含字段:id,性别,年龄,专业,学历,工作经验(开始时间,结束时间,公司行业,公司规模,月薪,职位名称,部门,职位类型)

测试集:匿名2万优质简历数据,标准json格式 包含字段与测试集一样,只是将部分信息置空,需要参赛者进行预测

 

【竞赛奖励】

第1名:30000

第2名:10000

第3名:5000

第4名:3000

第5名:2000

注:本次竞赛还提供获奖证书及高级算法工程师职位

 

【作品提交】

线上环节(9月23日-12月20日)提交CSV结果文件,获得实时排名

线下答辩(12月下旬)提交算法说明文档等,并准备答辩材料进行线下答辩

 

【评分算法】

1.预测学位-A, 二值化0,1,相等给1分,否则0分;

2.预测公司规模-B,二值化0,1,相等给1分,否则0分;  

3.薪水范围预测-C,二值化0,1,相等给1分,否则0分;

4.职位名称预测-D,二值化0,1,相等给1分,否则0分;  

5.预测维度权值: wa=0.35 wb=0.86wc=0.74 wd=2.25 ;  

 

一条预测的得分:one = (A*wa + B*wb + C*wc + D*wd)/(wa+wb+wc+wd)

最终得分:sum(ones)/20000  

A,B,C,D 映射关系以及可能出现的值请参考平台“映射关系.txt”


---- 附录 ----

全国大数据挖掘竞赛第一站:个性化新闻推荐;

全国大数据挖掘竞赛第二站:图像搜索竞赛+学生成绩排名预测;

全国大数据挖掘竞赛第三站:验证码识别。





文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文