2015年,CCF(中国计算机学会)的大数据创新大赛将在下面的平台上运行:
DataCastle: www.pkbigdata.com
我们首期推出两个测试比赛,提供100000元奖金,但是暂不计入年度总排名积分中,供各位热身,以及测试平台的稳定性。
1. 学生成绩排名预测
http://www.pkbigdata.com/c/00000000058
我们希望通过借助大数据相关的挖掘技术和基础算法,从学生的校园行为数据中,挖掘用户作息规律、兴趣爱好等,精准地预测学生之间的相对排名。通过对这些日常行为的建模来预测学生的学业成绩,可以实现提前预警学生的异常情况,并进行适当的干预,因而对学生的培养、管理工作将会起到极其重要的作用。但是为了保护用户隐式起见,我们并不预测学生的具体成绩,只是预测学生之间的相对排名。
2. 图像搜索
http://www.pkbigdata.com/c/00000000057
数据集描述
1) 图片库
第一组:15万张女装图片,其中有30张目标图片,图片命名为clothes_id。
第二组:15万张鞋图片,其中有30张目标图片,图片命名为shoes_id。
2)查询图片
第一组:3张女装图片,图片命名为clothes_id。
第二组:3张鞋图片,图片命名为shoes_id。
目标图片是指我们希望参赛队伍搜索出的图片。每张查询图片对应有十张目标图片。
任务描述
参赛队伍需要开发图片搜索程序,为图片库建立索引,再用查询图片进行搜索。每次用1张图片进行查询,得到50条搜索结果,按照相关度从高到低排序。总共有6次查询,300条搜索结果。结果以csv格式文件提交。