好学生是如何炼成的——在最冷的20天吃早餐?
周涛  |  2015-08-11  |  科学网  |  526次阅读

一个略作删节和改动的版本请见:http://news.163.com/15/0810/06/B0KURC9B00014AED.html


关于成绩预测的全国比赛

http://www.pkbigdata.com/page/html/user/userNav.html?data=127 



知道一名大学生每天在教学楼打几次开水、什么时段宅在宿舍、几点钟洗澡,能干嘛?推测他(她)流了多少汗?宅不宅?还是成都天气有好热?这些都太小儿科了。近日,国内大数据领域领军专家、电子科技大学周涛教授与有着近十年教育经验的吕红胤研究员,联合研发出一套“大数据”系统——“学生画像”,通过挖掘、分析学生的消费行为、活动轨迹、考试成绩等大数据信息,“算”出每名学生的学习、生活状态,引导他们更好地规划各自的学业和就业方向。

 

怎么“算”?

用行为轨迹数据刻画学生“画像”

目前,“学生画像”系统已覆盖电子科大两万余名本科生,其基础数据源于学籍信息、毕业去向、校内行为记录等,包括吃饭、购物、打水、进出图书馆、借阅图书、宿舍门禁、洗澡、使用洗衣机、乘坐公交……记录了每名学生的几乎所有在校活动轨迹。

研究团队首先根据这些数据与实际行为的关联性,“算”出每名学生的学习、生活状态,然后设计出一系列辅助他们更好规划各自学业的功能模块。以挂科预警模块为例,学生在教学楼打水频率和进出图书馆的时间与次数被记录下来,一定程度上反映了一名学生的学习状态。研究团队首先利用这两项数据信息,算出学生的“努力程度”;同理,又用已考科目成绩、已考与将考科目之间的关联性,算出学生的“学习基础”;最后综合“努力程度”和“学习基础”算出将考科目的“挂科率”,进而向“挂科率”较高学生的辅导员推送预警信息。

“当然,数据项目之间的关联度强弱不同,在计算公式中的权重体现也不同。”据电子科技大学教育大数据研究所副所长,原微软亚洲研究院的连德富教授介绍,每名学生除了能在系统上看到自己的“画像”外,还能看到同专业同学的平均水平以及自己的相对优势和劣势,“这就像跟学长学姐或者成绩更好的同学取经,而且讲得更全面更细致。”

 

“算”出啥?

成绩好的学生每天固定时间出门

通常在样本量很大的情况下,想要弄清不同成绩水平的学生群体与他们行为特征之间的对应关系是非常困难的,但“大数据”技术让一切变得便捷。研究人员分析了近半年的宿舍门禁、吃饭、进出图书馆等记录,发现成绩较好的学生作息时间比成绩差的更规律。

例如,新能源材料与器件专业排名第3的小雪,几乎每天固定在8点、12点、14点三个时间点出门,留在宿舍的总时长低于专业平均水平。而该专业成绩排名第61的小石每天进出宿舍的时间很随机,而且通常每次外出的时长不超过2小时,“宅指数”明显高于专业平均水平。

 

党员学生最爱在晚上1011点洗澡

研究人员还对不同政治面貌的学生群体进行了对比研究,同样证实了成绩较好的学生作息相对更为规律。

以洗澡时间的选择为例,电子科大的澡堂是白天全天开放的,数据分析结果显示有23.1%的党员学生集中在晚上1011点之间洗澡,远高于非党员学生洗澡比例,而在其它时段洗澡的党员学生比例则均低于非党员学生;而在学习成绩方面,党员学生平均分约79分,比非党员学生平均分高5分左右,党员学生的考研成功率以及出国留学获得奖学金的概率均高于非党员学生。这也暗示生活的规律性对于成绩有正面的影响。

不过,对于学生作息规律与取得好成绩之间关系,四川省社会学学会会长、四川大学心理学研究所所长陈昌文教授认为,还要看具体是学什么样的科目,知识性科目的学习,要靠反复的训练,抛开智力因素不谈的话,行为规律性较强的学生更容易取得好成绩,这在中小学生群体中表现得更加明显。所以,要想自己的孩子成绩好,比上培训班更重要的是,从小培养好的生活习惯和学习习惯。例如,连德福等人发现,在成都最冷的20天还经常吃早餐的同学,成绩也相对更好。

 

还能“算”啥?

预测抑郁易感人群

研究团队还希望挖掘系统在关注学生心理健康方面的作用。“科学实验证实,抑郁易感人群具有一些共同的行为特征,比如性格孤僻、自我专注、受挫后生活规律突然紊乱等。”吕红胤告诉记者,研究团队正在设计算法,希望通过行为数据找出抑郁易感人群,以便向校方预警,进而及时对抑郁易感的学生做针对性的心理辅导。

比如,想要知道一个人性格是否孤僻就得知道他的人际关系如何。“30天内,两个素不相识的人,有两次或两次以上前后脚打水、打饭、进公寓、进出图书馆或坐公交车经历的概率,不超过十二万分之一。”目前,研究所创始人周涛教授基于此,独创出一套算法,通过各种各样的“前后脚”数据,算出了每名学生的“在校朋友圈”,量化学生孤独的程度。周涛等人发现,电子科大最孤独的一群人出现心理问题概率比一般人大一个数量级。

 

数据收集不是监控学生是为学校决策提供参考

通过挖掘学生行为轨迹,能知道学生进出图书馆、寝室教室以及的记录,这是否意味着学生的行踪被监控,侵犯了学生的隐私权?

其实不然。据连德富介绍,如今,“大数据”已渗透到生活的各个领域。学校做数据收集,不会去强调每个人的情况,而是查看学生整体的学习生活状况,及时预测预警学生异常状况,为学校的决策提供数据支撑。比如,根据学生就业能力情况,学校及时开展个性化引导,提升学校学生就业水平;根据学生实际消费情况,找出隐性困难学生,提升学校人文关怀等。“有了数据作为支撑,每一个教学管理者驾驭时间和空间局限性的能力,都可以得到巨大提升。”连德富说。

此外,系统自身也特别重视对学生的隐私保护。所涉及的数据已经严格的加密处理,系统不保存学生的真实姓名及学号,只有出现重要预警信息,系统才会自动给相应的辅导员进行短信推送。“任何一个技术人员都看不到学生个人的信息,而辅导员最多能够掌握自己负责学生可能出现的重大问题。”连德富强调说。





文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文