怎么系统地自学数据挖掘?(收藏分享)
周涛  |  2022-03-09  |  微信公众号  |  409次阅读

数据挖掘区别于数据分析,是通过统计学、人工智能、机器学习等方法从数据当中挖掘出那些未知的,有价值的信息或知识。


目前,数据挖掘的应用范围很广,涉及设计,零售,金融,银行,医疗,政府决策,企业财务,商业决策等。


如果你想现在开始从事数据挖掘这个行业,有哪些方式可以帮助你系统地学习呢?



01
优秀书单


《Introduction to Data Mining》

Pang-Ning Tang、Michael Steinbach、Vipin Kumar

本书是数据挖掘领域经典的入门教程,从数据挖掘的概念,到数据的处理方法,再到数据挖掘的具体算法,结合大量的图片和案例进行描述,帮助读者由浅入深的理解数据挖掘基础。



《DataMining: Concepts and Techniques》

JiaweiHan、Micheline Kamber、Jian Pei

本书详尽讲述了数据挖掘的基本概念和方法,重点关注了数据挖掘领域最新的技术和发展,还涉及到数据挖掘方法在金融领域的应用,书中的实例讲解,采用易于理解的伪代码 进行编写,适合于大规模的实际挖掘项目。


《Mining of Massive Datasets》
Anand Rajaraman / Jeffrey David Ullman
本书重点介绍了用于解决数据挖掘中的关键问题的使用算法,还解释了对位置敏感的算法和处理的技巧,以及查找频繁项集和聚类的问题,适合想要入门数据挖掘的读者。

《数据可视化与数据挖掘》
王国平
本书通过实际案例介绍,重点介绍了可视化数据挖掘技术在电信、电力、医药、银行、电商和房地产等行业中的应用,通过可视化的手段将数据挖掘过程的各个阶段展示给用户,使数据挖掘技术满足不同层次用户的需要。

《Recommender Systems: An introduction》
Dietmar Jannach、MarkusZanker、Alexander Felfernig、GerhardFriedrich
本书全面的介绍了推荐系统涉及的相关知识点,呈现了许多经典算法,并讨论了如何衡量推荐系统的有效性,广泛涵盖了不同类型的推荐系统,适合想要了解推荐系统的基础和相关研究的读者作为推荐系统的入门书籍。


《Recommender Systems》
Charu C. Aggarwal
本书用简单的语言阐述了推荐系统的基础,深入地介绍了核心算法的概念以及数学论证,涵盖“算法和评估”,”特定领域和上下文下的的推荐系统“,”高级的主题和应用“三个部分,可以作为推荐系统的入门书籍,也可以作为工具参考书。

《Sentiment Analysis》
Bing Liu
本书是迄今为止观点挖掘与情感分析领域最权威、最全面的著作之一,主要从自然语言处理的角度全面地介绍情感分析这个主题中的基础算法以及先进的研究技术和科研结果。


《移动数据挖掘》
连德富、张富峥、王英子、袁晶、谢幸
本书以移动数据为核心,针对移动社交网络的位置数据,并结合人的基本信息及社交网络等相关信息来研究个人与群体的移动模式特性,在介绍了移动数据的概念及其价值的同时,还细致地讲解了移动数据领域内的多个前沿研究课题。

《轻松学大数据挖掘:算法、场景与数据产品》
汪榕
本书打破数据工具与技术的介绍模式,凭借作者在大数据价值探索过程中的所感所悟,以故事的形式分享作者的亲身数据经历,在轻松的阅读环境中全面领悟数据产品。

《python数据分析与挖掘实战》
张良均
本书由10余位数据挖掘领域资深专家和科研人员,讲述大数据挖掘咨询与实施经验结晶。 从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。



02
网站博客


奥地利人工智能研究所机器学习和数据挖掘小组
研究区域包括数据挖掘和知识发现,文本挖掘,机器学习,网站还会每天更新行业相关的新闻,介绍相关任务和一些最新的研究。
网址:oefai.at/oefai/ml/mldm/

DMI:数据挖掘学院
于1999年在微软的数据挖掘小组帮助下建成,将威斯康星 数据库和数学编程小组的专业知识和经验结合起来, 利用新颖而强大的工具, 从大量的科学、商业和经济数据中提取知识。
网址:cs.wisc.edu/dmi/

数据挖掘
成立于1994年,旨在提供有关数据挖掘和知识发现的高质量信息。 网站维护一份数据挖掘软件列表,包括免费数据挖掘软件和商业数据挖掘软件,你还可以添加有关数据挖掘软件的信息。
网址:the-data-mine.com/


数据挖掘实验室
大数据挖掘中心于2014年成立,研究方向包括数据挖掘、机器学习、多媒体应用和医学图像分类,特别集中在属性约简理论及其在HASHING,图像和视频分类等应用。
网址:zhanglab.ci.gxnu.edu.cn

智能科学网站
智能科学是脑科学、认知科学、 人工智能等的交叉学科,研究智能的理论和技术。 智能科学不仅要进行智能的功能仿真,而且要研究智能的机理, 探索智能的新理论、 新方法
网址:http://intsci.ac.cn/


数据挖掘
这是一个私人博客,记录了作者研究方向的一些资料、信息。 作者主要的兴趣所在为: 人工智能、文本挖掘、可视化等
网址:datamining.typepad.com/


50 data miningresources
热门数据挖掘资源: 50个教程,文章和视频,用于学习数据挖掘方法,分析等。
网址:ngdata.com/data-mining-

Analytics Vidhya

最新的机器学习、数据挖掘的知识更新,涵盖业内新闻和动态,也可以参与讨论。
网址:analyticsvidhya.com/blo


DataMining
一个关于数据挖掘研究和应用的博客,内容包括研究问题、最近的申请、行业内重要事件、当前的趋势、书评等。
网址:dataminingblog.com/


R and DataMinin
该网站提供有关R和数据挖掘的文档,示例,教程和资源。
网址:rdatamining.com/


以上介绍的书单和网站都是数据挖掘领域综合评价较高的资源,各有所长。大家可以结合自己的需求来进行选择,从零到一,全面深入数据挖掘领域。

文章原载于作者的微信公众号文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文