数据分析、数据挖掘与数据可视化是一个古老的话题,并非什么新生事物。近些年来,随着计算机软硬件的飞速发展,数据分析、数据挖掘、数据可视化的相关理论和技术在各领域的应用更是有了质的飞跃。饭店选址、公交路线规划、物流规划、春运车次安排、原材料选购、商场进货与货架位置摆放、查找隐性贫困生、房价预测、股票预测、寻找黑客攻击向量、犯罪人员社交关系挖掘、网络布线、潜在客户挖掘、个人还贷能力预测、异常交易分析、网络流量预测、成本控制与优化、客户关系分析、商品推荐、文本分类、笔迹识别与分析、智能交通、智能医疗等,这些都要借助于数据分析与挖掘相关的理论和工具才能更好、更快地完成,而可视化则一直是用于辅助数据分析、挖掘进而做出正确决策的有力工具与技术。
数据分析、数据挖掘与数据可视化是综合性非常强的学科领域。从事相关工作的人员既要掌握线性代数、统计学、人工智能、机器学习等大量理论知识,又要熟悉编程语言及相关软件的使用。
在众多的编程语言中,Python应该是最适合做数据分析、数据挖掘和数据可视化的,其简洁的语法、强大的功能、丰富的扩展库以及开源免费、易学易用的低门槛特点,使Python成为多个领域不可替代的语言。
本书首先简要地介绍了进行数据分析、挖掘和可视化时,需要了解的Python基础知识,然后重点介绍了扩展库numpy、pandas、sklearn、matplotlib以及相应的理论知识。全书以案例为主,通过大量的实际案例演示相关理论和Python语言的应用。
本书配有视频讲解,可以登录智慧树网搜索“董付国”学习配套慕课。另外,微信公众号“Python小屋”中900余篇文章和400多个微课视频是对书中内容很好的补充和扩展。
董付国
2019年8月
山东烟台
我要评论