本书共 8 章。
第 1 章“Python 快速入门”,面向尚未了解 Python 的读者,旨在使他们快速熟悉 Python 编程语言的特性,最重要的是使他们能够搭建Python 开发环境,并能编写简单的输入/输出程序。
第 2 章“Python 数据类型”,在第 1 章的基础上增加了 Python 编程语言的基础语法,包括变量、表达式、逻辑控制语句、函数等;此外,还详细介绍了 Python 中与数据处理和挖掘密切相关的高级数据结构,如列表、元组、字典和集合等;最后,通过一个传感器数据分析案例介绍了数据分析过程,希望读者学习本章后可以通过 Python 完成简单的数据分析任务。
第 3 章“Python 常用模块”,介绍了通过自定义模块提升代码重用效率的方法,重点讲解了 3 个重要的第三方库(NumPy、Scipy 和Pandas)的使用方法。
第 4 章“Python 数据获取”,旨在使读者能够在 Python 环境下独立设计爬虫软件,并能在互联网上获取数据,具体介绍了以下内容:超文本传输协议(HyperText Transfer Protocol,HTTP),超文本标记语言(HyperText Markup Language,HTML),使用 Python 设计爬虫软件的方法,URLLib、Requests、Selenium 等库的使用方法,以及多线程技术及其在 Python 网络爬虫中的应用。
第 5 章“Python 数据挖掘基础”,介绍了数据挖掘的术语和流程,重点讲解了 Python 中的常用库(NLTK 和 Sklearn)及其在数据预处理、数据创建、数据挖掘模型构建过程中的常用方法。
第 6 章“Python 数据挖掘算法”,针对分类和聚类这两类数据挖掘中的基本问题,总结了相关的算法与模型,介绍了实现两个基本算法(朴素贝叶斯分类算法和 K-means 聚类算法)的全过程。
第 7 章“Python 大数据挖掘”,基于神经网络介绍了深度学习方法,详细讲解了卷积神经网络和长短期记忆网络模型,并介绍了常用的深度学习框架;最后介绍了一个应用卷积神经网络识别蔬菜的案例。
第 8 章“Python 数据可视化”,讲解了最为常用的可视化库(Matplotlib),在此基础上,介绍了两个效果被改进以后的库(Seaborn和Plotnine)的使用方法,并讲解了如何可视化一个地区的房价数据。
我要评论