这本书名为《深入浅出Pandas:利用Python进行数据处理与分析》,作者是李庆辉,由机械工业出版社出版。
读书摘要
这本书是一本关于如何使用Pandas库进行数据处理和分析的实用指南,适合Python编程的初学者和有一定经验的数据分析师。书中通过大量的实例和案例,系统地介绍了Pandas的各个功能模块,包括数据结构、数据读取与输出、数据清洗、数据转换、数据分组与聚合、时间序列分析、可视化等内容。
书中详细阐述了如何利用Pandas处理各种格式的数据,如CSV、Excel、SQL数据库等,并讲解了如何进行数据清洗,例如处理缺失值、重复值等。在数据转换方面,涵盖了数据类型转换、行列转换等操作。此外,对于数据分析中的重要环节,如分组聚合和时间序列分析,书中也给出了详细的方法和示例。
在可视化部分,书中展示了如何利用Pandas的绘图功能直观地展示数据。最后,通过实战案例,帮助读者将所学知识应用到实际工作中,提升数据处理和分析的效率。
目录
• 第一部分 Pandas入门
• 第1章 Pandas简介及快速入门
• 第2章 数据结构
• 第二部分 Pandas数据分析基础
• 第3章 Pandas数据读取与输出
• 第4章 Pandas基础操作
• 第5章 Pandas样式
• 第三部分 数据形式变化
• 第6章 Pandas分组聚合
• 第7章 Pandas数据合并与对比
• 第8章 Pandas多层索引
• 第四部分(第10 - 12章)数据清洗
• 处理缺失值、重复值的识别与处理、数据的替换、转换、格式化等操作。
• 第五部分(第13 - 14章)时序数据分析
• 处理Pandas中对于各种时间类型数据的处理和分析,以及时序数据处理中经常使用的窗口计算。
• 第六部分(第15 - 16章)可视化
• 讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据说话。
• 第七部分(第17章)实战案例
• 介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈。
第一部分:Pandas入门
• 第1章:Pandas简介及快速入门
• 1.1 Pandas是什么
• 1.2 Python的应用
• 1.3 为什么不选择R
• 1.4 Pandas简介
• 1.5 Pandas的使用人群
• 1.6 Pandas的基本功能
• 1.7 Pandas的学习方法
• 1.8 小结
• 第2章:数据结构
• 2.1 环境搭建与安装
• 2.2 Anaconda简介
• 2.3 安装miniconda
• 2.4 多Python版本环境
• 2.5 安装编辑器
• 2.6 Jupyter Notebook
• 2.7 用pip安装第三方库
• 2.8 安装Jupyter Notebook
• 2.9 启动Jupyter Notebook
• 2.10 使用Jupyter Notebook
• 2.11 安装Pandas
• 2.12 小结
• 2.13 Pandas快速入门
• 2.14 本章小结
第二部分:Pandas数据分析基础
• 第3章:Pandas数据读取与输出
• 3.1 数据读取
• 3.2 Excel
• 3.3 SQL
• 3.4 数据输出
• 3.5 本章小结
• 第4章:Pandas基础操作
• 4.1 索引操作
• 4.2 数据的信息
• 4.3 统计计算
• 4.4 位置计算
• 4.5 数据选择
• 4.6 本章小结
• 第5章:Pandas样式
• 5.1 样式操作
• 5.2 样式筛选
• 5.3 样式格式化
• 5.4 样式类型转换
• 5.5 本章小结
第三部分:数据形式变化
• 第6章:Pandas分组聚合
• 6.1 分组操作
• 6.2 聚合操作
• 6.3 数据合并
• 6.4 本章小结
• 第7章:Pandas数据合并与对比
• 7.1 数据合并
• 7.2 数据对比
• 7.3 本章小结
• 第8章:Pandas多层索引
• 8.1 多层索引
• 8.2 多层索引操作
• 8.3 本章小结
第四部分:数据处理与分析
• 第9章:Pandas数据清洗与转换
• 9.1 数据清洗
• 9.2 数据转换
• 9.3 本章小结
• 第10章:Pandas数据处理与操作
• 10.1 数据处理
• 10.2 数据操作
• 10.3 本章小结
• 第11章:Pandas数据统计与分析
• 11.1 数据统计
• 11.2 数据分析
• 11.3 本章小结
• 第12章:Pandas数据可视化
• 12.1 数据可视化
• 12.2 绘图操作
• 12.3 本章小结
• 第13章:Pandas实战案例
• 13.1 实战案例1
• 13.2 实战案例2
• 13.3 本章小结