Python无监督学习-Books


《Python无监督学习》读书摘要

一、主要内容摘要

《Python无监督学习》是一本专注于使用Python进行无监督学习的技术书籍。无监督学习是机器学习的一个重要分支,旨在从无标签的数据中发现模式和结构。

书中首先介绍了无监督学习的基本概念,包括描述性分析、诊断性分析、预测性分析和规范性分析等内容,帮助读者理解无监督学习在数据分析中的应用场景和重要性。例如,在数据分析过程中,描述性分析可以帮助我们了解数据的基本特征。

接着深入到具体的无监督学习算法。在聚类算法方面,详细讲解了K - means聚类、层次聚类、DBSCAN等算法的原理和实现。这些算法用于将数据点划分为不同的群组,例如在客户细分领域有重要应用。书中还包括对聚类结果的评估指标的讨论,帮助读者判断聚类的质量。

此外,书中还涉及到降维算法,如主成分分析(PCA)和线性判别分析(LDA)等。降维技术可以将高维数据映射到低维空间,从而减少数据的复杂性,同时保留重要的信息。例如,在图像识别领域,通过降维可以加快模型的训练速度。

在异常检测章节,介绍了如何识别数据中的异常值,这在网络安全、金融欺诈检测等领域有重要意义。例如,通过建立正常数据的模型,能够发现与模型不符的数据点,这些点可能是异常值。

最后,书中还通过实际案例和Python代码,展示了如何使用scikit - learn、TensorFlow等工具实现无监督学习算法,帮助读者将理论知识应用到实践中。

二、详细目录

• 第1章 无监督学习入门

• 1.1技术要求

• 1.2为什么需要机器学习

• 1.3机器学习算法的类型

• 1.4为什么用Python进行数据科学和机器学习

• 1.5总结

• 1.6问题

• 第2章 聚类基础知识

• 2.1技术要求

• 2.2聚类介绍

• 2.3 K - means

• 2.4威斯康星州乳腺癌数据集分析

• 2.5评估指标

• 第3章 高级聚类

• 3.1技术要求

• 3.2谱聚类

• 3.3均值漂移

• 3.4 DBSCAN

• 3.5 K - medoids

• 3.6聚类集成

• 3.7 Mini - batch K - means

• 3.8 BIRCH

• 3.9 Mini - batch K - means与BIRCH的比较

• 3.10总结

• 3.11问题

• 第4章 实践中的层次聚类

• 4.1技术要求

• 4.2聚类层次结构

• 4.3凝聚聚类

• 4.4分裂聚类

• 4.5总结

• 4.6问题

• 第5章 降维与特征分析

• 5.1技术要求

• 5.2主成分分析

• 5.3线性判别分析

• 5.4局部线性嵌入

• 5.5总结

• 5.6问题

• 第6章 异常检测

• 6.1技术要求

• 6.2基于统计的方法

• 6.3基于距离的方法

• 6.4基于密度的方法

• 6.5总结

• 6.6问题

• 第7章 无监督深度学习

• 7.1技术要求

• 7.2自编码器

• 7.3受限玻尔兹曼机

• 7.4深度信念网络

• 7.5总结

• 7.6问题

• 第8章 无监督神经网络架构

• 8.1技术要求

• 8.2生成对抗网络

• 8.3变分自编码器

• 8.4总结

• 8.5问题