基于机器学习的数据分析方法-V2


读书摘要

《基于机器学习的数据分析方法》这本书系统地介绍了机器学习在数据分析中的应用方法。

书中首先在第1章阐述了机器学习基础,包括机器学习的基本概念,如什么是机器学习,以及机器学习中的模型、策略和算法等要素,还介绍了机器学习的分类,如监督学习、无监督学习、半监督学习和强化学习,并对回归模型的发展现状进行了概述。

第2章详细讲解了基于正则化方法的回归模型,包括正则化方法的基本原理,基于最小二乘估计的正则化方法,如岭回归、Lasso估计等,还涉及自适应Lasso、SCAD估计、弹性网络回归等方法,以及鲁棒(稳健)正则化方法。

第3章聚焦于自加权鲁棒正则化方法,介绍了自加权鲁棒方法的原理,基于SELO惩罚项的自加权估计,包括自适应正则项、RSWSELO估计等内容,并对理论性质及证明进行了阐述,还包括实验验证与分析。

第4章探讨了基于自变量相关的鲁棒回归模型,提出了自变量相关性问题,基于Elastic Net罚的鲁棒估计方法,包括模型构建、理论性质分析及证明和求解算法等内容。

第5章介绍了基于因变量相关的Lasso回归模型,包括因变量相关性问题,Network Lasso估计及其性质,如模型构建、误差界估计等内容,并通过实验结果与分析进行验证。

最后,第6章提出了面向网络数据的Elastic Net回归模型,分析了网络数据问题,介绍了面向网络数据的回归模型和Network Elastic Net模型构建,包括模型构建和求解算法,并通过实验结果与分析进行评估。

三级读书目录

第一部分:基础理论

• 第1章:机器学习基础

• 1.1机器学习及基本概念

• 1.1.1什么是机器学习

• 1.1.2机器学习中的一些基本概念

• 1.2机器学习三要素

• 1.2.1模型

• 1.2.2策略

• 1.2.3算法

• 1.3机器学习分类

• 1.3.1监督学习

• 1.3.2无监督学习

• 1.3.3半监督学习

• 1.3.4强化学习

• 1.4回归模型发展现状

• 1.4.1线性回归

• 1.4.2基于邻近信息的回归模型

• 1.4.3鲁棒回归模型

第二部分:正则化与鲁棒方法

• 第2章:基于正则化方法的回归模型

• 2.1正则化方法

• 2.2基于最小二乘估计的正则化方法

• 2.2.1最小二乘估计

• 2.2.2岭回归

• 2.2.3 Lasso估计

• 2.3自适应Lasso

• 2.4 SCAD估计

• 2.5弹性网络回归

• 2.6鲁棒(稳健)正则化方法

• 第3章:自加权鲁棒正则化方法

• 3.1自加权鲁棒方法

• 3.2基于SELO惩罚项的自加权估计

• 3.2.1自适应正则项

• 3.2.2 RSWSELO估计

• 3.2.3理论性质及证明

• 3.3实验验证与分析

• 3.3.1模拟实验结果与分析

• 3.3.2标准数据集上的实验

第三部分:自变量与因变量相关模型

• 第4章:基于自变量相关的鲁棒回归模型

• 4.1自变量相关性问题

• 4.2基于Elastic Net罚的鲁棒估计方法

• 4.2.1模型构建

• 4.2.2理论性质分析及证明

• 4.2.3求解算法

• 第5章:基于因变量相关的Lasso回归模型

• 5.1因变量相关性问题

• 5.2 Network Lasso估计及其性质

• 5.2.1模型构建

• 5.2.2误差界估计

• 5.3实验结果与分析

第四部分:网络数据模型

• 第6章:面向网络数据的Elastic Net回归模型

• 6.1网络数据问题

• 6.2面向网络数据的回归模型

• 6.3 Network Elastic Net模型构建

• 6.3.1模型构建

• 6.3.2求解算法

• 6.4实验结果与分析

• 6.4.1人工数据集上的实验

• 6.4.2实际数据分析

• 附录

• 参考文献