读书摘要
《基于机器学习的数据分析方法》这本书系统地介绍了机器学习在数据分析中的应用方法。
书中首先在第1章阐述了机器学习基础,包括机器学习的基本概念,如什么是机器学习,以及机器学习中的模型、策略和算法等要素,还介绍了机器学习的分类,如监督学习、无监督学习、半监督学习和强化学习,并对回归模型的发展现状进行了概述。
第2章详细讲解了基于正则化方法的回归模型,包括正则化方法的基本原理,基于最小二乘估计的正则化方法,如岭回归、Lasso估计等,还涉及自适应Lasso、SCAD估计、弹性网络回归等方法,以及鲁棒(稳健)正则化方法。
第3章聚焦于自加权鲁棒正则化方法,介绍了自加权鲁棒方法的原理,基于SELO惩罚项的自加权估计,包括自适应正则项、RSWSELO估计等内容,并对理论性质及证明进行了阐述,还包括实验验证与分析。
第4章探讨了基于自变量相关的鲁棒回归模型,提出了自变量相关性问题,基于Elastic Net罚的鲁棒估计方法,包括模型构建、理论性质分析及证明和求解算法等内容。
第5章介绍了基于因变量相关的Lasso回归模型,包括因变量相关性问题,Network Lasso估计及其性质,如模型构建、误差界估计等内容,并通过实验结果与分析进行验证。
最后,第6章提出了面向网络数据的Elastic Net回归模型,分析了网络数据问题,介绍了面向网络数据的回归模型和Network Elastic Net模型构建,包括模型构建和求解算法,并通过实验结果与分析进行评估。
三级读书目录
第一部分:基础理论
• 第1章:机器学习基础
• 1.1机器学习及基本概念
• 1.1.1什么是机器学习
• 1.1.2机器学习中的一些基本概念
• 1.2机器学习三要素
• 1.2.1模型
• 1.2.2策略
• 1.2.3算法
• 1.3机器学习分类
• 1.3.1监督学习
• 1.3.2无监督学习
• 1.3.3半监督学习
• 1.3.4强化学习
• 1.4回归模型发展现状
• 1.4.1线性回归
• 1.4.2基于邻近信息的回归模型
• 1.4.3鲁棒回归模型
第二部分:正则化与鲁棒方法
• 第2章:基于正则化方法的回归模型
• 2.1正则化方法
• 2.2基于最小二乘估计的正则化方法
• 2.2.1最小二乘估计
• 2.2.2岭回归
• 2.2.3 Lasso估计
• 2.3自适应Lasso
• 2.4 SCAD估计
• 2.5弹性网络回归
• 2.6鲁棒(稳健)正则化方法
• 第3章:自加权鲁棒正则化方法
• 3.1自加权鲁棒方法
• 3.2基于SELO惩罚项的自加权估计
• 3.2.1自适应正则项
• 3.2.2 RSWSELO估计
• 3.2.3理论性质及证明
• 3.3实验验证与分析
• 3.3.1模拟实验结果与分析
• 3.3.2标准数据集上的实验
第三部分:自变量与因变量相关模型
• 第4章:基于自变量相关的鲁棒回归模型
• 4.1自变量相关性问题
• 4.2基于Elastic Net罚的鲁棒估计方法
• 4.2.1模型构建
• 4.2.2理论性质分析及证明
• 4.2.3求解算法
• 第5章:基于因变量相关的Lasso回归模型
• 5.1因变量相关性问题
• 5.2 Network Lasso估计及其性质
• 5.2.1模型构建
• 5.2.2误差界估计
• 5.3实验结果与分析
第四部分:网络数据模型
• 第6章:面向网络数据的Elastic Net回归模型
• 6.1网络数据问题
• 6.2面向网络数据的回归模型
• 6.3 Network Elastic Net模型构建
• 6.3.1模型构建
• 6.3.2求解算法
• 6.4实验结果与分析
• 6.4.1人工数据集上的实验
• 6.4.2实际数据分析
• 附录
• 参考文献