分类目录归档：机器学习

AutoGluon概述

196 views

AutoGluon概述 1.1 定义与目标 AutoGluon是一个开源的自动机器学习（AutoML）框架，由亚马逊AWS团队开发，旨在通过自动化机器学习工作流程中的关键环节，降低机器学习的使用门槛，使开发者能够更高效地构建高性能模型。它支持多种数据类型，包括结构化数据、文本、图像和时间序列，能够自动完成从数据预处理、特征工程到模型选择、超参数调优以及模型集成等一系列复杂任务，为用户提供了一站式的机器学习解决方案，其目标是让机器学习初学者能够快速上手，同时也能帮助专家提升现有模型和数据管道的性能。 1.2 开发背景随着数据驱动决策的普及，机器学习在现代科技和商业领域的重要性日益凸显。...

遗憾-ML

191 views

在机器学习（ML）中，“遗憾”（Regret）是衡量在线学习或强化学习算法性能的重要指标，表示算法累积损失与最优策略之间的差距。以下是近年来的关键研究进展及其应用场景的总结：

1. 在线线性规划与Regret优化

突破性框架：针对在线线性规划问题，研究提出了一种新框架，当线性规划对偶问题满足特定误差边界条件时，一阶学习算法的Regret可突破传统的$\mathcal{O}(\sqrt{T})$限制。在连续支持场景下实现$o(\sqrt{T})$ Regret，而在有限支持场景下达到$\mathcal{O}(\log T)$ Regret，显著优于现有方法。
应用场景：适用于资源分配和...

矩阵分解-

126 views

矩阵分解是将一个矩阵表示为几个更简单的矩阵的乘积的过程。这在数学和计算机科学中是一个重要的概念，因为它可以简化许多矩阵运算，如求解线性方程组、计算矩阵的逆、以及进行特征值分析等。常见的矩阵分解方法包括：

LU分解：将一个矩阵分解为一个下三角矩阵（L）和一个上三角矩阵（U）的乘积。这种分解对于求解线性方程组非常有用。 QR分解：将一个矩阵分解为一个正交矩阵（Q）和一个上三角矩阵（R）的乘积。这种分解在最小二乘问题和特征值问题中非常有用。奇异值分解（SVD）：将一个矩阵分解为一个正交矩阵（U）、一个对角矩阵（Σ）和另一个正交矩阵（V）的乘积。这种分解在数据压缩、信号处理和统计学中非常有用...

模型压缩技术

114 views

模型压缩技术是一系列旨在减小深度学习模型体积、降低计算/存储开销、提升推理效率的技术，同时尽可能保持模型性能（如准确率）。这些技术对于在资源受限的设备（如手机、嵌入式设备）上部署模型至关重要，尤其在自然语言处理（NLP）、计算机视觉（CV）等领域广泛应用。以下是主要技术及其原理：

1. 量化（Quantization）

原理：将高精度浮点数（如32位浮点）转换为低精度数值（如8位整数），减少模型存储和计算开销。
类型：
静态量化：离线校准量化参数。
动态量化：运行时动态调整量化范围。
量化感知训练（QAT）：在训练中模拟量化误差，提升压缩后模型性能。
优点：简单高效，硬件支持广泛（如...

知识蒸馏-V2

161 views

知识蒸馏（Knowledge Distillation）是一种在深度学习领域中广泛应用的技术，旨在将复杂模型（教师模型）的知识传递给简单模型（学生模型），以提高学生模型的性能同时降低其复杂度。以下是对知识蒸馏的详细介绍：

一、知识蒸馏的背景和意义

随着深度学习的发展，深度神经网络在许多任务中取得了巨大的成功。然而，这些复杂的模型通常需要大量的计算资源和存储空间，难以在资源受限的设备上部署，如智能手机、嵌入式传感器节点等。知识蒸馏应运而生，为解决这一问题提供了一种有效的途径。通过知识蒸馏，可以将大型教师模型的知识迁移到小型学生模型中，使得学生模型在保持较小规模的同时，能够获得接近甚至超越大...

收敛理论

155 views

收敛理论是数学分析的核心内容之一，涉及多个分支，涵盖数列、函数、级数、泛函空间、概率论及数值分析等领域。以下是其核心要点和分类：

1. 数列收敛

定义：数列 ({a_n}) 收敛于极限 (L)，当且仅当对任意 (\varepsilon > 0)，存在 (N) 使得当 (n > N) 时，(|a_n - L| < \varepsilon)。
柯西准则：数列收敛当且仅当它是柯西序列（即任意两项的差随下标增大而任意小）。
实数完备性：实数空间中，柯西序列必收敛，这是分析学的基础。

2. 函数收敛

点态收敛：对每个 (x)，函数序列 ({f_n(x)}) 收敛到 (f...

前向传播算法

159 views

前向传播算法是神经网络中用于计算输出和进行预测的重要算法，以下是其相关介绍：

定义

前向传播算法是指从输入层开始，将输入数据依次通过神经网络的每一层，经过神经元的激活函数处理后，将信息传递到下一层，直到输出层得到最终的输出结果的过程。在这个过程中，数据只沿着一个方向流动，即从输入层到输出层，不涉及反向的信息传递。

计算过程

输入层到隐藏层
- 假设输入层有(n)个神经元，输入数据为(x = (x_1, x_2,..., x_n))，隐藏层有(m)个神经元。连接输入层和隐藏层的权重矩阵为(W^{(1)})，其维度为(m\times n)，偏置向量为(b^{(1)})，维度为(m\times ...

贝叶斯原理概述-V0

150 views

贝叶斯原理概述

贝叶斯原理（Bayes' Theorem）是概率论与统计学中一个核心理论，由18世纪英国数学家托马斯·贝叶斯提出。它以动态更新认知的哲学为基础，通过整合先验知识与新证据，实现对事件概率的迭代优化。贝叶斯方法在机器学习、医学诊断、金融预测等领域广泛应用，成为现代数据分析的重要工具。

贝叶斯定理的数学表达

贝叶斯定理的数学形式简洁而深刻：

[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} ]

其中： - ( P(A|B) ) 是后验概率（Posterior Probability），即在观察到事件B后，事件A发生的概率； - ( P(B|A...

主成分分析（PCA）及其在特征选择中的作用-V0

251 views

主成分分析（PCA）及其在特征选择中的作用

引言

在数据科学的众多应用中，特征选择是一项至关重要的技术，它直接影响到模型的性能、可解释性以及计算效率。随着数据集维度的不断增加，传统的特征选择方法逐渐暴露出高维数据处理上的不足。主成分分析（PCA）作为一种降维技术，通过将高维数据映射到低维空间，减少特征空间的复杂度，同时保留原始数据中的大部分信息，成为了特征选择中的一种重要工具。本文将详细探讨PCA在特征选择中的作用，涵盖其基本原理、数学推导、具体应用以及实际中的优势和挑战。

1. PCA的基本原理

主成分分析（PCA）是一种统计技术，旨在通过线性变换将数据从原始的特征空间映射到一个新的空...

填充-机器学习/神经网络

110 views

在 机器学习/神经网络 中，填充（Padding） 是一种在输入数据（如图像、序列等）周围添加额外“虚拟值”的技术，主要用于控制卷积操作后输出数据的空间尺寸，并减少信息丢失。以下是详细解释：

1. 为什么需要填充？

保持空间维度：卷积操作（如卷积神经网络中的卷积层）会缩小输入数据的尺寸。例如，输入图像尺寸为 (5 \times 5)，使用 (3 \times 3) 的卷积核后，输出尺寸会变为 (3 \times 3)。填充可以通过在边缘添加额外像素，使输出尺寸与输入一致。
保留边缘信息：不加填充时，图像边缘的像素在卷积中参与计算的次数较少，可能丢失重要特征。
适应深层网络：在深层网络...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。