分类目录归档:基础设施

TSFormer-时间序列预测模型-03006-V01


TSFormer:时间序列预测的Transformer新锐

在当今大数据时代,时间序列预测(如股票走势、天气变化、设备故障预警)至关重要。传统模型如RNN、LSTM常受限于“长期依赖”问题——难以有效捕捉遥远数据点间的关系。而Transformer模型凭借强大的全局建模能力异军突起,TSFormer正是专为时间序列预测优化的Transformer变体,兼顾了高效与精准。

核心思想:化繁为简,聚焦重点

TSFormer的核心在于解决原始Transformer应用于超长序列时的两大痛点:

  1. 计算爆炸: Transformer的自注意力机制需计算序列中每对点之间的关系,序列长度增加时,计算量和...

Read more

Prophet-时间序列预测模型-03007-V01


Prophet 时间序列预测模型介绍

Prophet 是由 Facebook (现 Meta) 核心数据科学团队开发并开源的一款强大的时间序列预测工具。它的设计初衷是让分析师和业务人员(不一定需要深厚的时间序列理论或统计学背景)也能轻松地生成高质量、可解释的预测结果,尤其擅长处理商业领域常见的时间序列数据特征。

核心设计理念与优势

  1. 面向业务场景:

    • 节假日效应: 商业数据常受节假日(如春节、双十一、圣诞节)显著影响。Prophet 允许用户显式地输入自定义的节假日列表(包括日期和影响范围),模型会自动学习这些事件对时间序列的正面或负面影响。
    • 季节性与趋势变化: 业务趋势并非一成不变。...

Read more

ARIMA-时间序列预测模型-03008-V01


ARIMA时间序列预测模型介绍

ARIMA(Autoregressive Integrated Moving Average),即自回归综合移动平均模型,是时间序列预测领域最经典、应用最广泛的工具之一。它擅长捕捉数据中的趋势、季节性和内在依赖关系,用于预测未来的数据点。

核心思想:拆解时间序列

ARIMA模型认为,一个时间序列的值主要受三方面因素影响:

  1. 历史值的影响 (AR - 自回归): 当前的值与它过去几个时刻的值存在线性关系。例如,昨天的气温很可能对今天的气温有直接影响。
  2. 历史预测误差的影响 (MA - 移动平均): 当前的预测误差与过去几个时刻的预测误差存在线性关系。这反映了模...

Read more

PI-LSTM-时间序列预测模型-03010-V01


PI-LSTM:让时间序列预测更“靠谱”的利器

在金融、气象、交通等领域,精准预测未来趋势至关重要。传统LSTM模型虽擅长捕捉序列中的复杂模式,但它通常只给出一个“点预测”——即一个确定性的未来值。现实中,预测总伴随不确定性。PI-LSTM(Prediction Interval LSTM) 应运而生,它的核心目标不仅是预测“最可能的值”,还要清晰告诉使用者预测结果可能的波动范围有多宽——这就是预测区间(Prediction Interval, PI)。

为什么需要预测区间(PI)?

想象预测明天股市收盘价: * 普通LSTM模型告诉你:“预测明天收盘是3050点。” * PI-...

Read more

TimesNet-时间序列预测模型-03009-V01


TimesNet:时间序列预测的“时空捕手”

在金融、气象、工业监控等领域,时间序列预测是核心任务。传统模型如ARIMA、LSTM常面临挑战:难以同时捕捉复杂的时间变化模式(如突变、周期性)。2023年,清华团队提出的TimesNet模型突破这一瓶颈,成为时间序列分析的新星。它无需复杂数学公式,就能带我们理解其精妙之处。

一、 传统方法的瓶颈:时间维度的“近视眼”

想象医生查看心电图: - 局部视角(传统CNN):只能看到当前心跳的波形,忽略心跳间的规律。 - 长程视角(传统RNN):能记住过去多次心跳,但细节易模糊。

更关键的是,真实时间序列像交织的绳索: - 变化周期多样:日气温(2...

Read more

Spacetimeformer-时间序列预测模型-03004-V01


Spacetimeformer:时空预测的新范式

在天气预报、交通流量预测、电力负荷分析等领域,我们常常面对的不再是孤立的时间点数据,而是同时蕴含时间变化空间关联的复杂信息流。传统时间序列模型(如LSTM)擅长捕捉时间依赖,却难以有效建模空间位置间的相互影响;而纯空间模型又容易忽略动态演变过程。Spacetimeformer模型应运而生,其核心突破在于将Transformer的强大能力创新性地应用于统一建模时空维度,开辟了预测复杂时空现象的新路径。

一、核心思想:时空一体化的注意力网络

Spacetimeformer 的核心在于它看待数据的方式发生了根本转变:

  1. 化时空为序列: 模型摒...

Read more

DeepAR-时间序列预测模型-03003-V01


DeepAR:面向未来的智能时间序列预测引擎

在当今数据驱动的世界中,时间序列预测扮演着关键角色:零售商需要精准预测商品需求以优化库存,能源公司必须预判电力负荷来平衡电网,金融机构则依靠股价预测规避风险。然而,面对复杂多变、具有季节性和不确定性的真实数据,传统方法常显得力不从心。亚马逊科学家团队开发的DeepAR模型,正是为解决这些挑战而生,它融合了深度学习的力量与概率思维,显著提升了预测的准确性与实用性。

一、 DeepAR是什么?超越点预测的智能框架

DeepAR 本质上是一种基于深度学习的概率时间序列预测模型。其核心突破在于摒弃了传统模型仅输出单一“点预测值”的局限(如“明天销量预...

Read more

self-llm-开源大模型食用指南


这个仓库名为 self-llm,是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的大模型教程项目。以下是对该仓库的详细介绍:

项目概述

本项目旨在为更多普通学生、研究者提供开源大模型的全流程指导,简化开源大模型的部署、使用和应用流程,让开源、自由的大模型更好地融入普通学习者的生活。其主要内容涵盖环境配置、本地部署、高效微调等技能的教学。

项目主要内容

  1. 开源 LLM 环境配置指南:基于 Linux 平台,针对不同模型要求提供详细的环境配置步骤。
  2. 主流开源 LLM 部署使用教程:包括国内外主流的开源 LLM,如 LLaMA、ChatGLM、InternLM 等。
  3. 开源 LLM ...

Read more

HowToCreateHomunculus-从零开始学习构建智能对话系统


这个仓库名为 HowToCreateHomunculus,主要聚焦于基于深度学习的对话系统的实现与探索,包含了从简单对话系统到结合数据库和知识图谱的对话系统等多个不同复杂度的项目,为构建对话系统提供了丰富的实践案例和理论指导。以下是对该仓库的详细介绍:

项目概述

项目源于对构建与人类无异的对话系统的向往,受《钢之炼金术师》中瓶中小人角色启发而开展。旨在探索基于深度学习的对话系统的构建方法,并记录学习过程,目前网上缺乏统一鲜明的路线,此项目可作为学习参考。

前置知识

  • 具备编程基础,推荐同时掌握 tensorflowpytorch
  • 本项目基于 NLPBeginner 开发,可先大致...

Read more

N-BEATS-时间序列预测模型-03002


N-BEATS:面向时间序列预测的纯深度学习模型

在时间序列预测领域,N-BEATS(Neural Basis Expansion Analysis for Time Series)模型于2019年由Element AI的研究团队提出,以其独特的纯深度学习架构优异的预测性能良好的可解释性,迅速成为该领域的明星模型。它摒弃了传统模型中的复杂特征工程或特定领域知识依赖,仅使用全连接层(MLP)构建,展现了深度神经网络在时间序列预测中的强大潜力。

核心设计理念与创新

  1. 完全深度学习架构:

    • N-BEATS 彻底摆脱了传统时间序列模型(如 ARIMA、指数平滑)或混合模型(如结合 LSTM...

Read more