作者文章归档:course

FastDTW-时间序列相似性检测


FastDTW(Fast Dynamic Time Warping)是一种用于计算两个时间序列之间相似性的高效算法。它是经典动态时间规整(DTW)算法的一种近似方法,旨在解决 DTW 计算复杂度高的问题。

为了更好地理解 FastDTW,我们首先需要了解它要解决的问题和它改进的原始算法。


1. 背景:什么是 DTW?

动态时间规整 (Dynamic Time Warping, DTW) 是一种用于衡量两个不同长度的时间序列之间相似度的经典算法。它的核心思想是找到两个序列之间的最佳对齐方式,即使它们在时间轴上有非线性(如速度不一)的偏移。

  • 解决的问题:例如,比较两个人说同一个单词的音频...

Read more

数据科学体系架构:从理论基础到工程实践-V03


数据科学体系架构:从理论基础到工程实践

一、数据基础架构与工程实践

现代数据科学建立在规模化数据工程基础之上。数据流水线采用Lambda架构实现批流一体化处理,使用Apache Spark进行分布式ETL处理,通过Apache Kafka构建实时数据流平台。数据质量保障采用系统化方法:使用Great Expectations框架定义数据质量规则,通过Anomaly Detection算法识别数据异常,基于数据血缘分析实现全链路追溯。

在特征工程层面,我们采用自动化特征工程(AutoFE)技术:使用TSFresh进行时序特征自动生成,通过FeatureTools实现深度特征合成。针对高维稀...

Read more

数据科学体系化构建:从底层处理到生产级部署-v02


数据科学体系化构建:从底层处理到生产级部署

数据科学作为一门融合统计学、计算机科学和领域知识的交叉学科,已形成完整的理论体系和技术栈。本文将从专业视角深入剖析数据科学的关键组成部分,着重探讨数据处理与分析、机器学习、图分析、向量搜索、优化算法以及MLOps等核心模块的技术实现与系统集成。

数据工程基础:构建可靠的数据流水线

数据处理是数据科学项目的基石。在实际工业场景中,数据工程师需要构建稳健的ETL(Extract-Transform-Load)流水线来处理多源异构数据。我们采用Apache Spark等分布式计算框架处理海量数据,运用数据质量框架如Great Expectations...

Read more

数据科学全景解析:从数据处理到智能部署-V01


数据科学全景解析:从数据处理到智能部署

在当今数据驱动的时代,数据科学已成为企业获取竞争优势的核心引擎。作为一名数据科学家,我深刻理解这个领域的复杂性和多维性。数据科学不仅是一门学科,更是一个完整的生态系统,涵盖了从数据收集到智能决策的全过程。本文将带您深入探索数据科学的关键组成部分,揭示如何将原始数据转化为可行动的智能。

数据基础:处理与分析的艺术

任何数据科学项目的起点都是数据。数据处理与分析构成了整个数据科学金字塔的基石。在实际工作中,数据往往以混乱、不完整的形式存在。数据清洗和预处理因此成为最关键且最耗时的环节。我们使用各种工具和技术来处理缺失值、异常值和重复数据,确保数据质量。...

Read more

今日投资-数据提供商-付费-01051


1. 一段话总结

今日投资(INVESTODAY) 专注金融数据领域超20年,致力于打造优质金融数据产品,以“让数据创造投资价值”为理念,累计服务超5000万+投资者,获得100+国内外专业机构(含安信证券、贝莱德、中国工商银行等)信赖;核心业务涵盖数据服务(依托20年数据积累提供衍生数据赋能)与数据应用(通过技术和AI打造智能化工具),并提供1V1专属服务与定制解决方案,办公地点位于深圳市福田区深南大道6008号深圳特区报业大厦29楼F,联系电话为0755-83522535。


2. 思维导图

## 今日投资(INVESTODAY)核心概况
- 核心定位:打造优质金融数据产品,让数据创...

Read more

量化交易系统-事件驱动架构


在量化交易系统中,事件驱动架构(Event-Driven Architecture, EDA) 是实现策略灵活、稳定、可扩展运行的核心设计范式。以下从系统层面解析其核心组件及功能:


✅ 事件驱动架构核心组件一览

组件名称 功能描述 典型实现/工具示例
事件引擎(Event Engine) 事件调度中心,负责事件的生成、分发、监听与响应,是整个系统的“神经系统”。 vn.py 的 EventEngine、QSTrader 的事件总线
事件(Event) 系统内最小通信单元,封装了数据或行为,如行情更新、订单成交、风控触发等。 MarketEvent、SignalEven...

Read more

动态条件相关系数(DCC)模型:理论与应用解析


动态条件相关系数(DCC)模型:理论与应用解析

一、引言:动态相关性的金融现实与模型需求

在金融市场中,资产间的相关性并非恒定不变。例如,股市暴跌时,不同股票的相关性往往显著上升,这种“同涨同跌”的动态依赖关系,对投资组合优化、风险度量至关重要。传统静态相关系数(如Pearson相关)无法捕捉这种时变特征,因此,Engle(2002)提出动态条件相关系数模型(Dynamic Conditional Correlation, DCC),为多变量时间序列的动态相关结构建模提供了有效工具。

二、DCC模型的核心架构:从波动率到相关性

DCC模型的设计分为两步:先建模单个资产的边际波动率(使用G...

Read more

AI金融-金融人工智能-用Python实现AI量化交易


机器智能

人工智能

超级智能

金融和机器学习

规范性金融理论

数据驱动的金融学

机器学习

人工智能优先的金融

统计失效

密集神经网络

循环神经网络

强化学习

算法交易

向量化回测

风险管理

执行与部署

展望

基于人工智能的竞争

金融奇点

附录

交互式神经网络

神经网络类

卷积神经网络

Read more