- 支持向量机-SVM 1
- 知识蒸馏 1
- 建模
- 特征提取
- 特征工程 1
- 特征归一化
- softmax 1
- 时间序列预测模型 1
- FinGPT 1
- FinML
- ChatGPT
- LLM
- GPT 1
- LSTM
- Transformer 1
- 梯度下降 1
- 特征工程 1
- 神经网络 1
- AI原理系列-强化学习 1
- AI原理系列-无监督学习 1
- AI原理系列-监督学习 1
- MoE架构的解析 1
- GPU 消费级与专业级性价比分析报告
- 算力集群的自建与租赁方案对比分析报告
- 训练一个1B的金融大模型需要花多少钱? 1
- AlphaNet 1
- 卷积神经网络
- 循环神经网络
- Bert
- AlphaNet
- Vnp...
分类目录归档:个人成长
数据科学体系架构:从理论基础到工程实践-V03
数据科学体系架构:从理论基础到工程实践
一、数据基础架构与工程实践
现代数据科学建立在规模化数据工程基础之上。数据流水线采用Lambda架构实现批流一体化处理,使用Apache Spark进行分布式ETL处理,通过Apache Kafka构建实时数据流平台。数据质量保障采用系统化方法:使用Great Expectations框架定义数据质量规则,通过Anomaly Detection算法识别数据异常,基于数据血缘分析实现全链路追溯。
在特征工程层面,我们采用自动化特征工程(AutoFE)技术:使用TSFresh进行时序特征自动生成,通过FeatureTools实现深度特征合成。针对高维稀...
数据科学体系化构建:从底层处理到生产级部署-v02
数据科学体系化构建:从底层处理到生产级部署
数据科学作为一门融合统计学、计算机科学和领域知识的交叉学科,已形成完整的理论体系和技术栈。本文将从专业视角深入剖析数据科学的关键组成部分,着重探讨数据处理与分析、机器学习、图分析、向量搜索、优化算法以及MLOps等核心模块的技术实现与系统集成。
数据工程基础:构建可靠的数据流水线
数据处理是数据科学项目的基石。在实际工业场景中,数据工程师需要构建稳健的ETL(Extract-Transform-Load)流水线来处理多源异构数据。我们采用Apache Spark等分布式计算框架处理海量数据,运用数据质量框架如Great Expectations...
数据科学全景解析:从数据处理到智能部署-V01
数据科学全景解析:从数据处理到智能部署
在当今数据驱动的时代,数据科学已成为企业获取竞争优势的核心引擎。作为一名数据科学家,我深刻理解这个领域的复杂性和多维性。数据科学不仅是一门学科,更是一个完整的生态系统,涵盖了从数据收集到智能决策的全过程。本文将带您深入探索数据科学的关键组成部分,揭示如何将原始数据转化为可行动的智能。
数据基础:处理与分析的艺术
任何数据科学项目的起点都是数据。数据处理与分析构成了整个数据科学金字塔的基石。在实际工作中,数据往往以混乱、不完整的形式存在。数据清洗和预处理因此成为最关键且最耗时的环节。我们使用各种工具和技术来处理缺失值、异常值和重复数据,确保数据质量。...
AI金融-金融人工智能-用Python实现AI量化交易
机器智能
人工智能
超级智能
金融和机器学习
规范性金融理论
数据驱动的金融学
机器学习
人工智能优先的金融
统计失效
密集神经网络
循环神经网络
强化学习
算法交易
向量化回测
风险管理
执行与部署
展望
基于人工智能的竞争
金融奇点
附录
交互式神经网络
神经网络类
卷积神经网络
金融心理学-Books
股票作手回忆录-Books
网格交易法:数学+传统智慧战胜华尔街-Books
Time Series Forecasting in Python -Books
全文总结 这是一本关于时间序列预测的书籍相关介绍,作者为MANNING Marco Peixeiro 。书中涵盖了时间序列预测的核心概念、统计模型、深度学习以及自动化预测等多方面内容。开篇介绍时间序列的定义、分解以及预测项目生命周期等基础概念。接着详细阐述多种统计模型,如随机游走模型、移动平均模型、自回归模型及其组合ARMA、ARIMA模型等,包括模型原理、如何通过自相关函数(ACF)、偏自相关函数(PACF)等工具辅助建模,以及利用AIC准则、Q - Q图、Ljung - Box检验和残差分析等进行模型评估与选择。在深度学习部分,介绍其在时间序列预测中的应用,包括数据窗口处理、创建基线...
K线形态相似度精确匹配:DTW算法核心解析
K线形态相似度精确匹配:DTW算法核心解析
在金融市场的技术分析领域,K线形态识别是连接历史规律与未来预测的重要桥梁。无论是资深交易员还是量化研究者,都依赖对“头肩顶”“双底”“三角形整理”等经典形态的判断来捕捉交易信号。但市场的复杂性在于:同一形态可能在不同时间尺度下呈现出截然不同的时间跨度——比如有的“双底”用5天完成,有的却用12天;有的“头肩顶”左肩持续3天,右肩却拉伸至7天。传统的形态匹配方法(如固定窗口滑动比对、关键点硬性对齐)因无法处理这种时间轴的伸缩性,常常出现“看似相似却被判定为不匹配”的尴尬情况。
动态时间规整(Dynamic Time Warping, DTW)算法...