分类目录归档:个人成长
Time Series Forecasting in Python -Books
全文总结 这是一本关于时间序列预测的书籍相关介绍,作者为MANNING Marco Peixeiro 。书中涵盖了时间序列预测的核心概念、统计模型、深度学习以及自动化预测等多方面内容。开篇介绍时间序列的定义、分解以及预测项目生命周期等基础概念。接着详细阐述多种统计模型,如随机游走模型、移动平均模型、自回归模型及其组合ARMA、ARIMA模型等,包括模型原理、如何通过自相关函数(ACF)、偏自相关函数(PACF)等工具辅助建模,以及利用AIC准则、Q - Q图、Ljung - Box检验和残差分析等进行模型评估与选择。在深度学习部分,介绍其在时间序列预测中的应用,包括数据窗口处理、创建基线...
K线形态相似度精确匹配:DTW算法核心解析
K线形态相似度精确匹配:DTW算法核心解析
在金融市场的技术分析领域,K线形态识别是连接历史规律与未来预测的重要桥梁。无论是资深交易员还是量化研究者,都依赖对“头肩顶”“双底”“三角形整理”等经典形态的判断来捕捉交易信号。但市场的复杂性在于:同一形态可能在不同时间尺度下呈现出截然不同的时间跨度——比如有的“双底”用5天完成,有的却用12天;有的“头肩顶”左肩持续3天,右肩却拉伸至7天。传统的形态匹配方法(如固定窗口滑动比对、关键点硬性对齐)因无法处理这种时间轴的伸缩性,常常出现“看似相似却被判定为不匹配”的尴尬情况。
动态时间规整(Dynamic Time Warping, DTW)算法...
架构师修炼之道-Books
架构简介
架构简介
架构设计的技术方法
切分与扩展
主动发现
自动化
灰度升级
过载保护
负载均衡
柔性
架构思维意识
稳定为王
完成比完美重要
聚沙成塔
自动化思维
产品思维
善用工具
算法
流程和文化
案例剖析
架构案例剖析
集成学习实战-高塔姆-Books
集成学习基础知识
集成方法: 炒作还是福音
基本集成方法
同质并行集成:Bagging法和随机森林
异质并行集成: 结合强学习起
顺序集成: 自适应提升
顺序集成: 梯度提升
顺序集成: 牛顿提升
集成之外: 将集成方法应用于你的数据
学习连续和计数标签
学习分类特征
集成学习可解释性
Python预测之美-数据分析与算法实战
预测入门
认识预测
什么是预测
占卜术
神秘的地动仪
科学预测
预测的原则
前沿技术
大数据与预测
大数据预测的特点
人工智能与预测
热工智能预测的特点
典型预测案例
Python 预测初步
数据预处理
建立模型
预测及误差分析
预测方法论
预测流程
确定主题
收集数据
选择方法
分析规律
建立模型
评估效果
发布模型
指导原则
界定问题
判断预测法
外推预测法
因果预测法
探索规律
相关分析
自相关分析
偏相关分析
简单相关分析
互相相关分析
典型相关分析
因果分析
什么是因果推断
因果推断的方法
时序因果推断
聚类分析
关联规则挖掘
Apriori 算法
Eclat 算法
序列模式挖...
精通API架构-设计,运维与演进-Books
导论
设计,构建和测试API
设计 构建和规范API
API 接口测试
API 流量管理
API 网关:入口流量管理
服务网格: 服务间流量管理
API 运维与安全
部署和发布API
运维安全性: API 的威胁建模
API 身份验证和授权
实用API 的演进架构
将应用程序重新设计为API 驱动的架构
实用API 基础设施向云平台演进
总结
特征编码:机器学习模型理解世界的桥梁
特征编码:机器学习模型理解世界的桥梁
在机器学习项目中,数据往往以各种形态呈现:用户ID、城市名称、产品类别、学历等级、日期时间……这些信息对人类而言含义清晰,但对绝大多数机器学习模型来说却如同天书。模型的核心是数学运算(向量、矩阵、梯度计算),它们只能直接处理数值型数据。这就是特征编码要解决的核心问题:将非数值型(类别型、文本型、时间型等)数据,转化为适合机器学习模型处理的数值型表示,同时尽可能保留或揭示原始数据中蕴含的有价值信息。
以下是特征编码解决的关键问题及其深层意义:
1. 解决数据格式兼容性问题:让模型“能看见”
- 根本矛盾: 模型(如线性回归、SVM、神经网络、大部分树模型...
当AI化身金融研究员:一场投资研究的智能革命
当AI化身金融研究员:一场投资研究的智能革命
在金融的世界里,每一个决策都关乎真金白银,容不得半点马虎。而投资研究,更是这场财富博弈中最关键的一环。传统的投资研究,往往需要研究员们耗费大量的时间和精力去收集、整理和分析数据,过程繁琐且效率低下。但现在,随着人工智能技术的飞速发展,一场投资研究的智能革命正在悄然上演。今天,就让我们一起走进这场革命,看看AI是如何化身金融研究员,改变投资研究的格局的。
一、技术架构:智能投资研究的核心逻辑
在这场智能革命的背后,是一套精心设计的技术架构。从相关的技术展示中,我们可以清晰地看到,其核心在于“多智能体协作 + 记忆增强 + 人类反馈 + 数据驱动...
Embedding 原理概述
Embedding 原理概述
Embedding(嵌入)是机器学习和人工智能领域的核心概念,本质是将高维、离散、稀疏的数据(如文字、图片、音频、用户、商品等)转换为低维、连续、稠密的实数向量表示的过程。这些向量被称为嵌入向量(Embedding Vector),其神奇之处在于能在向量空间中捕获并保留原始数据的语义、关系或特征。
为何需要 Embedding?
- 维数灾难与稀疏性: 像“词袋模型”这类方法,每个词用一个维度表示,词典庞大时向量维度极高且极度稀疏(大部分元素为0),计算效率低,难以捕捉语义。
- 语义鸿沟: 离散符号本身无法直接表达“相似性”(如“猫”和“狗”都比“汽车”更接近“...