Rockyzsu-stock-炒股-量化交易


这个仓库名为stock,主要是关于炒股相关的代码项目,旨在帮助用户更好地进行股票相关的分析和交易等操作。以下是对该仓库的详细介绍:

1. 项目概述

该项目目前正在重构代码,所以目录结构可能与之前的描述有些出入。项目主要围绕炒股相关的功能展开,包含数据分析、数据采集、基金分析、交易等多个部分。

2. 目录结构

  • analysis/:数据分析部分,包含多个分析脚本,例如:
  • get_zt_info:分析次新板块中的涨停强度。
  • diagnose_stock:进行股票诊断,检查是否有黑历史和东北股。
  • ipospeed:分析 IPO 发行速度与指数的相关性。
  • fd_money:计算 A 股某段日期内...

Read more

逆向溯源


逆向溯源是一种从结果或现象出发,反向推导寻找其原因、源头或发展历程的方法和过程,在多个领域都有重要应用,以下是具体介绍:

逆向溯源的方法

  • 因果分析法:从已知结果入手,依据因果关系的逻辑,逐步探寻导致该结果的直接原因,再从直接原因进一步挖掘背后的间接原因,一层一层深入,直至找到根本原因。比如在分析某产品质量问题时,若发现产品出现裂缝这一结果,先判断可能是生产过程中的温度控制不当,进一步调查发现是温度控制设备故障,而设备故障的根源可能是维护保养不到位。
  • 数据分析法:对于有大量数据记录的情况,可通过分析数据来逆向溯源。比如分析电商平台上某商品销量突然下降的数据,可从不同维度如时间、地区、客户...

Read more

正向影响分析-


正向影响分析是一种评估某个因素、事件、政策、行为等对其他事物或系统产生积极作用和效果的方法。以下是关于正向影响分析通常涉及的一些方面:

分析步骤

  1. 确定分析对象:明确要分析的具体事物,比如一项新政策、一个商业项目、一种技术创新、一个社会活动等。
  2. 识别影响领域:确定该对象可能会对哪些方面产生影响,如经济、社会、环境、文化、技术等领域。
  3. 收集相关数据:通过各种渠道收集与分析对象及其可能产生的影响相关的数据和信息,包括历史数据、市场调研、行业报告、专家意见等。
  4. 评估正向影响

    • 经济方面:分析是否能带来经济增长,如增加产业产值、促进就业、提高企业利润、增加税收等。例如,某大型基础设施建设项目可...

Read more

QuantConnect-开源的算法交易平台


QuantConnect是一个开源的算法交易平台,为量化交易提供全面的工具和服务,旨在帮助用户从研究到实盘交易的全流程。 1. 平台概述:提供统一的量化基础设施,支持云端和本地部署。拥有35.5万量化社区成员,每月进行超50万次回测,月交易量达450亿美元,收益超过市场7%以上 。 2. 交易流程支持

- **云端研究**:云研究终端连接海量金融数据,支持机器学习模型训练、数据可视化与探索。数据涵盖金融、基本面和另类数据,另类数据关联证券并标记,方便构建策略。
- **回测**:可从研究无缝切换至回测,考虑费用、滑点和价差等因素,支持多资产组合回测,能导入自定义和另类数据,避免前瞻偏差。...

Read more

LEAN-开源量化交易技术平台


LEAN是QuantConnect.com推出的全球领先的开源量化交易技术平台,为量化交易提供了全面的解决方案,在功能特性、架构设计、社区支持等多方面表现出色。 1. 核心特性 - 无生存偏差:自动处理股票拆分、股息、公司行为(上市、退市、合并等),保证数据和交易处理的准确性。 - 投资组合管理:同一策略中,能跨多种资产类别和保证金模式,自动追踪投资组合表现、盈亏、购买力及持仓情况。 - 预定事件:可设置在特定时间(如交易时段、每周特定日子、每天特定时刻)触发常规函数。 - 导入自定义数据:支持几乎任何时间序列数据进行回测,能将专有信号数据导入策略。 2....

Read more

Greenplum数据库


Greenplum数据库的架构,它是一种大规模并行处理(MPP)数据库服务器,专为管理大规模分析型数据仓库和商业智能工作负载设计,基于PostgreSQL开源技术开发。

  1. 架构特点:采用shared nothing架构(MPP),多个处理器协同工作,各有独立内存、操作系统和磁盘,能并行处理查询。基于PostgreSQL 9.4开发,与PostgreSQL在SQL支持等方面相似,但也有诸多差异,如可利用GPORCA查询规划、支持追加优化存储和列式存储等。
  2. 存储格式:支持追加优化(AO)存储格式,提供数据保护、压缩和校验和等功能,行式或列式AO表都可压缩。列式存储逻辑上是表,但物理上按列存储...

Read more

Apache Atlas-Hadoop的数据治理和元数据框架


Apache Atlas的官方介绍页面,主要介绍了Apache Atlas的概述、功能、快速上手、文档等内容。 1. 概述:Apache Atlas是Hadoop的数据治理和元数据框架,具有可扩展的核心治理服务。能帮助企业在Hadoop环境中满足合规要求,还能与企业数据生态系统集成。为组织提供开放的元数据管理和治理能力,可构建数据资产目录,对资产分类治理,并为数据科学家、分析师和数据治理团队提供协作功能。 2. 功能

- **元数据类型与实例**:有针对Hadoop和非Hadoop元数据的预定义类型,也支持自定义类型。类型具备多种属性和继承特性,其实例(实体)用于记录元数据对象详情及关系...

Read more

解锁Apache Atlas:企业级元数据治理的“密钥”


解锁Apache Atlas:企业级元数据治理的“密钥”

一、数据治理新时代,Atlas 为何备受瞩目?

在当今数字化浪潮中,数据呈爆炸式增长,成为企业发展的核心驱动力。据国际数据公司(IDC)预测,到 2025 年,全球数据总量将达到 175ZB 。如此庞大的数据量,蕴含着无限的商业价值,然而也给企业带来了前所未有的数据治理难题。

企业数据犹如一座杂乱无章的 “数据迷宫”,数据源广泛且多样,涵盖了关系型数据库、非关系型数据库、文件系统、日志文件以及各类物联网设备产生的数据等。这些数据分散在企业的各个角落,缺乏统一的管理与规范,导致数据孤岛现象严重。不同部门之间的数据难以共享与流通,形成...

Read more

数据标签体系概述


数据标签体系是什么

在数字化浪潮席卷全球的当下,数据已成为企业发展和创新的核心驱动力。从电商平台对用户购物习惯的精准把握,到金融机构对风险的有效评估,再到社交媒体对用户兴趣的深度洞察,数据无处不在,而数据标签体系则是解锁这些数据价值的关键密码。

简单来说,数据标签体系是一种对数据进行分类、描述和标识的结构化方法。它通过为数据赋予特定的标签,将复杂的数据转化为易于理解和处理的信息单元,从而实现对数据的高效管理和利用。这些标签如同一个个精准的索引,帮助企业在海量数据中快速定位、筛选和分析所需信息,为决策提供有力支持。

以电商平台为例,数据标签体系可以对用户进行全方位的刻画。从基本属性如年龄、...

Read more

数据标签体系:核心概念、架构、应用场景与最佳实践-视频文字


数据标签体系:核心概念、架构、应用场景与最佳实践

一、核心概念

  1. 数据标签(Data Tag)
  2. 数据标签是对数据实体(如用户、商品、事件等)的属性、特征或分类的抽象描述,例如“高价值用户”“热销商品”“风险交易”等。
  3. 标签可以是静态(如性别、地域)或动态(如近30天活跃度)。

  4. 标签体系(Tagging System)

  5. 标签体系是一套结构化、层次化的标签集合,通过逻辑关系(如父子、并列、依赖)组织,确保标签的可复用性和可扩展性。
  6. 例如,电商场景的标签体系可能包含“用户画像”“商品分类”“行为分析”等大类。

  7. 标签分类与层级

  8. 基础标签:直接来源于原始数据(如...

Read more