作者文章归档:course

FinSearch概述-视频文字


FinSearch 概述、原理与架构解析

一、概述

FinSearch 是面向金融投研场景的专业化智能搜索系统,旨在通过结合大模型能力与垂直领域数据处理技术,提升金融信息检索与分析效率。其核心目标是为投资者、分析师等提供快速、精准的多模态金融数据(如研报、公告、会议纪要)搜索与推理服务,并支持复杂的投研决策分析。典型应用包括关联标的挖掘、企业基本面分析、市场趋势预测等。

以熵简科技的 AlphaEngine 为例,该系统基于开源大模型 DeepSeek-R1 构建,结合高质量的投研数据与思维链(CoT)轨迹蒸馏,形成了具备深度推理能力的金融大模型 FinGPT Deep,实现了从自然语言...

Read more

Data Mesh概述


解锁Data Mesh:数据管理的全新变革

一、Data Mesh 是什么

在数字化浪潮汹涌澎湃的当下,数据已然成为企业最为宝贵的资产之一,如同石油于工业时代那般不可或缺。如何高效地管理和利用这些数据,使其转化为推动企业发展的强大动力,成为众多企业面临的关键课题。Data Mesh,作为一种新兴的数据架构范式,正逐渐走进人们的视野,为解决传统数据架构的瓶颈问题带来了新的曙光。

Data Mesh 由 ThoughtWorks 的首席技术顾问 Zhamak Dehghani 提出,它的诞生绝非偶然,而是顺应了数据管理发展的迫切需求。传统的数据架构,如数据仓库和数据湖,在面对日益增长的数据规...

Read more

Rockyzsu-stock-炒股-量化交易


这个仓库名为stock,主要是关于炒股相关的代码项目,旨在帮助用户更好地进行股票相关的分析和交易等操作。以下是对该仓库的详细介绍:

1. 项目概述

该项目目前正在重构代码,所以目录结构可能与之前的描述有些出入。项目主要围绕炒股相关的功能展开,包含数据分析、数据采集、基金分析、交易等多个部分。

2. 目录结构

  • analysis/:数据分析部分,包含多个分析脚本,例如:
  • get_zt_info:分析次新板块中的涨停强度。
  • diagnose_stock:进行股票诊断,检查是否有黑历史和东北股。
  • ipospeed:分析 IPO 发行速度与指数的相关性。
  • fd_money:计算 A 股某段日期内...

Read more

逆向溯源


逆向溯源是一种从结果或现象出发,反向推导寻找其原因、源头或发展历程的方法和过程,在多个领域都有重要应用,以下是具体介绍:

逆向溯源的方法

  • 因果分析法:从已知结果入手,依据因果关系的逻辑,逐步探寻导致该结果的直接原因,再从直接原因进一步挖掘背后的间接原因,一层一层深入,直至找到根本原因。比如在分析某产品质量问题时,若发现产品出现裂缝这一结果,先判断可能是生产过程中的温度控制不当,进一步调查发现是温度控制设备故障,而设备故障的根源可能是维护保养不到位。
  • 数据分析法:对于有大量数据记录的情况,可通过分析数据来逆向溯源。比如分析电商平台上某商品销量突然下降的数据,可从不同维度如时间、地区、客户...

Read more

正向影响分析-


正向影响分析是一种评估某个因素、事件、政策、行为等对其他事物或系统产生积极作用和效果的方法。以下是关于正向影响分析通常涉及的一些方面:

分析步骤

  1. 确定分析对象:明确要分析的具体事物,比如一项新政策、一个商业项目、一种技术创新、一个社会活动等。
  2. 识别影响领域:确定该对象可能会对哪些方面产生影响,如经济、社会、环境、文化、技术等领域。
  3. 收集相关数据:通过各种渠道收集与分析对象及其可能产生的影响相关的数据和信息,包括历史数据、市场调研、行业报告、专家意见等。
  4. 评估正向影响

    • 经济方面:分析是否能带来经济增长,如增加产业产值、促进就业、提高企业利润、增加税收等。例如,某大型基础设施建设项目可...

Read more

QuantConnect-开源的算法交易平台


QuantConnect是一个开源的算法交易平台,为量化交易提供全面的工具和服务,旨在帮助用户从研究到实盘交易的全流程。 1. 平台概述:提供统一的量化基础设施,支持云端和本地部署。拥有35.5万量化社区成员,每月进行超50万次回测,月交易量达450亿美元,收益超过市场7%以上 。 2. 交易流程支持

- **云端研究**:云研究终端连接海量金融数据,支持机器学习模型训练、数据可视化与探索。数据涵盖金融、基本面和另类数据,另类数据关联证券并标记,方便构建策略。
- **回测**:可从研究无缝切换至回测,考虑费用、滑点和价差等因素,支持多资产组合回测,能导入自定义和另类数据,避免前瞻偏差。...

Read more

LEAN-开源量化交易技术平台


LEAN是QuantConnect.com推出的全球领先的开源量化交易技术平台,为量化交易提供了全面的解决方案,在功能特性、架构设计、社区支持等多方面表现出色。 1. 核心特性 - 无生存偏差:自动处理股票拆分、股息、公司行为(上市、退市、合并等),保证数据和交易处理的准确性。 - 投资组合管理:同一策略中,能跨多种资产类别和保证金模式,自动追踪投资组合表现、盈亏、购买力及持仓情况。 - 预定事件:可设置在特定时间(如交易时段、每周特定日子、每天特定时刻)触发常规函数。 - 导入自定义数据:支持几乎任何时间序列数据进行回测,能将专有信号数据导入策略。 2....

Read more

Greenplum数据库


Greenplum数据库的架构,它是一种大规模并行处理(MPP)数据库服务器,专为管理大规模分析型数据仓库和商业智能工作负载设计,基于PostgreSQL开源技术开发。

  1. 架构特点:采用shared nothing架构(MPP),多个处理器协同工作,各有独立内存、操作系统和磁盘,能并行处理查询。基于PostgreSQL 9.4开发,与PostgreSQL在SQL支持等方面相似,但也有诸多差异,如可利用GPORCA查询规划、支持追加优化存储和列式存储等。
  2. 存储格式:支持追加优化(AO)存储格式,提供数据保护、压缩和校验和等功能,行式或列式AO表都可压缩。列式存储逻辑上是表,但物理上按列存储...

Read more

Apache Atlas-Hadoop的数据治理和元数据框架


Apache Atlas的官方介绍页面,主要介绍了Apache Atlas的概述、功能、快速上手、文档等内容。 1. 概述:Apache Atlas是Hadoop的数据治理和元数据框架,具有可扩展的核心治理服务。能帮助企业在Hadoop环境中满足合规要求,还能与企业数据生态系统集成。为组织提供开放的元数据管理和治理能力,可构建数据资产目录,对资产分类治理,并为数据科学家、分析师和数据治理团队提供协作功能。 2. 功能

- **元数据类型与实例**:有针对Hadoop和非Hadoop元数据的预定义类型,也支持自定义类型。类型具备多种属性和继承特性,其实例(实体)用于记录元数据对象详情及关系...

Read more

解锁Apache Atlas:企业级元数据治理的“密钥”


解锁Apache Atlas:企业级元数据治理的“密钥”

一、数据治理新时代,Atlas 为何备受瞩目?

在当今数字化浪潮中,数据呈爆炸式增长,成为企业发展的核心驱动力。据国际数据公司(IDC)预测,到 2025 年,全球数据总量将达到 175ZB 。如此庞大的数据量,蕴含着无限的商业价值,然而也给企业带来了前所未有的数据治理难题。

企业数据犹如一座杂乱无章的 “数据迷宫”,数据源广泛且多样,涵盖了关系型数据库、非关系型数据库、文件系统、日志文件以及各类物联网设备产生的数据等。这些数据分散在企业的各个角落,缺乏统一的管理与规范,导致数据孤岛现象严重。不同部门之间的数据难以共享与流通,形成...

Read more