分类目录归档：自研课程

Cot思维链：人工智能推理能力的革命性突破

85 views

Cot思维链：人工智能推理能力的革命性突破

近年来，随着大语言模型（LLM）的快速发展，人工智能在文本生成、问答系统等任务中展现出惊人的能力。然而，模型如何得出答案的"黑箱"特性始终是制约其可信度的关键瓶颈。2022年，Google研究人员在《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》论文中提出的思维链（Chain-of-Thought, CoT）技术，通过让AI展示完整的推理步骤，不仅显著提升了复杂问题的解决能力，更打开了理解机器认知过程的窗口。这项技术正在重塑人机协作的范式，成为AI可解...

多智能体框架-视频文字

126 views

多智能体框架（Multi-Agent Framework）是支持多个智能体（Agent）协同工作、交互和决策的系统架构，广泛应用于分布式人工智能、机器人协作、自动驾驶、游戏AI、供应链优化等领域。以下是多智能体框架的核心概念、关键组成和典型应用方向：

1. 多智能体框架的核心概念

智能体（Agent）：具有自主决策能力的实体，能感知环境、处理信息并采取行动。
协作与竞争：智能体之间可能合作完成共同目标，也可能因资源竞争而产生博弈。
去中心化：无需全局控制中心，智能体通过本地规则或通信实现系统级目标。
环境动态性：智能体需适应环境变化（如其他智能体的行为、外部事件等）。

2. 多智...

向量数据库概述-视频文字

88 views

向量数据库概述

向量数据库是一种专门用于存储、管理和高效检索高维向量数据的数据库系统。与传统数据库基于精确匹配的查询不同，向量数据库通过计算向量之间的相似性（如余弦相似度、欧氏距离等）实现近似搜索，尤其擅长处理图像、文本、音频等非结构化数据转化而来的高维向量。其核心价值在于解决人工智能和大数据场景下海量高维数据的实时检索需求，广泛应用于推荐系统、图像搜索、自然语言处理等领域。

核心原理

1. 向量空间模型

向量数据库基于向量空间模型（VSM），将数据映射为高维空间中的点。例如，文本可通过词嵌入（如Word2Vec、BERT）转化为向量，图像通过CNN提取特征向量。相似性通过向量间的距离...

向量数据库核心技术解析-视频文字

142 views

向量数据库核心技术解析

向量数据库作为处理高维非结构化数据的核心工具，其技术体系融合了信息检索、机器学习与分布式系统等多个领域的成果。本文将从索引技术、相似性度量、存储优化、查询处理、分布式架构及嵌入模型六大核心技术展开分析，并结合实际应用场景探讨其技术演进方向。

一、高效索引技术

索引技术是向量数据库实现快速检索的核心。传统数据库的B树、倒排索引等结构难以应对高维数据的“维度灾难”，因此向量数据库采用以下三类索引优化策略：

层次化图结构索引（HNSW）
基于小世界网络理论构建多层图结构，通过贪心算法在层级间快速导航，实现高维向量的近似最近邻搜索（ANN）。HNSW在保证90...

FinSearch概述-视频文字

93 views

FinSearch 概述、原理与架构解析

一、概述

FinSearch 是面向金融投研场景的专业化智能搜索系统，旨在通过结合大模型能力与垂直领域数据处理技术，提升金融信息检索与分析效率。其核心目标是为投资者、分析师等提供快速、精准的多模态金融数据（如研报、公告、会议纪要）搜索与推理服务，并支持复杂的投研决策分析。典型应用包括关联标的挖掘、企业基本面分析、市场趋势预测等。

以熵简科技的 AlphaEngine 为例，该系统基于开源大模型 DeepSeek-R1 构建，结合高质量的投研数据与思维链（CoT）轨迹蒸馏，形成了具备深度推理能力的金融大模型 FinGPT Deep，实现了从自然语言...

Data Mesh 核心概念、架构与概述

83 views

Data Mesh 核心概念、架构与概述

1. 核心概念
Data Mesh 是一种去中心化的数据架构范式，由 Zhamak Dehghani 提出，旨在解决传统集中式数据架构（如数据仓库、数据湖）在规模化、敏捷性和协作性上的瓶颈。其核心原则包括：

领域自治（Domain Ownership）
数据由业务领域团队直接负责，每个领域团队拥有自己的数据产品（Data Product），确保数据贴近业务需求，减少跨团队依赖。
数据即产品（Data as a Product）
数据被视为独立的产品，需满足可发现、可理解、可信、可交互等标准，例如提供元数据、SLA（服务等级协议）和...

数据标签体系：核心概念、架构、应用场景与最佳实践-视频文字

103 views

数据标签体系：核心概念、架构、应用场景与最佳实践

一、核心概念

数据标签（Data Tag）
数据标签是对数据实体（如用户、商品、事件等）的属性、特征或分类的抽象描述，例如“高价值用户”“热销商品”“风险交易”等。
标签可以是静态（如性别、地域）或动态（如近30天活跃度）。
标签体系（Tagging System）
标签体系是一套结构化、层次化的标签集合，通过逻辑关系（如父子、并列、依赖）组织，确保标签的可复用性和可扩展性。
例如，电商场景的标签体系可能包含“用户画像”“商品分类”“行为分析”等大类。
标签分类与层级
基础标签：直接来源于原始数据（如...

数据中台概述-视频文字

101 views

数据中台（Data Middle Platform）是近年来企业数字化转型中的热门概念，其核心目标是打破数据孤岛、实现数据资产化，并通过统一的数据服务能力赋能业务快速创新。以下是关于数据中台的详细解析：

1. 数据中台的定义

数据中台是企业级的数据能力共享平台，通过整合多源异构数据（业务系统、IoT设备、日志等），构建统一的数据资产体系，并以API、可视化工具等方式为前端业务（如营销、风控、运营）提供灵活、高效的数据服务。

类比：类似于“数据厨房”，将原始数据（食材）加工成标准化、可复用的数据产品（半成品菜），供业务端快速调用，避免重复“切菜炒菜”。

2. 数据中台 vs 传统数据平...

数据工程概述-视频文字

94 views

数据工程架构概述

数据工程架构是支撑现代数据驱动应用的核心框架，旨在高效、可靠地管理数据的全生命周期（采集、存储、处理、分析和服务）。它为企业提供从原始数据到业务价值的转化能力，是数据科学、机器学习、商业智能（BI）等上层应用的基础。

1. 核心目标

数据可用性：确保数据可被正确、及时地访问。
可扩展性：支持海量数据的增长（如PB级数据）。
可靠性：保障数据一致性、容错性和灾备能力。
高效性：优化存储与计算的成本及性能。
安全性：通过权限控制、加密等手段保护数据隐私。

2. 典型分层架构

数据工程架构通常分为以下层次：

（1）数据采集层（Ingestion）

功能：从异构数据源...

AI数据分析-视频文字

95 views

AI数据分析：驱动智能时代的决策革命

引言：数据洪流中的智能进化

步入21世纪，数据已然成为与石油相媲美的战略资源。国际数据公司（IDC）预测，到2025年，全球数据总量将激增至175 ZB（1 ZB = 1万亿GB）。然而，令人惊讶的是，其中被有效分析的数据竟不足2%。传统的数据分析方法，由于效率低下，且高度依赖人工经验，在面对海量、复杂且异构的数据时，愈发显得力不从心。

AI数据分析（AI-Driven Data Analytics）适时登场，借助机器学习、深度学习等前沿技术，为数据赋予了“自我学习”的能力，能够从过往的历史规律中精准洞察未来趋势。以Netflix为例，它运用AI深入...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。