分类目录归档:知识库

From Local to Global: A GraphRAG Approach to Query-Focused Summarization-论文


该文档提出了一种名为GraphRAG的基于图的检索增强生成方法,核心是解决传统RAG在全局问题上的短板,实现对大规模文本语料的全局意义建构。

核心背景与问题

  • 传统RAG(向量RAG)擅长处理局部查询,但无法应对“数据集的主要主题是什么”这类需要全局理解的问题,这类问题本质是查询聚焦摘要(QFS)任务。
  • 现有QFS方法难以适配RAG系统的大规模文本索引需求,因此需要融合两者优势。

GraphRAG核心设计与流程

  1. 索引构建阶段
    • 文本切块:将源文档拆分为文本块,平衡提取成本与信息召回率。
    • 实体与关系提取:利用LLM提取文本块中的实体、实体关系及事实声明,并生成描述。
    • 知识图谱构建:将提取...

Read more

The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文


这篇文档是一份全面的大语言模型(LLM)微调指南,用通俗的话来说,核心就是教大家“怎么把现成的大模型(比如GPT、LLaMA)改成自己需要的样子”,从基础原理到实际操作都讲透了。

一、先搞懂核心概念:什么是LLM微调?

现成的大模型(比如GPT-3、LLaMA)已经学了海量通用知识,但面对具体场景(比如医疗问诊、金融分析)可能不够用。微调就像是“针对性补课”——用小范围的专属数据(比如医疗病历、金融报告),让大模型在不忘记原有知识的前提下,精准适配特定任务或领域,不用从零训练,省钱又高效。

二、微调的完整流程:七步走就能搞定

文档里给了一个清晰的“七阶段流程”,一步步教你做: 1. 准备...

Read more

Cognitive Architectures for Language Agents-论文


这篇论文核心是提出CoALA(语言智能体认知架构) 框架,为基于大语言模型(LLM)的语言智能体提供统一的设计与分类标准,同时结合认知科学和符号人工智能的历史经验,为通用语言智能体的发展指明方向。

研究背景与动机

  • 语言智能体是一类以LLM为核心、能与世界交互的AI系统,已在机器人控制、网页操作等领域取得实证成功,但缺乏统一框架整合现有研究,不同系统的术语、设计思路零散,难以对比和迭代。
  • 传统认知架构(如Soar)和产生式系统的理念可迁移到LLM领域:LLM本质是概率性的字符串改写系统,与产生式系统存在天然相似性,而认知架构的控制逻辑能弥补LLM在记忆管理、决策规划上的不足。

核心理论...

Read more

MSCI-指数编制与投资决策支持机构-网站


MSCI官网核心内容完整分析报告

一、报告摘要

本报告基于MSCI官网(https://www.msci.com/)公开信息,全面梳理其核心业务、市场数据表现、特色解决方案、研究洞察及未来动态。MSCI作为全球领先的指数编制与投资决策支持机构,核心业务覆盖数据与分析、公开/私募指数体系、研究洞察三大板块,同时聚焦ESG(环境、社会、治理)、AI赋能、跨市场整合等关键趋势。从市场表现看,全球主要国家/地区及核心指数呈现分化态势,新兴市场与亚洲部分国家表现较弱,欧洲、瑞士等发达市场表现亮眼;业务层面,MSCI通过创新指数、特色工具及专业研究,为全球投资者提供跨资产类别、跨市场的决策支持,20...

Read more

ITPM-世界级线上交易视频课程


1. 一段话总结

Institute of Trading and Portfolio Management(ITPM) 核心提供世界级线上交易视频课程(含IPLT、PTM、POTM、PFTM)、3个月导师项目及线下/线上研讨会(如12月29日Alex分享会、1月8日Anton Kreil AMA),学员可获得世界级专业交易员指导、Discord社区支持(分Society、Study Hall、Citizens三级),通过相关课程且有12个月盈利记录可对接投行、对冲基金等机构,交易实施支持最低25,000美元资金的实盘账户及专属经理服务,同时为校友提供持续教育与资源对接。


2. 思维导...

Read more

Nebius-为AI创新者打造的终极云平台


1. 一段话总结

Nebius 是为AI创新者打造的终极云平台,以民主化AI基础设施为核心,具备灵活架构(支持单GPU到数千NVIDIA GPU集群的无缝扩展)、经测试的高性能(集成NVIDIA GPU、InfiniBand网络及Kubernetes/Slurm编排)和长期价值(全栈优化提升效率),提供GB200、H200、H100等最新NVIDIA GPU,搭配托管Kubernetes、MLflow等全托管服务及24/7专家支持,已在基因编辑、AI搜索、设计、药物研发等多个领域落地成功案例,还推出H100首1000小时每GPU小时$1.50的专属优惠,助力用户高效实现AI训练与推理。

...

Read more

MLflow-开源开发者平台


1. 一段话总结

MLflow 是一款开源开发者平台,主打提供生产就绪型AI能力,可助力用户自信构建AI应用和模型,核心支持 GenAI应用与智能体(含可观测性、评估、AI网关、跟踪等功能)机器学习工作流(含端到端跟踪、模型管理、部署) ,被Databricks、Microsoft等数千家机构信任,集成PyTorch、OpenAI等40+应用与框架,提供 自托管开源版(Apache-2.0许可,完全掌控基础设施)托管版(免费无部署麻烦,与原创建者维护,兼容开源) ,近期更新含OpenTelemetry支持、OpenAI智能体提示词优化(准确率提升14%)等功能,同时拥有20k...

Read more

Universal Trading for Order Execution with Oracle Policy Distillation-论文


1. 一段话总结

本文聚焦算法交易中的订单执行这一基础问题(核心目标是完成特定工具的清算或获取订单),指出近年该领域已从基于模型的市场假设分析视角转向无模型的强化学习视角,但由于策略可利用的市场信息存在噪声且不完美,构建样本高效的强化学习方法面临挑战;为此提出一种新颖的通用交易策略优化框架,其核心是借助先知教师(拥有完美信息)的策略蒸馏方法引导通用策略学习,以逼近最优交易策略,在AAAI 2021上被接收的该方法,经大量实验验证,相比多种强基线有显著改进,且交易行为合理。


2. 思维导图(mindmap)

## 核心背景
- 问题定位:算法交易中的订单执行(清算/获取特定工具订单)
-...

Read more