分类目录归档：知识库

The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文

198 views

这篇文档是一份全面的大语言模型（LLM）微调指南，用通俗的话来说，核心就是教大家“怎么把现成的大模型（比如GPT、LLaMA）改成自己需要的样子”，从基础原理到实际操作都讲透了。

一、先搞懂核心概念：什么是LLM微调？

现成的大模型（比如GPT-3、LLaMA）已经学了海量通用知识，但面对具体场景（比如医疗问诊、金融分析）可能不够用。微调就像是“针对性补课”——用小范围的专属数据（比如医疗病历、金融报告），让大模型在不忘记原有知识的前提下，精准适配特定任务或领域，不用从零训练，省钱又高效。

二、微调的完整流程：七步走就能搞定

文档里给了一个清晰的“七阶段流程”，一步步教你做： 1. 准备...

Cognitive Architectures for Language Agents-论文

234 views

这篇论文核心是提出CoALA（语言智能体认知架构） 框架，为基于大语言模型（LLM）的语言智能体提供统一的设计与分类标准，同时结合认知科学和符号人工智能的历史经验，为通用语言智能体的发展指明方向。

研究背景与动机

语言智能体是一类以LLM为核心、能与世界交互的AI系统，已在机器人控制、网页操作等领域取得实证成功，但缺乏统一框架整合现有研究，不同系统的术语、设计思路零散，难以对比和迭代。
传统认知架构（如Soar）和产生式系统的理念可迁移到LLM领域：LLM本质是概率性的字符串改写系统，与产生式系统存在天然相似性，而认知架构的控制逻辑能弥补LLM在记忆管理、决策规划上的不足。

核心理论...

专知-专业可信的知识分发-网站池

193 views

专业可信的知识分发

官网

MSCI-指数编制与投资决策支持机构-网站

219 views

MSCI官网核心内容完整分析报告

一、报告摘要

本报告基于MSCI官网（https://www.msci.com/）公开信息，全面梳理其核心业务、市场数据表现、特色解决方案、研究洞察及未来动态。MSCI作为全球领先的指数编制与投资决策支持机构，核心业务覆盖数据与分析、公开/私募指数体系、研究洞察三大板块，同时聚焦ESG（环境、社会、治理）、AI赋能、跨市场整合等关键趋势。从市场表现看，全球主要国家/地区及核心指数呈现分化态势，新兴市场与亚洲部分国家表现较弱，欧洲、瑞士等发达市场表现亮眼；业务层面，MSCI通过创新指数、特色工具及专业研究，为全球投资者提供跨资产类别、跨市场的决策支持，20...

ITPM-世界级线上交易视频课程

236 views

1. 一段话总结

Institute of Trading and Portfolio Management（ITPM） 核心提供世界级线上交易视频课程（含IPLT、PTM、POTM、PFTM）、3个月导师项目及线下/线上研讨会（如12月29日Alex分享会、1月8日Anton Kreil AMA），学员可获得世界级专业交易员指导、Discord社区支持（分Society、Study Hall、Citizens三级），通过相关课程且有12个月盈利记录可对接投行、对冲基金等机构，交易实施支持最低25,000美元资金的实盘账户及专属经理服务，同时为校友提供持续教育与资源对接。

2. 思维导...

Nebius-为AI创新者打造的终极云平台

209 views

1. 一段话总结

Nebius 是为AI创新者打造的终极云平台，以民主化AI基础设施为核心，具备灵活架构（支持单GPU到数千NVIDIA GPU集群的无缝扩展）、经测试的高性能（集成NVIDIA GPU、InfiniBand网络及Kubernetes/Slurm编排）和长期价值（全栈优化提升效率），提供GB200、H200、H100等最新NVIDIA GPU，搭配托管Kubernetes、MLflow等全托管服务及24/7专家支持，已在基因编辑、AI搜索、设计、药物研发等多个领域落地成功案例，还推出H100首1000小时每GPU小时$1.50的专属优惠，助力用户高效实现AI训练与推理。

...

MLflow-开源开发者平台

214 views

1. 一段话总结

MLflow 是一款开源开发者平台，主打提供生产就绪型AI能力，可助力用户自信构建AI应用和模型，核心支持 GenAI应用与智能体（含可观测性、评估、AI网关、跟踪等功能） 及 机器学习工作流（含端到端跟踪、模型管理、部署） ，被Databricks、Microsoft等数千家机构信任，集成PyTorch、OpenAI等40+应用与框架，提供 自托管开源版（Apache-2.0许可，完全掌控基础设施） 和 托管版（免费无部署麻烦，与原创建者维护，兼容开源） ，近期更新含OpenTelemetry支持、OpenAI智能体提示词优化（准确率提升14%）等功能，同时拥有20k...

DDG-DA: Data Distribution Generation for Predictable Concept Drift Adaptation-论文

200 views

DDG-DA: Data Distribution Generation for Predictable Concept Drift Adaptation

Universal Trading for Order Execution with Oracle Policy Distillation-论文

223 views

1. 一段话总结

本文聚焦算法交易中的订单执行这一基础问题（核心目标是完成特定工具的清算或获取订单），指出近年该领域已从基于模型的市场假设分析视角转向无模型的强化学习视角，但由于策略可利用的市场信息存在噪声且不完美，构建样本高效的强化学习方法面临挑战；为此提出一种新颖的通用交易策略优化框架，其核心是借助先知教师（拥有完美信息）的策略蒸馏方法引导通用策略学习，以逼近最优交易策略，在AAAI 2021上被接收的该方法，经大量实验验证，相比多种强基线有显著改进，且交易行为合理。

2. 思维导图（mindmap）

## 核心背景
- 问题定位：算法交易中的订单执行（清算/获取特定工具订单）
-...

Git-子模块-子树合并-多仓逻辑聚合

232 views

在 Gitee 中，要在一个代码仓库（主仓库）中嵌入多个其他仓库（子仓库），核心是利用 Git 原生的子模块（Submodule） 或 子树合并（Subtree Merge） 功能——这两种方法均兼容 Gitee（本质是 Git 仓库托管），且能实现“主仓库关联子仓库、保持同步更新”的需求，具体选择哪种取决于你的使用场景（是否需要子仓库独立维护、是否希望子仓库代码融入主仓库历史等）。

一、核心方法对比（先选对方案）

特性	子模块（Submodule）	子树合并（Subtree Merge）
本质	主仓库存储子仓库的“引用”（Commit ID + 地址）	子仓库代码完全合并...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文

一、先搞懂核心概念：什么是LLM微调？

二、微调的完整流程：七步走就能搞定

Cognitive Architectures for Language Agents-论文

研究背景与动机

核心理论...

专知-专业可信的知识分发-网站池

MSCI-指数编制与投资决策支持机构-网站

MSCI官网核心内容完整分析报告

一、报告摘要

ITPM-世界级线上交易视频课程

1. 一段话总结

2. 思维导...

Nebius-为AI创新者打造的终极云平台

1. 一段话总结

MLflow-开源开发者平台

1. 一段话总结

DDG-DA: Data Distribution Generation for Predictable Concept Drift Adaptation-论文

Universal Trading for Order Execution with Oracle Policy Distillation-论文

1. 一段话总结

2. 思维导图（mindmap）

Git-子模块-子树合并-多仓逻辑聚合

一、核心方法对比（先选对方案）