“DataLab: A Unified Platform for LLM-Powered Business Intelligence”提出了DataLab平台,将基于大语言模型(LLM)的智能体框架与计算笔记本界面相结合,以统一商业智能(BI)工作流程,提升BI任务处理的效率和效果。 1. 背景与挑战:传统BI工作流程繁琐,基于LLM的智能体虽有帮助,但现有方法多聚焦单个任务,存在缺乏领域知识融合、任务间信息共享不足和LLM上下文管理需求未满足等问题。 2. DataLab平台概述:由LLM - 基于代理框架和计算笔记本界面组成。前者针对不同BI任务设计多个代理,通过代理协作完成任务;后者增强JupyterLab,支持多语言单元格和即时LLM辅助,方便用户操作。 3. 关键模块设计 - 领域知识融合:通过知识生成、组织和利用三个阶段,利用数据处理脚本和LLM生成知识,用知识图谱组织知识,检索知识并转换查询为DSL,提升代理在企业特定BI任务上的性能。 - 智能体间通信:设计结构化信息格式和共享信息缓冲区,采用FSM - 基于的方法实现选择性检索,促进智能体间高效通信,提高复杂BI任务处理能力。 - 单元格上下文管理:基于变量引用构建笔记本单元格依赖的DAG,通过DAG确定相关单元格并检索信息,为代理提供必要上下文,降低令牌成本。 4. 实验评估:在多个公共研究基准和腾讯专有业务数据集上进行实验。结果表明DataLab在多个BI任务上优于大多数基线模型,对不同LLM具有鲁棒性,各模块有效提升了性能和效率。 5. 相关工作与结论:对比其他BI平台和LLM - 基于数据分析方法,DataLab支持更全面的BI阶段和角色。该平台能有效整合LLM辅助与用户定制,适用于实际BI场景。
DataLab: A Unified Platform for LLM-Powered Business Intelligence