这篇论文《NEXUS: A LIGHTWEIGHT AND SCALABLE MULTI-AGENT FRAMEWORK FOR COMPLEX TASKS AUTOMATION》由Humza Sami等人撰写。论文提出了Nexus,一种轻量级且可扩展的多智能体框架,旨在简化基于大语言模型(LLM)的多智能体系统(MAS)的构建与管理,通过实验验证了其在多个领域的卓越性能,为解决复杂实际问题提供了有效途径。
- 背景与相关工作:多智能体系统(MAS)自20世纪80年代出现,从基于启发式的传统方法逐渐发展到结合大语言模型(LLM)的新阶段。LLM的融入使MAS具备更复杂的推理、自然语言通信和高级规划能力。ReAct范式将推理与行动分离,增强了智能体决策过程的透明度和适应性。现有MAS框架存在依赖单智能体范式、编码要求高或缺乏透明集成路径等问题。
- Nexus框架设计:采用模块化分层架构,包含根监督器、任务监督器和工作智能体,通过分层执行图实现高效任务分配。引入三个主要交互循环,分别为用户 - 监督器交互、监督器 - 智能体协调和智能体内操作循环,赋予框架可扩展性、模块化和鲁棒性。可通过pip安装,提供Python代码和YAML文件两种方式构建MAS架构,降低开发复杂度。
- 实验评估:在编码任务(HumanEval和VerilogEval-Human数据集)、数学推理任务(MATH数据集)和电子设计自动化(EDA)的时序收敛任务(VTR基准套件)三个领域进行实验。结果表明,Nexus驱动的架构在各领域均取得了领先性能,如在编码任务中超越了o3-mini和DeepSeek-R1等模型;在数学问题解决上,成功解决了所有选定的难题;在EDA任务中,实现了平均近30%的功耗降低。
- 研究结论:Nexus框架有效解决了MAS开发中的关键挑战,通过灵活的多监督器层次结构、简化的YAML设计和开源模块化设计,实现了跨领域的高效自动化。其性能优于现有模型,为利用大语言模型解决复杂现实问题开辟了新途径。