Gorilla是一个与大量API相连的大语言模型相关项目,主要内容如下:
项目概述
- 团队与联系:由UC Berkeley的Shishir G. Patil、Tianjun Zhang等开发,联系邮箱为sgp@berkeley.edu、tianjunz@berkeley.edu。
- 应用场景:已在Netflix得到应用,涉及系统和算法用于整合大语言模型与应用、工具和服务。
Gorilla OpenFunctions
- 功能特点
- 在OpenFunctions - v2中,模型原生支持并行函数(一次生成多个函数)和多个函数(选择一个或多个函数),还首次支持Java/REST/Python API及扩展数据类型。
- 模型表现与资源
- 在函数调用能力方面,在伯克利函数调用排行榜(BFCL)中表现出色,其6.91B模型(gorilla - llm/gorilla - openfunctions - v2在HuggingFace上)综合准确率达81.12%,成本为1.7美元,各项指标如延迟、不同类型函数调用评估等表现可与其他知名模型对比(如GPT - 4、Claude - 3等)。
- 可在线试用模型(Gorilla OpenFunctions - v2 Web Demo)、查看项目代码(GitHub Code),BFCL相关资源包括排行榜网站(Live Leaderboard)、评估数据集(HuggingFace Dataset)、Gradio演示(HuggingFace Space)及可复现性代码(Github Code)。
RAFT(Retriever - Aware FineTuning for domain - specific RAG)
- 原理与目标:将大语言模型类比为学生在开卷(RAG)和闭卷考试(SFT)中的情况,提出一种更好的针对特定领域RAG挑战微调基础大语言模型的方法,使模型能更好地利用特定文档集。
- 资源链接:论文链接为https://arxiv.org/abs/2403.10131,可复现性代码在Github。
Gorilla Execution Engine (GoEX)
- 功能与特点:是一个用于执行大语言模型生成动作(如代码、API调用等)的运行时环境,具有“事后验证”功能,通过“撤销”和“损害限制”抽象来管理意外动作和风险,为完全自主的大语言模型代理铺平道路,增强应用与服务间人机交互(人在环外)。
- 资源链接:论文链接为https://arxiv.org/abs/2404.06921,可试用Web Demo,可复现性代码在GitHub。
其他信息
- 新闻动态
- 发布了GoEx相关内容,包括其风险缓解功能及相关博客和论文。
- 介绍了伯克利函数调用排行榜及Gorilla OpenFunctions v2的新成果(达到开源大语言模型新的SoTA,与GPT - 4相当且支持更多语言),还有如何在60秒内试用Gorilla(无需注册和安装,通过Colab),强调其Apache 2.0许可允许商业使用。
- 交互方式
- 提供了Gorilla支持的CLI(通过
pip install gorilla - cli
开始使用)和Spotlight Search(需注册Gorilla - Spotlight)。 - 愿景:以用户为中心,使用户能通过大语言模型与广泛服务交互,是一个开源的先进大语言模型且可调用API与服务交互。同时提供了引用方式。