阿里云联合清华AIR启动国内首个“基于大模型的可进化智能体”研究
近日,阿里云与清华大学智能产业研究院(AIR)共同启动“基于大模型的可进化智能体”的研究,探索模型智能体(AI Agent)共性基础技术,提升大模型多语言、多模态基础能力。这是国内首个关于可进化智能体系统化产学研融合的专项研究,也是人工智能模型能力走向持续进化的一个重要里程碑。 图注:清华大学智能产业研究院(AIR)执行院长刘洋教授与阿里巴巴通义实验室自然语言智能负责人黄非博士签约、AIR院长张亚勤与阿里云CTO周靖人出席签约仪式 智能体(AI Agent)是帮助AI与外界进行交互、感知外部信息、对外提供服务的部分程序或者运行程序的某个实际物体,如智能机器人或智能传感器等。AI Agent可以形成自动化任务、提供个性化服务、辅助决策,帮助人类将AI模型能力转化为解决实际问题的能力。比如语音助手siri,网络助手Google Assistant等。 随着大模型能力的革命性突破, AI Agent将会在更多领域发挥出重要作用。未来三年,阿里云和清华AIR将共同围绕“可进化智能体持续提升AI模型能力”为重要方向,探索大模型智能体共性基础技术,如面向大模型智能体的学习机制、单智能体基础素质提升等;探索基于大模型智能体的创新场景,积累大模型智能体关键技术。 中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤表示,AIR致力于开展有实际效用、方向明确的科研工作。他表示,人工智能的发展是开发(Exploitation)与探索(Exploration)的相互促进与平衡,Agent的发展有助于通过Exploration的方式提升模型能力,长远来看还可以把不一样的智能体组织起来,解决复杂问题,持续提升基础模型的能力。 目前,阿里云在魔搭开源社区的ModelScope-Agent开源智能体框架,帮助广大开发者能更轻松地搭建自己的专属Agent,通过低代码调用API创建一个炫酷功能的Agent,同时API快速注册成tool也更方便开发者调用。阿里云CTO周靖人表示,AI Agent是令人兴奋的研究方向,它使得模型像人一样具有感知能力并持续发展,阿里云愿意发挥自身模型建设的基础优势,与清华智能产业研究院(AIR)通力合作,推动领先的科技创新与转化。 据悉,阿里云近期推出720亿参数模型Qwen-72B、 18亿参数开源模型Qwen-1.8B,以及开源音频模型Qwen-Audio。这些不同规格、不同应用场景的基础模型,都为通过AI Agent持续提升模型能力提供了良好的基础条件与广阔的试验田。 |