昆仑万维2050研究院安波教授受邀在IJCAI 2024发表主旨演讲

2024-10-10 11:16:17 围观 : 295 次 0 评论

近期,人工智能国际顶级会议2024 International Joint Conference on Artificial Intelligence(IJCAI 2024 在韩国济州岛顺利举行。

在IJCAI 2024上,昆仑万维2050研究院安波教授受邀进行了主旨为《From Algorithmic and RL-based to LLM-powered Agents》的Keynote演讲。安波教授同时是南洋理工大学校长讲席教授、人工智能研究院联席院长、人工智能系主任。

安波教授在IJCAI 2024上进行主旨演讲

作为人工智能领域的国际顶级会议,IJCAI 2024吸引了来自全球近三千名研究人员、工程师、行业领袖等的参与,是目前该会历史上规模最大的一届,会议主旨涵盖了人工智能与相关领域的众多研究方向。作为近年来的热点话题之一,大模型相关的研究也是IJCAI 2024最热、最活跃的领域之一。Agents作为当前大模型落地的未来趋势,被认为是解决各种复杂现实问题,迈向通用人工智能(AGI)的潜在路线之一。

围绕Agents这一主旨,安波教授回顾了其近二十年来在这一方向上不断深耕所取得的一些进展,总结了从中获得的经验教训,并展望了这一主旨未来的潜在发展方向。

安波教授在IJCAI 2024上进行主旨演讲

安波教授的分享包括三个部分:从早期基于算法的Agents,到近年来基于强化学习的Agents,再到最新的由大语言模型驱动的AI Agents。它们分别从问题的复杂性、算法的有效性、Agents的泛化性等角度逐层递进。

首先,早期基于算法的Agents的研究利用各种各样的优化技术(Optimization Techniques)来解决小规模问题。其中,研究的问题主要集中在安全博弈(Security Games)和追逃博弈(Pursuit-Evasion Games),取得了一系列的研究成果,特别是在安全博弈领域,其研发的算法被部署到现实世界的应用场景中,取得了显著的安全防御效果。

安波教授团队在Security Games领域的研究概览

然而,基于算法的Agents存在一定的局限性,如难以扩展到大规模的问题。相较之下,基于强化学习(Reinforcement Learning,RL)的Agents在解决长远规划(Long-term Planning)及大规模问题上具有显著优势在这一方向上,安波教授分享了自2017年以来取得的研究进展,包括研发了一系列基于(深度)强化学习的算法,用于解决大规模追逃博弈问题;为工业界各种应用场景开发和部署了一系列强化学习算法,包括欺诈检测、推荐系统、量化交易(Quantitative Trading)等。

尽管基于RL的Agents已经在某些领域取得了一定的成功,其仍然面临着许多挑战,包括样本效率低(Sample-inefficient)、只适用于特定任务(Task-specific)、难以解决具有长程规划(Long-term Planning)和稀疏奖励(Sparse Reward)的任务等。

相比之下,由大语言模型(Large Language Models,LLMs)驱动的Agents(LLM-powered Agents)有其独特的优势,如丰富的、关于现实世界的先验知识(Word Knowledge)等。基于此,从去年(2023)开始,安波教授团队联合昆仑天工智能团队(Skywork AI),在LLM-powered Agents这一领域进行布局,在大模型的基础研究和应用上,均取得了不同程度的进展。

安波教授团队联合天工智能团队提出的TWOSOME框架,其利用强化学习(RL)来使LLMs与环境对齐,使得LLMs能够准确高效地与环境进行动态交互。用一句最简单的话来总结TWOSOME框架的基本思想,那就是“只有先合法,动作才会合理”。

安波教授团队联合天工智能团队提出的TWOSOME框架

另一项备受瞩目的关于LLMs的基础研究《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning》。这项工作对当前LLM的多步推理所面临的挑战进行了深入分析,提出将搜索算法(Search)如A* search,整合到LLM的推理过程中,极大地提升当前LLM多步推理的性能。

安波教授在IJCAI 2024主旨演讲中讲解Q*

在大模型的应用上,安波教授团队研发了一系列LLM-powered Agents,包括用于计算机控制(Computer Control)的Synapse、AgentStudio和Cradle,用于金融科技(FinTech)的FinAgent等。Cradle作为一个通用的AI Agent,无需依赖训练便能像人一样通过控制键盘和鼠标,实现任意开闭源软件的交互。Cradle不仅能够玩各种各样高难度的游戏如《荒野大镖客2》、《星露谷物语》、《城市天际线》、《当铺人生2》等,还能完成各种日常上网操作如浏览网页、发推特、下载paper、在美图秀秀里进行修图、在剪映里剪辑视频等。这些能力,体现了Cradle作为一个全能AI Agent的潜力。

安波教授在IJCAI 2024主旨演讲中讲解Cradle

此外,安波教授对LLM-powered Agents的未来研究方向进行了展望,包括:如何将LLM-powered Agents用于其他自然科学领域(Science),如药物和材料发现等;在未来的电子和物理世界中如何利用LLM-powered Agents高效地控制所有的设备;如何规范LLM-powered Agents的研究,确保其安全性和可控性,不会对人类社会造成损害;研发决策基座模型(Decision Foundation Models)等。

在演讲的最后,安波教授指出,基于算法的Agents、基于RL的Agents,和LLM-powered Agents这三种范式各有千秋,不存在某一种范式可以一劳永逸地解决现实世界中的所有问题。在未来的研究中,研究人员应该结合这三种范式,取长补短,研发能够自我提升的通才LLM-powered Agents(Generalist LLM-powered Agents),迈向通用人工智能的终极目标。

安波教授在IJCAI 2024主旨演讲中对Autonomous Agents进行的总结





往期推荐
01
百倍提升7B模型推理能力 昆仑万维携手新加坡南洋理工大学发布Q*算法
02
昆仑万维颜水成受邀出任2024北京智源大会视觉大模型论坛主席
03
昆仑万维颜水成受邀参与2024北京智源大会大模型产业技术论坛分享
04
新加坡电信集团CEO Yuen Kuan Moon等一行到访昆仑万维 
05
昆仑万维宣布天工AI每日活跃用户(DAU)超过100

相关文章

  • @残疾毕业生,人力资源社会保障部启动2024年高校毕业生等青年就业服务攻坚行动
    @残疾毕业生,人力资源社会保障部启动2024年高校毕业生等青年就业服务攻坚行动

    近日,人力资源社会保障部印发通知,部署启动2024年高校毕业生等青年就业服务攻坚行动,于7月至12月,以“助力攻坚 就创青春”为主题,对2024届离校未就业高校毕业生和登记失业青年集中提供政策落实、招聘对接、困难帮扶、能力提升、权益维护等不...

    2025-07-28 19:46:26 求职
  • 最新UCAS 25Fall英本数据解读,高考后还能补录上岸!
    最新UCAS 25Fall英本数据解读,高考后还能补录上岸!

    高考落幕,分数尘埃落定,有人选择国内升学,也有人放弃国内院校转向留学赛道。其实,中国高考成绩的国际认可度正飞速攀升,逐渐成为迈向海外名校的“敲门砖”!英国伦敦大学金史密斯学院于7月18日开启补录通道,明确表示接受中国高考成绩申请大一课程。高...

    2025-07-27 16:01:50 高考RoSSo艺术留学
  • 一建报名!又有6地开启报名系统,速度报名!
    一建报名!又有6地开启报名系统,速度报名!

    大家好,我是嗨学君。近期25年一建报考入口已经开通,今天又有6个地区报名入口开启,咱们的考生可以抓紧时间报名了。(点击图片可放大观看△)新考生必看!请点击→2025年最新一建报考(详细版)↓↓新增两地报考公告如下↓↓北  京通知重...

    2025-07-23 12:02:27 嗨学
  • 中级注册安全工程师证书难考吗?
    中级注册安全工程师证书难考吗?

    近年来,中级注册安全师考试的热度如同夏日的温度持续攀升,成为了众多追求职业发展与安全领域深耕的考生们关注的焦点。不少粉丝纷纷向嗨学君发来“灵魂拷问”:这证难啃吗?和一建相比如何?若决心今年应战,此刻学习是否还来得及?今天,就让我们一起聊聊这...

    2025-07-21 11:05:19 嗨学
  • 一建报名“属地化”改革 | 跨省报考,证书将作废!
    一建报名“属地化”改革 | 跨省报考,证书将作废!

    大家好,我是嗨学君这几天,一级建造师考试报名已经如火如荼地开展啦,就在你正激动地准备报名的同时,有一个重要的信息你绝对不能忽视——那就是越来越多的省份开始实行严格的属地化管理措施啦!属地化管理,你了解多少?属地化管理,简而言之,就是要求考生...

    2025-07-21 11:04:19 嗨学
  • B证是啥?二建带B和不带B的区别~~
    B证是啥?二建带B和不带B的区别~~

    大家好,我是嗨学君最近,许多考生向我咨询了关于建造师的一系列问题。为了让大家更加清晰地了解这些盲区,今天我们就来统一回答一下吧!二建B证和二建证书有什么区别?二建B证指的是同时持有二级建造师证书和安全员B证。根据相关法规,二级建造师担任项目...

    2025-07-21 11:01:30 嗨学
  • 必看!一建学霸冲刺秘籍!学会真的会涨分~
    必看!一建学霸冲刺秘籍!学会真的会涨分~

    距离一建考试还有一周的时间,很多考生都会感到不同程度的焦虑情绪,这是非常正常的心理反应。了解焦虑原因,快速调整,保持好的心态,对于考试提分很有帮助。Q:考前为什么会焦虑?1、总感觉以前学的知识突然忘记了。有很多考生在考前刷题时,发现自己做题...

    2025-07-21 10:55:26 嗨学
  • 关注!这些地区一建补考通知正式发布!
    关注!这些地区一建补考通知正式发布!

    大家好,我是嗨学君上周,受台风影响,广东湛江、茂名、阳江及海南、广西钦州地区暂停了一级建造师考试。近日,这几个地区已陆续正式发布补考通知!定于9月21日、22日统一考试。补考时间9月21日上午 09:00-11:00   ...

    2025-07-21 10:53:50 嗨学
  • 一建考生们,查分前,这个消息先看看吧……
    一建考生们,查分前,这个消息先看看吧……

    大家好,我是嗨学君!现在11月已经过半,距离一建考试出分越来越近。根据广东人事考试网发布的《2024年度一级建造师职业资格考试报考须知》:五、考试成绩和合格标准(一)考试成绩查询及管理1.考试成绩计划在2024年12月上旬发布,考生可登录中...

    2025-07-21 10:48:43 嗨学
  • 23地一建合格数超11万人,通过率却有所下降?
    23地一建合格数超11万人,通过率却有所下降?

    大家好,我是嗨学君!随着2024年一建成绩公布,截至目前,已有新疆、福建、云南、四川等23地公布了2024年一建考试合格人数,共有110117人合格。△数据来源各地人事考试中心。其他地区公布后,本表格将同步更新。数据中有部分地区还未完成考后...

    2025-07-21 10:46:46 嗨学
发表评论