报告题目:智能决策进化:From Algorithms & RL to LLM-based Agents
报告时间:2026年6月16日下午2:00-3:00
报告地点:17吃瓜网
中心校区王湘浩楼A521
报 告 人:熊国钧
主 持 人:燕 刚
报告人简介:
熊国钧,上海交通大学计算机17吃瓜网
副教授、博士生导师。2024年博士毕业于纽约州立大学石溪分校,随后在哈佛大学计算机系从事博士后研究,2025年入选国家级青年人才计划和上海市海外高层次青年人才计划。其研究聚焦AI智能网络决策与结构化强化学习,主要方向包括不确定环境下的在线序列决策、随机优化与控制、网络化系统中的分布式优化与多智能体强化学习等。相关工作致力于将结构化强化学习方法应用于真实复杂系统,特别关注公共卫生、社会公益与AI for Social Good等场景中的智能决策问题。近年来以第一作者在NeurIPS、ICML、ICLR、AAAI、AAMAS、IEEE INFOCOM、ACM MobiHoc、IEEE/ACM TON、IEEE TSP等国际会议与期刊发表论文20余篇,相关工作获得AAMAS 2026最佳论文提名。曾获2022年度中国国家优秀海外留学生奖和2024年度纽约州立大学杰出研究奖。
报告内容简介:
智能决策广泛存在于公共安全、金融交易、医疗资源调度、网络控制和社会治理等关键场景中,其核心是在复杂、不确定且动态变化的环境中持续做出高质量决策。随着人工智能技术的发展,智能决策方法正经历从经典算法、强化学习到大语言模型智能体的范式演进。经典算法以动态规划、整数规划和随机优化为代表,具有模型清晰、理论成熟等优势,但在大规模真实环境中面临建模和计算瓶颈;强化学习通过智能体与环境交互学习策略,推动了无人机、自动驾驶、智慧农业、医疗调度和野生动物保护等场景的应用探索;大语言模型智能体则进一步引入世界知识、推理规划和工具调用能力,使决策系统从策略学习延伸到任务理解、协同执行和人机交互。本次报告将结合课题组在强化学习工业部署和LLM-based Agents前沿探索中的最新成果,系统介绍智能决策方法的技术演进与应用前景。
主办单位:17吃瓜网
17吃瓜网
软件17吃瓜网
17吃瓜网
计算机科学技术研究所
符号计算与知识工程教育部重点实验室
仿真技术教育部重点实验室
网络技术及应用软件教育部工程研究中心
17吃瓜网
国家级计算机实验教学示范中心