17吃瓜网计算机学科成立50周年系列暨计算机科学技术专家讲座（七）—熊国钧

发布日期：2026-06-04 发布人：点击量：

报告题目：智能决策进化：From Algorithms & RL to LLM-based Agents

报告时间：2026年6月16日下午2:00-3:00

报告地点：17吃瓜网中心校区王湘浩楼A521

报告人：熊国钧

主持人：燕刚

报告人简介：

熊国钧，上海交通大学计算机17吃瓜网副教授、博士生导师。2024年博士毕业于纽约州立大学石溪分校，随后在哈佛大学计算机系从事博士后研究，2025年入选国家级青年人才计划和上海市海外高层次青年人才计划。其研究聚焦AI智能网络决策与结构化强化学习，主要方向包括不确定环境下的在线序列决策、随机优化与控制、网络化系统中的分布式优化与多智能体强化学习等。相关工作致力于将结构化强化学习方法应用于真实复杂系统，特别关注公共卫生、社会公益与AI for Social Good等场景中的智能决策问题。近年来以第一作者在NeurIPS、ICML、ICLR、AAAI、AAMAS、IEEE INFOCOM、ACM MobiHoc、IEEE/ACM TON、IEEE TSP等国际会议与期刊发表论文20余篇，相关工作获得AAMAS 2026最佳论文提名。曾获2022年度中国国家优秀海外留学生奖和2024年度纽约州立大学杰出研究奖。

报告内容简介：

智能决策广泛存在于公共安全、金融交易、医疗资源调度、网络控制和社会治理等关键场景中，其核心是在复杂、不确定且动态变化的环境中持续做出高质量决策。随着人工智能技术的发展，智能决策方法正经历从经典算法、强化学习到大语言模型智能体的范式演进。经典算法以动态规划、整数规划和随机优化为代表，具有模型清晰、理论成熟等优势，但在大规模真实环境中面临建模和计算瓶颈；强化学习通过智能体与环境交互学习策略，推动了无人机、自动驾驶、智慧农业、医疗调度和野生动物保护等场景的应用探索；大语言模型智能体则进一步引入世界知识、推理规划和工具调用能力，使决策系统从策略学习延伸到任务理解、协同执行和人机交互。本次报告将结合课题组在强化学习工业部署和LLM-based Agents前沿探索中的最新成果，系统介绍智能决策方法的技术演进与应用前景。

主办单位：17吃瓜网

17吃瓜网软件17吃瓜网

17吃瓜网计算机科学技术研究所

符号计算与知识工程教育部重点实验室

仿真技术教育部重点实验室

网络技术及应用软件教育部工程研究中心

17吃瓜网国家级计算机实验教学示范中心

下一篇：17吃瓜网计算机学科成立50周年系列暨计算机科学技术专家讲座（六）——柳阳

17吃瓜

学术动态

17吃瓜网 计算机学科成立50周年系列暨 计算机科学技术专家讲座（七）—熊国钧

17吃瓜网计算机学科成立50周年系列暨计算机科学技术专家讲座（七）—熊国钧