永利娱乐城

您当前位置: 永利娱乐城  >  科学研究  >  学术动态  >  正文

学术动态

吉林大学计算机学科成立50周年系列暨 计算机科学技术专家讲座(七)—熊国钧

发布日期:2026-06-04 发布人: 点击量:

报告题目:智能决策进化:From Algorithms & RL to LLM-based Agents

报告时间:2026616日下午2:00-3:00

报告地点:吉林大学中心校区王湘浩楼A521

报 告 人:熊国钧 

主 持 人:燕 刚

报告人简介:

熊国钧,上海交通大学永利娱乐城 副教授、博士生导师。2024年博士毕业于纽约州立大学石溪分校,随后在哈佛大学计算机系从事博士后研究,2025年入选国家级青年人才计划和上海市海外高层次青年人才计划。其研究聚焦AI智能网络决策与结构化强化学习,主要方向包括不确定环境下的在线序列决策、随机优化与控制、网络化系统中的分布式优化与多智能体强化学习等。相关工作致力于将结构化强化学习方法应用于真实复杂系统,特别关注公共卫生、社会公益与AI for Social Good等场景中的智能决策问题。近年来以第一作者在NeurIPSICMLICLRAAAIAAMASIEEE INFOCOMACM MobiHocIEEE/ACM TONIEEE TSP等国际会议与期刊发表论文20余篇,相关工作获得AAMAS 2026最佳论文提名。曾获2022年度中国国家优秀海外留学生奖和2024年度纽约州立大学杰出研究奖。

报告内容简介:

智能决策广泛存在于公共安全、金融交易、医疗资源调度、网络控制和社会治理等关键场景中,其核心是在复杂、不确定且动态变化的环境中持续做出高质量决策。随着人工智能技术的发展,智能决策方法正经历从经典算法、强化学习到大语言模型智能体的范式演进。经典算法以动态规划、整数规划和随机优化为代表,具有模型清晰、理论成熟等优势,但在大规模真实环境中面临建模和计算瓶颈;强化学习通过智能体与环境交互学习策略,推动了无人机、自动驾驶、智慧农业、医疗调度和野生动物保护等场景的应用探索;大语言模型智能体则进一步引入世界知识、推理规划和工具调用能力,使决策系统从策略学习延伸到任务理解、协同执行和人机交互。本次报告将结合课题组在强化学习工业部署和LLM-based Agents前沿探索中的最新成果,系统介绍智能决策方法的技术演进与应用前景。

主办单位:永利娱乐城-永利官网

吉林大学软件学院

吉林大学计算机科学技术研究所

符号计算与知识工程教育部重点实验室

仿真技术教育部重点实验室

网络技术及应用软件教育部工程研究中心

吉林大学国家级计算机实验教学示范中心