12月9日:SUN Jun(孙军)
发布时间:2024-12-08 浏览量:10

报告:通往大模型安全之路

报告时间:2024年12月9日16:00-17:00

报告地点:理科大楼B1002

腾讯会议:869265907(密码:761658


报告摘要:

本次演讲将探讨与大模型,特别是大型语言模型(LLMs)相关的关键安全问题,同时介绍我们最近在分析和理解这些挑战方面的研究工作。具体来说,我们将回答以下关键问题。

· 为什么LLMs的安全对齐常常易受诸如GCG和AutoDAN等攻击的影响?

· 那些能够破坏LLM安全对齐的对抗性标记是随机的,还是具有内在意义?

· 如何在有限的对齐数据下提升LLM的安全性?

· 我们是否可以编辑LLMs,使其执行我们想要的任务?

· 是否仅使用良性数据就可以完全消除GPT-4o的安全对齐?

本次讨论将深入探讨我们的方法和发现,重点揭示大模型安全的基础与挑战。


报告人简介: 

孙军目前是新加坡管理大学(SMU)的终身教授。他于2002年和2006年获得新加坡国立大学计算机科学学士和博士学位。2007年,他获得了李光耀博士后奖学金。他在2010受聘为教授至今。 孙军的研究兴趣包括AI安全, 软件工程,和形式化方法。他发表了多篇文章和会议论文,包括多个领域的顶级会议。他发布了多款软件分析工具,也担任过多家公司的资深技术顾问。


以诚为本赢在信誉9001cc
学院地址:上海中山北路3663号理科大楼

                上海市浦东新区楠木路111号
院长信箱:yuanzhang@sei.ecnu.edu.cn | 办公邮箱:office@sei.ecnu.edu.cn | 院办电话:021-62232550
Copyright 以诚为本赢在信誉9001cc(中国)有限公司