数据学院数据智能团队获国际顶级会议The Web Conference 2025最佳学生论文奖

发布时间:2025-05-15浏览量:320





2025年4月28日至5月2日,国际顶级会议The Web Conference 2025(WWW 2025)在澳大利亚悉尼召开,我院陈岑副教授实验室与阿里巴巴合作的论文《Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions》荣获唯一最佳学生论文奖(Best Student Paper Award),这是中国学术研究机构第3次获得该奖项。论文通讯作者为陈岑副教授,学生作者包括其实验室的硕士研究生李志文(研二)、陈碟(研二)和博士研究生范洺源(博二),王延昊副教授参与了本工作的联合指导。WWW是互联网、人工智能和交叉综合领域最具影响力的学术会议之一,同时也是中国计算机学会(CCF)推荐A类国际学术会议,至2025年已成功举办34届。该会议每年汇聚互联网、人工智能、数据挖掘和信息检索等领域全球顶尖学者与业界专家,围绕前沿理论与前瞻技术展开深入交流与思想碰撞。今年Research Track共计投稿2062篇,其中409篇论文被录用,录用率约为19.8%。在本届大会上,获奖论文从众多高质量投稿中脱颖而出,获得同行一致认可,展现了很强的学术价值和应用潜力。






论文简介






Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions

李志文、陈碟、范洺源、陈岑、李雅亮、王延昊、周文猛

合作单位:华东师范大学、阿里巴巴

论文链接:https://dl.acm.org/doi/10.1145/3696410.3714912


近年来,文生图扩散模型(如Stable Diffusion、DALL·E等)因其生成高质量图像的能力而被广泛应用于艺术创作、广告设计等领域。然而,这类模型存在两大核心安全与伦理问题:(1)有害内容生成:模型易被诱导生成NSFW(Not Safe for Work)内容,例如包含色情、暴力和歧视等不适宜元素的图片;(2)社会偏见:模型生成内容可能展现或放大对特定性别、种族等人群的固有偏见,例如将某些职业与性别、种族关联。这些潜在风险极大限制了其实际应用。尽管已有研究尝试通过安全过滤器或模型微调等方法解决这些问题,但其普遍存在性能损耗大、依赖特定词汇(例如仅过滤“nudity”或近义词却无法过滤隐晦表达)和针对对抗样本的健壮性差等缺陷。本论文提出了一种新的解决方案:利用扩散模型自身的知识学习文本嵌入空间中的安全语义方向,将提示词的文本嵌入约束在安全语义区域内,从而显著减少不适宜内容生成并缓解其潜在社会偏见。该方法具有较好的通用性和可迁移性,不限定于特定的扩散模型架构,也可与各种微调方法同时使用,在不同扩散模型安全和公平生成场景都有着广泛的应用潜力,为文生图模型安全部署提供了有效解决方案。





方法总体框架图





团队介绍





近几年来,陈岑副教授实验室一直秉承学院“应用驱动创新,开放成就创新”理念,积极推动学术研究与产学研深度融合。实验室主要研究方向涵盖隐私计算与AI安全、生成式人工智能(AIGC)等前沿领域,最近的研究主要关注AIGC及其隐私安全问题。相关学术成果在国际顶级会议和期刊上发表论80余篇,曾荣获最佳学生论文奖一次,最佳论文提名奖两次。同时,实验室与阿里巴巴、蚂蚁集团等互联网公司的核心算法研发团队保持密切稳定的合作关系,共同培养兼具学术与工程实践能力的人才。本次获奖论文属于与阿里巴巴通义实验室合作的高校合作项目《智能、可控、安全的长视频生成技术研究》的论文成果之一。该项目成果还包括共同开源的视频生成工具DiffSynth Studio,在GitHub平台获得8600stars,多次登上GitHub Trending排行榜第一,在开源社区中引发了广泛关注。



来源 | 获奖团队

排版 | 刘子玉

审核 | 钱卫宁