被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

谢赛宁十年前被NeurIPS(当时还叫NIPS)拒收的论文,刚在今年获得了AISTATS 2025年度时间检验奖。

这篇论文就是《Deeply-Supervised Nets》(DSN,深度监督网络),2014年9月挂上arXiv。

时间匆匆,十一年过去,属于是真·时间检验了。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

它提出的中间层监督思想被谢赛宁后续作品REPA(Representation Alignment)和U-REPA(U-Net Representation Alignment)等继承并发展,展示出从单一模型优化到跨模型知识迁移的演进。

而后两者在深度学习、扩散模型深化发展的这两年间,影响颇深。

“恭喜!”“当之无愧!”

AISTATS官宣其获奖的推文下面,业界大佬齐聚,一片祝贺之声。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

当初,这篇论文被AISTATS接收。

然而在谢赛宁本人的转发推文中,我们知道另一重内幕——

这篇论文最初投稿给NeurIPS。虽然拿下8/8/7高分,但仍然被该顶会拒绝了。

他表示:

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

十一年前,拿到8/8/7高分却被拒

补充下背景信息——

《Deeply-Supervised Nets》是谢赛宁攻读博士学位期间提交的第一篇论文。

他是共同一作之一,另一位共同一作是现在的谷歌研究科学家Chen-Yu Lee

该项目通讯作者是清华校友、马尔奖获得者,现UCSD的计算机科学与工程系教授屠卓文。他也是谢赛宁和Chen-Yu Lee的博导。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

这篇论文提出了DSN(深度监督网络)方法,旨在解决深度学习中隐藏层特征学习的问题,提升分类性能。

当时的深度学习已经开始再次发展,在图像分类和语音识别领域卓有成效。

不过,它仍然面临诸多问题,比如隐藏层特征的透明度和判别力降低、梯度消失或爆炸导致训练困难、对算法行为缺乏数学理解、依赖大量训练数据以及训练时手动调参复杂等等。

研究团队基于观察发现,在高判别力特征上训练的分类器性能更好。

通过在网络各隐藏层利用特征质量反馈,直接影响权重更新,能让网络更快学习到好的特征,减轻梯度问题,且不影响整体网络性能。

于是,团队提出DSN,通过中间层监督机制解决CNN(传统卷积神经网络)的三大痛点:

  • 梯度消失
  • 在隐藏层添加辅助分类器(”companion” objective),通过逐层反向传播增强梯度信号。
  • 特征鲁棒性
  • 强制中间层直接参与最终分类任务,使浅层特征更具判别性(如在AlexNet中,第3层特征分类准确率提升18%)
  • 训练效率
  • 实验证明在CIFAR-10数据集上,DSN使ResNet-50的训练收敛速度加快30%,Top-1准确率提升2.1%。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

时至今日,该成果已成为计算机视觉领域的经典方法,成为首个在生成式AI领域产生跨代影响的监督学习框架。

截至本文推送,这篇论文的谷歌学术被引量超过3000次

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

那,为什么当时的NeurIPS没有接收这篇论文呢?

或许是评审认为该工作是对传统CNN的增量改进而非颠覆性创新,而当时的NeurIPS更关注理论突破或新型架构。

总之,虽然评审给这篇论文打出了8/8/7的高分,但还是被无情拒收了。

坚持不懈的表现不仅仅是“再试一次”

现在,当初接收DSN的AISTATS,又给予了这个项目时间检验奖以嘉奖。

众所周知,计算机会议的时间检验奖通常要求论文在获奖的10年前发表,高被引是核心门槛。

而更为重要的是,时间检验奖获奖项目需被同行评价为开创性工作(seminal work),或理论创新,或有应用价值,成为后续研究的基础范式。

就像GAN启发了生成式模型,Seq2Seq推动机器翻译的发展。

至此,谢赛宁在相关推文中写下,“也许现在我可以终于释怀

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

。”

(愿他真的从此释怀~)

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

当然,谢赛宁还毫不吝啬地分享了更多感慨与经验总结。

“我不会把学术会议比做大乐透,但坚持不懈确实能给学术生涯带来很大的帮助。”谢赛写对着所有学子们喊话,“同学们:如果你们在看到最近的论文评审结果后感到灰心丧气,又正为下一篇文章做准备的话,我希望这(DSN获时间检验奖)能给你们一点小小的提醒,继续前行吧。”

后来他又对自己的感悟进行了补充说明——

坚持不懈并不仅仅是说“继续努力”或者“再试一次”,它需要一个强大的支持系统和具体的实践指导。

“你永远不应该独自前行。”谢赛宁在最后写道。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

DSN的共一Chen-Yu Lee也很激动地在上发声。

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

One More Thing

Anyway,对大多数相关从业者来说,论文被顶会接收是一种认可,一种荣誉。

但被顶会拒收,并不意味着对这个项目的全盘否定。

不知道大家还记不记得大明湖畔被ICLR 2013拒稿的Word2vec(后转投NeurIPS并获接收,2023年获时间检验奖),以及被ICLR 2024拒稿的Mamba?

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

谢赛宁的推文评论区,也挖掘出了更多的类似故事。

浙大校友、哥伦比亚大学计算机科学系副教授俞舟(zhou Yu)就留言说,她的团队在2019年获ACL最佳论文提名的项目也在首投时被拒稿。

听了赛宁的分享,她表示,现在有另一个很好的例子可以用来鼓励低年级的同学们了~

参考链接:
[1]https://x.com/sainingxie/status/1919423231687000493
[2]https://x.com/sainingxie/status/1919022082391671195
[3]https://arxiv.org/abs/1409.5185
[4]https://scholar.google.com/citations?user=Y2GtJkAAAAAJ&hl=en

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/11499.html

(0)
人脑网的头像人脑网
上一篇 2025年5月6日 下午3:16
下一篇 2025年5月6日 下午3:18

相关推荐

  • GPT-4o医学知识覆盖率仅55%?大模型医疗能力“体检报告”来了

    医疗大模型知识覆盖度首次被精准量化! 在医疗领域,大语言模型(LLM)的潜力令人振奋,但其知识储备是否足够可靠?腾讯优图实验室天衍研究中心的最新研究给出了答案。 他们提出的MedKGEval框架,首次通过医疗知识图谱(KG)的多层级评估,系统揭示了GPT-4o等主流模型的医学知识覆盖度。 该研究已被WWW 2025会议Web4Good Track录用为口头报…

    2025年4月30日
    1100
  • 所有AI工具共享记忆!MCP协议无需云端,Cursor、Claude都能用

    聊完就忘?当下多数AI助手和开发工具各自独立运行,会话结束上下文即消失,严重影响了使用体验和效率。 OpenMemory MCP,一款可以解决AI工具记忆痛点,并且实现不同工具之间共享上下文信息的开源工具,他来了! 比如,你可以通过OpenMemory MCP用Claude规划路线图,但用Cursor执行任务,两个工具之间可以共享上下文信息,让数据得到延续。…

    2025年5月14日
    700
  • 微软1bit LLM新研究:原生4bit激活值量化

    微软又有“1 bit LLM”新成果了—— 发布BitNet v2框架,为1 bit LLM实现了原生4 bit激活值量化,由此可充分利用新一代GPU(如GB200)对4 bit计算的原生支持能力。 同时减少内存带宽&提升计算效率 之前,微软持续研究BitNet b1.58,把LLM的权重量化到1.58-bit,显着降低延迟、内存占用等推理成本。 然…

    2025年4月29日
    2900
  • 生数科技廖谦:多模态技术定将催生全新内容平台,实现完全个性化

    多模态生成技术持续突破内容创作的边界。 生数作为多模态领域的明星玩家,所提供的技术正推动AI视频创作进入系统性可用新阶段。 在本次第三届AIGC产业峰会上,生数科技产品副总裁、Vidu产品负责人廖谦分享了这样的观点: 为了完整体现廖谦的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 中国AIGC产业峰会是由量子位主办的A…

    2025年4月18日
    2200
  • 医疗界迎来重磅大模型,还有10多个场景的智能体!

    在人工智能技术重塑全球产业格局的浪潮中,医疗健康领域正迎来一场深刻的变革。4月9日,在2025中国国际医疗器械展览会(CMEF)同期,由联影举办的uAInnovation2025创新大会圆满落幕,来自产学研医各界嘉宾代表齐聚一堂,围绕数智涌现的未来医疗生态蓝图共话时代新篇。复旦大学附属中山医院副院长、党委书记顾建英,河南省人民医院副院长王梅云,中山大学肿瘤防…

    2025年4月11日
    2600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信