参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

新架构选择用KAN做3D感知,点云分析有了新SOTA!

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

来自哈尔滨工业大学(深圳)宾夕法尼亚大学的联合团队最近推出了一种基于Kolmogorov-Arnold Networks(KANs)的3D感知解决方案——PointKAN,在处理点云数据的下游任务上展现出巨大的潜力。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA
PointKAN与同类产品的比较

替代传统的MLP方案,PointKAN具有更强的学习复杂几何特征的能力。

此外团队还提出PointKAN-elite版本,使用Efficient-KANs结构,在保持准确率的同时显着降低参数量。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

以下是更多详细内容介绍。

为什么要选择KANs

当前多层感知机(MLPs)凭借其高效的特征学习机制,已成为点云分析的基础架构组件。

然而在处理点云复杂几何结构时,MLP的固定激活函数难以有效捕捉局部几何特征,同时存在参数量冗余大、模型效率低下的问题。

而KANs是以Kolmogorov-Arnold表示定理(KART)作为数学依据的一种新颖的神经网络架构,与多层感知机(MLP)结构的最大区别是KANs使用可学习函数替代固定激活函数

KANs使用一维B样条函数作为基函数通过相加和复合运算实现高维复杂函数,为函数拟合提供了一个灵活且可解释的框架。

目前,KANs已初步应用于计算机视觉和医学成像等领域,展现出了有效性和通用性,但在点云分析领域中基于KANs的模型拥有巨大潜力尚未开发。

因此,探索在点云分析任务中有效整合KANs与现有模型的方法,仍是一个重要且有前景的研究方向。

PointKAN框架解析

PointKAN的整体流程如下图所示。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

相比于MLPs,尽管KANs具有更强的高维函数逼近能力和更高的参数效率,但将其适配到3D点云上并非易事。

一方面,KANs的样条激活函数通过离散节点逼近单变量函数,很难充分捕捉局部点云的几何特征,限制了其学习细节特征的能力。

另一方面,每一维输入的激活函数需要存储多个参数,对于大规模网络,KANs的内存需求可能成为瓶颈,并且KANs中使用的B样条函数对于现代硬件上的并行计算未进行优化,导致推理速度较慢。

为了解决上述问题,研究团队提出了PointKAN,其特点是包含几何仿射模块并行结构的局部特征提取模块,以及KANs的高效版本Efficient-KANs来减少内存占用并加快训练和推理速度。

Geometric Affine Module

为了在后续的局部特征提取阶段能得到更加丰富的信息,在这个模块中包含两个部分Group-NormS-Pool

Group-Norm对分组内特征进行归一化、仿射变换和组中心特征传播,整个过程表达如下:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

S-Pool用于对各组特征进行聚合,作为后续模块的输入,对各组点云进行全局信息的补充,考虑到最大池化会导致信息丢失,而S-Pool则最大限度保留组内各点特征信息,数学形式如下:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

Local Feature Processing

对Geometric Affine Module的两部分输出在Local Feature Progress(LFP)中分别使用KAN Block进行并行处理。

在KAN Block中,团队在KAN Layer 后加上深度卷积(DwConv)操作来协助KANs在高维通道信息上学习到丰富的特征表示,整个过程可以被表示为:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

共享的LFP旨在从分组点云中学习到局部特征,在经过最大池化后与从各组中心点云学习到的全局信息相加,使得各组点云最终输出的聚合特征更加丰富。

Global Feature Processing

Global Feature Progress(GFP)由Residual Point(Resp)Block组成,用于提取深度聚合特征。

由于结构中只包含前馈MLP,使得可以在GFP中添加多个重复Residual Point(Resp)Block,整个模型仍然能高效运行。

总的来说,代替使用复杂的局部几何提取结构,PointKAN的一个阶段由Geometric Affine ModuleLocal Feature ProcessingGlobal Feature Processing三部分组成,通过重复的四个阶段来构造一个层次化处理点云的深度网络。

Efficient-KANs结构

KANs中的激活函数是由B样条函数生成的,而B样条函数需要递归计算,这并不适合现代GPU的并行计算架构。

在参数量和计算效率上,每个输入-输出对都有不同的参数和基函数,那么随着KANs中隐藏层宽度的增加,参数量呈指数增长,这也导致了巨大的计算开销和可扩展性问题。

Efficient-KANs很好的解决了这些问题,首先使用有理函数代替B样条函数作为KANs中的基函数,激活函数如下所示:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

其中的参数通过反向传播进行训练。有理函数计算过程简单,非常适合并行计算,提高了模型的计算效率。

另外Efficient-KANs对输入通道进行分组,在组内进行参数共享,来减少参数量和计算量。

下图展示了Efficient-KANs、原始KANs和标准MLP之间的区别。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

实验结果

分类任务

ModelNet40ScanObjectNN数据集上进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

部分分割任务

ShapeNetPart数据集上进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

小样本学习

ModelNet40数据集上采用“n-way, m-shot”范式进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

实验结果表明,PointKAN以及PointKAN-elite在各个下游任务上相比于基于MLPs的点云分析架构都有出色的表现,特别是在小样本学习任务上,体现了KANs具有极强的泛化能力和知识迁移能力,更重要的是参数量和FLOPs都有明显的下降。

此外消融实验如下图所示:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

总结

在本文中,研究人员提出了PointKAN,一种基于Kolmogorov-Arnold网络(KANs)的高效点云分析架构。

相较于基于多层感知机(MLPs)的PointMLP架构,PointKAN在多项任务中均表现出更优性能,充分验证了KANs在提取局部细节特征方面的强大能力。

此外,研究团队还提出了更高效的轻量化版本PointKAN-elite,该版本在保持精度的同时,进一步降低了参数量与计算成本。

团队期待PointKAN能够推动KANs在点云分析领域的应用,充分发挥其相较于MLPs的独特优势。

论文链接:https://arxiv.org/abs/2504.13593
代码链接:https://github.com/Shiyan-cps/PointKAN-pytorch

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/14987.html

(0)
人脑网的头像人脑网
上一篇 2025年5月20日 下午3:23
下一篇 2025年5月20日 下午3:24

相关推荐

  • 所有AI工具共享记忆!MCP协议无需云端,Cursor、Claude都能用

    聊完就忘?当下多数AI助手和开发工具各自独立运行,会话结束上下文即消失,严重影响了使用体验和效率。 OpenMemory MCP,一款可以解决AI工具记忆痛点,并且实现不同工具之间共享上下文信息的开源工具,他来了! 比如,你可以通过OpenMemory MCP用Claude规划路线图,但用Cursor执行任务,两个工具之间可以共享上下文信息,让数据得到延续。…

    2025年5月14日
    600
  • 拿下38项第一!字节发布Seed1.5-VL多模态推理模型

    在60个主流基准测试中拿下38项第一! 字节发布轻量级多模态推理模型Seed1.5-VL,仅用532M视觉编码器+200亿活跃参数就能与一众规模更大的顶尖模型掰手腕,还是能带图深度思考的那种。 相关技术报告也第一时间公开了。 整体而言,虽然是“以小博大”,但新模型在复杂谜题推理、OCR、图表理解、3D空间理解等方面表现出色。 比如猜下图中有几只猫,人眼很容易…

    2025年5月14日
    700
  • 一个「always」站在大模型技术C位的传奇男子

    这是最近网友不断对着Transformer八子之一的Noam Shazeer(为方便阅读,我们称他为沙哥)发出的灵魂疑问。 尤其是最近Meta FAIR研究员朱泽园分享了他们《Physics of Language Models》项目的系列新进展后,有网友发现,其中提到的3-token因果卷积相关内容,沙哥等又早在三年前就有相关研究。 是的,“”。 因为你只…

    2025年5月10日
    500
  • 天文预测新SOTA!紫东太初&国家天文台联手攻克恒星耀发难题

    还记得刘慈欣在《全频带阻塞干扰》中描绘的耀斑爆发吗? 现在科幻照进现实,人类踏出了理解耀斑的重要一步——预测。 来自紫东太初和中国科学院国家天文台的研究团队,联合开发了天文耀发预测大模型FLARE(Forecasting Light-curve-based Astronomical Records via features Ensemble)。 该模型能精准…

    2025年5月14日
    500
  • 华为+DeepSeek,推理性能创新高!技术报告也公布出来了

    部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构! 而做到这一点的,正是华为昇腾;具体而言,共包含两个产品: CloudMatrix 384超节点 部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/s Atlas 80…

    2025年5月19日
    700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信