在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减,实现了显著的效率提升,相关研究成果已被国际自然语言处理领域顶级会议COLING 24接收。
据介绍,SmartTrim技术的核心在于其自适应剪枝能力,通过分析模型中每层的token表示和attention head的冗余性,智能识别并剪除不必要的计算负担。这一过程中,SmartTrim不仅考虑了token在单一模态序列中的重要性,还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略,SmartTrim能够在保持模型性能的同时,大幅提升计算效率。
在基于 VQA 微调的 METER 的跨模态编码器中,层内不同 token(上)和 attention head(下)表示的相似性。
SmartTrim框架的实施涉及两个关键组件:跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器(MLP)结构,智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性,还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中,评估并修剪那些冗余的注意力头,从而优化了模型的计算效率。
SmartTrim 框架结构图
在训练SmartTrim模型时,研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧,解决了不可导二值mask的问题,实现了模型的端到端训练。此外,自蒸馏和课程学习策略的引入,进一步提高了剪枝后模型的性能,确保了训练过程的稳定性。
Token 的逐步裁剪修剪过程
实验结果表明,SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速,同时将性能损失最小化。这一成果不仅在理论上具有创新性,也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下,SmartTrim的性能甚至超过了原始模型。在高加速比下,SmartTrim相比其他方法展现出显著优势。
SmartTrim技术的推出,标志着多模态大模型研究的一个重要里程碑。度小满表示,SmartTrim技术将在未来整合到公司的轩辕大模型中,以推动大模型技术的发展。相关研究者可以通过访问https://github.com/Duxiaoman-DI/XuanYuan,了解更多关于SmartTrim的详细信息和研究成果。
最新发现
相关资讯
度小满联合哈工大研发自适应剪枝算法,提升多模态大模型计算效率!
在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有
2025-06-16 13:54:42
法制日报:AI“复活”让已逝明星傀儡化,多位已逝明星的AI视频近期频繁出现在短视频平台上,变成赚取流量工具
多位已逝明星的AI视频近期频繁出现在短视频平台上。视频中,AI李玟表示“希望你们都能活得很好”,AI高以翔称“你们的每一个留言、每一份关怀我都感受到了”,AI乔任梁也在跟粉丝们问好。但此类AI视频随即引起逝者家
2025-06-16 13:30:42
3月份全球科技界创出两个世界之最:英伟达再获世界第一!A股AI公司比较优势在哪里?
3月份全球科技界创出两个世界之最:3月8日,全球半导体芯片行业风向标——费城半导体指数最高至5165 83点历史新高,自2023年10月末见底以来,涨幅超过60%,较2022年10月末的低点已经上涨超过100%。3月19日,英伟达
2025-06-16 13:06:42
AI都能审美了?美业首个GPT产品上线,“美业AI大脑”有多智能?
在科技的浪潮中,美业行业正经历着一场智能化的革命。浙江静好控股集团旗下的爱我科技和静博士美业,作为行业的领跑者,近日推出了美业首个GPT产品——“美业AI大脑”。这一创新的AI程序不仅标志着静博士在人工智能领
2025-06-16 12:42:42
微软推出第一批专为企业打造的SurfaceAI电脑
微软周四推出第一批专为企业打造的Surface AI 电脑,包括:Surface Pro 10商用版和Surface Laptop 6商用版,4月9号开始发货。两款都配有可以一键召唤AI助手的Copilot键,搭载英特尔最新酷睿Ultra CPU,并拥有加快
2025-06-16 12:18:42
Sparky1心灵手巧型人形机器人,打响2024新质生产力应用落地“第一枪”!
新质生产力”是2024年两会当之无愧的热词。今年的《政府工作报告》强调了加快发展新型生产力和推进现代化产业体系建设的重要性,特别提出了人工智能是作为科技革命和产业变革的关键技术。随着AGI通用人工智能技术
2025-06-16 11:54:42
今日热榜
到2030年人工智能模型可扩大10000倍
2025-04-18 10:52:31大厂不想你有AI女友
2025-04-18 15:53:51人工智能赋能新质生产力发展,政协委员献策未来发展
2025-05-02 07:51:09四川人工智能产业地基坚固如何添砖加瓦?
2025-05-02 08:31:17人工智能驱动的服务模型加速故障排除
2025-05-02 08:51:19大模型的人才黑洞效应,还在持续,ResNet作者张祥雨,投身AI大模型
2025-05-02 09:51:29T3出行领行阡陌大模型国家备案与数字化智能化发展
2025-05-02 11:11:43T3出行领行阡陌大模型国家网信办算法备案通过
2025-05-02 11:31:45超威财报后暴跌,“AI服务器”真不赚钱?
2025-05-02 12:32:05AI学习机售价破万元引争议,物超所值还是智商税?
2025-05-02 13:32:18热门推荐