今年7月底,第二届中国计算机学会芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错计算、新兴计算机工程与工艺等方面的理论创新、技术研发、应用示范与产业发展话题。在本届芯片大会体系结构专委组织的“CCFTCarch定制计算挑战赛”(消费级显卡的LLM部署加速)上,西南交通大学冯力教授带领的研究团队凭借其在大模型边缘推理优化方面的卓越表现,荣获了全国第二名的优异成绩。在此次竞赛中,冯力团队采用了一系列创新技术来应对大模型边缘推理面临的挑战,其中包括算子融合技术。该技术通过将多个独立的运算操作合并,减少了显存的频繁读写,显著提升了计算效率。据冯力介绍,通过算子融合,团队成功地将计算时间缩短了80%以上,极大地提高了计算资源的利用效率。此外,团队还实施了精度量化技术,将部分计算从浮点运算转换为定点运算。虽然这在一定程度上带来了精度上的损失,但整体上仍实现了计算速度的大幅提升和能耗的降低。冯力强调,此次竞赛的成功离不开团队成员之间的紧密合作。尽管参赛的学生们在大模型领域缺乏经验,但他们展现出了非凡的学习能力和勇于探索的精神。通过与国际顶尖学者的合作,特别是与英国布里斯托大学的跨国交流,学生们不仅拓宽了视野,也积累了宝贵的经验。冯力表示:“我们的学生非常年轻,但他们充满热情,勇于面对挑战。通过大量的文献阅读和技术研讨,他们迅速掌握了相关领域的最新进展,并将理论知识转化为实践成果。”谈及未来的发展方向,冯力表示,随着大模型技术的进步,特别是在隐私保护和私有化部署方面的需求日益增加,团队的研究成果将具有广阔的应用前景。例如,在金融、交通和航空等领域,许多敏感数据不适合传输到云端处理,而是在本地进行分析,这就需要高效的大模型边缘推理技术。冯力透露,目前团队正在积极与多家企业和研究机构合作,致力于将研究成果应用于网络安全漏洞分析和交通大数据处理等方面,推动科研成果的商业化转化。
今年7月底,第二届中国计算机学会(CCF)芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错计算、新兴计算机工程与工艺等方面的理论创新、技术研发、应用示范与产业发展话题。
在本届芯片大会体系结构专委组织的“CCFTCarch定制计算挑战赛”(消费级显卡的LLM部署加速)上,西南交通大学冯力教授带领的研究团队凭借其在大模型边缘推理优化方面的卓越表现,荣获了全国第二名的优异成绩。
在此次竞赛中,冯力团队采用了一系列创新技术来应对大模型边缘推理面临的挑战,其中包括算子融合技术。该技术通过将多个独立的运算操作合并,减少了显存的频繁读写,显著提升了计算效率。
据冯力介绍,通过算子融合,团队成功地将计算时间缩短了80%以上,极大地提高了计算资源的利用效率。此外,团队还实施了精度量化技术,将部分计算从浮点运算转换为定点运算。虽然这在一定程度上带来了精度上的损失,但整体上仍实现了计算速度的大幅提升和能耗的降低。
冯力强调,此次竞赛的成功离不开团队成员之间的紧密合作。尽管参赛的学生们在大模型领域缺乏经验,但他们展现出了非凡的学习能力和勇于探索的精神。通过与国际顶尖学者的合作,特别是与英国布里斯托大学的跨国交流,学生们不仅拓宽了视野,也积累了宝贵的经验。冯力表示:“我们的学生非常年轻,但他们充满热情,勇于面对挑战。通过大量的文献阅读和技术研讨,他们迅速掌握了相关领域的最新进展,并将理论知识转化为实践成果。”
谈及未来的发展方向,冯力表示,随着大模型技术的进步,特别是在隐私保护和私有化部署方面的需求日益增加,团队的研究成果将具有广阔的应用前景。例如,在金融、交通和航空等领域,许多敏感数据不适合传输到云端处理,而是在本地进行分析,这就需要高效的大模型边缘推理技术。冯力透露,目前团队正在积极与多家企业和研究机构合作,致力于将研究成果应用于网络安全漏洞分析和交通大数据处理等方面,推动科研成果的商业化转化。
冯力表示:“我们的学生非常年轻,但他们充满热情,勇于面对挑战。通过大量的文献阅读和技术研讨,他们迅速掌握了相关领域的最新进展,并将理论知识转化为实践成果。谈及未来的发展方向,冯力表示,随着大模型技术的进步,特别是在隐私保护和私有化部署方面的需求日益增加,团队的研究成果将具有广阔的应用前景。”
最新发现
相关资讯
西南交通大学大模型边缘推理优化技术取得新成绩
今年7月底,第二届中国计算机学会芯片大会在上海举办。西南交通大学冯力教授带领的研究团队凭借其在大模型边缘推理优化方面的卓越表现,荣获了全国第二名的优异成绩。团队采用了一系列创新技术来应对大模型边缘推
2025-04-17 13:27:30
MiniMax闫俊杰:大模型快就是好可有时候慢是为了更快
大模型是拼速度的领域,但有时候慢可能是另一种快。MiniMax上海稀宇科技发布了视频模型abab-video-1,可以生成时长最高6秒的视频。闫俊杰认为“快”是该公司底层大模型的核心技术研发目标。MiniMax的视频模型比Runw
2025-04-17 13:07:27
监督帮扶大模型上线,未来拟向全国推广!
能即时回复,而且内容详细,有些我们没想到的事项也会包括在答复里。作为参加2024年第七轮次重点区域空气质量改善夏季监督帮扶的执法同志,来自河南省濮阳市生态环境局的彭建志向“监督帮扶智能答疑模型”咨询相关
2025-04-17 12:47:20
杭州字节方舟推出基于人工智能的区块链大数据推荐方法专利
专利公开了一种基于人工智能的区块链大数据推荐方法,通过区块链技术存储加密行为数据,提高推荐系统精准匹配用户兴趣。
2025-04-17 12:27:19
高盛分析:AI对未来石油价格的双重影响与挑战
高盛研究指出,未来10年AI将通过提高石油生产效率和降低成本,对全球油价产生温和的负面影响。尽管AI促进石油消费,但供给端的提振更为显著。
2025-04-17 12:07:10
人工智能发展:科技人文十大热点问题解密
外滩大会将揭示人工智能对人类思考力和劳动价值的影响,涵盖伦理问题、大模型生成内容、AI 的发展方向等,同时展示人工智能+生命科学的新思路。
2025-04-17 11:47:02
今日热榜
AI应用不断深化板块景气度持续提升
2025-04-10 10:05:06华为云:构筑AI技术生态助推智能经济发展
2025-01-09 17:47:02科大讯飞“牵手”中国华能集团,打造人工智能赋能能源电力行业典型示范
2024-12-27 15:57:44AI“尝百草”生物医药“智”造提速
2025-01-13 16:42:41AI搜索第一股再获支持,IDC报告显示360AI搜索多项指标引领行业
2025-01-21 16:20:25业界竞逐AI规模应用契机
2025-01-22 13:40:25人类驯服AI巨兽,需站在《智人之上》
2025-02-20 12:48:47早安!世界丨俄罗斯洲际导弹试射疑失败;日本推出人工智能相亲系统
2025-02-20 13:48:57世界互联网大会举办人工智能国际标准研讨会
2025-02-21 13:52:06腾讯杰出科学家刘威:生成式AI在数字世界中可以预测未来
2025-02-24 12:53:36热门推荐