腾讯科技最新发布了8月份的SuperCLUE-V基准榜单,这次测评涵盖了多模态理解领域的12个顶尖模型。
IT之家 8 月 5 日消息,据腾讯科技今日报道,中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型位居国内大模型首位(71.95 分)。
腾讯科技方面宣称,该模型准确识别图像元素并生成自然语言描述,全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型,腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。
IT之家查询得知,8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二,仅次于 GPT-4o。GPT-4o 取得 74.36 分,领跑多模态基准,基础多模态认知能力和应用能力均有 70 + 分的表现,在技术和应用方面均有一定领先优势。
▲ 图源“ CLUE 中文语言理解测评基准”公众号,下同
SuperCLUE 评价称,在基础能力方面,国内大模型较海外模型仍有一定差距,尤其在细粒度视觉认知任务上,国内外最好模型有 5 分的差距,需要进一步对多模态深度认知能力做优化提升。
本次测评选取了 4 个海外模型和 8 个国内代表性多模态模型。其中为进一步评估开源和闭源的不同进展,本次参评模型包括 4 个开源模型、8 个闭源模型。
总体来看,本次评测展示了腾讯混元在多模态基准上的卓越表现,但也凸显了国内模型在特定视觉认知任务上与国外模型的差距。
最新发现
相关资讯
中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首
腾讯科技报道,中文多模态大模型SuperCLUE-V基准8月榜单揭晓,腾讯混元模型以71 95分稳居首位。测评覆盖12个国内外多模态理解大模型,揭示了国内模型在细粒度视觉认知任务上与海外模型的差距。
2025-05-02 18:53:37
智源大模型:人工智能新质生产力引擎
智源是全球领先的大模型研究机构,致力于推动人工智能技术的创新和应用。文章探讨了智源在大模型领域的开发历程、技术创新及其对新质生产力的贡献。
2025-05-02 18:33:28
大模型发展与市场前景分析
探讨2024年大模型发展趋势及其市场前景,分析王仲远院长对大模型与人工智能的独特见解,以及智源在推动人工智能创新中的角色。
2025-05-02 18:13:26
Notta:日本市场会议语音转录创业的成功策略和成长路径
探索Notta在日本市场的成功之路,从创业策略到市场本地化,以及其在会议语音转录领域的创新和成就。
2025-05-02 17:53:23
00后哈佛辍学生创业AI吊坠:不要生产力,我们只要AI朋友
Avi Schiffmann是一位00后创业者,曾是哈佛辍学生,他开发了一款名为Friend的AI穿戴设备,专注于提供情感陪伴而非提高生产力。Friend能像真实伴侣一样陪伴用户,无论是旅行、打游戏还是追剧。
2025-05-02 17:33:17
美科技巨头大幅增加AI领域投资,华尔街忧虑股价波动
英国《金融时报》报道,微软、亚马逊、Meta和谷歌母公司Alphabet今年上半年共投资1060亿美元于人工智能领域。华尔街对此表示担忧,科技股股价波动引发市场关注。
2025-05-02 17:13:10
今日热榜
当蔡国强“指导”AI创作:灵魂扫描,灵性交集
2025-01-08 15:35:58《爱、死亡与机器人》司马华鹏用AI重新定义生命的边界
2024-12-30 17:18:22语文学习新解法:海豚AI学用科技因材施教
2025-01-06 17:23:58华为云:构筑AI技术生态助推智能经济发展
2025-01-09 17:47:02“互联网之光”博览会今天开幕全面聚焦人工智能
2025-01-15 10:08:24国网克州供电公司:人工智能赋能输电线路巡视缺陷识别应用
2025-01-15 11:48:49阿里海外,要靠AI打响效率之战
2025-01-15 15:09:37AI时代,为什么「超级有用」比「超级应用」更重要?
2025-01-15 17:50:14《广东省本科高校人工智能人才培养实施方案》发布
2025-01-16 12:45:10华北五省(市、自治区)大学生机器人初冬开赛信息科大人工智能研究院成立
2025-01-16 14:05:21热门推荐