7月9日,国内权威大模型评测机构SuperCLUE发布《中文大模型基准测评2024上半年报告》,360智脑大模型(360GPT2-pro)在SuperCLUE基准6月测评中,取得总分72分,超过GPT-3.5-Turbo-0125,位列国内大模型第4名次,稳居大模型第一梯队,并入选SuperCLUE“卓越领导者”模型象限。
《中文大模型基准测评2024上半年报告》选取国内外具有代表性的33个大模型,采用**度、多层次的综合性测评方案,通过理科、文科和Hard三大维度真实反映大模型通用能力。报告显示,国内大模型市场已形成三大梯队的格局,360gpt2-pro位列第一梯队,并凭借在基础和场景应用上的领先能力,入选“卓越领导者”模型象限,以快速迭代、技术积累或资源优势引领国内大模型发展,不断压缩国内外大模型差距。
值得关注的是,360gpt2-pro在文科方面取得75分的亮眼成绩,排名第2,其中生成创作单项排名第1,与GPT-4o处于同一水平。相较其他国内外头部大模型,360智脑大模型在高语言处理质量、内容生成及理解水平等文科任务上拥有更强的竞争力。
在SuperCLUE中文检索增强生成测评中,360智脑RAG排名第4,进一步缩小国内外模型差距,体现了在中文检索生成能力上的竞争力。此前,360宣布开源两款大模型360Zhinao-search和360Zhinao-1.8B-Reranking,两款模型聚焦于提升长文本检索效果,在RAG技术的检索、排序阶段进行模型优化,结合此前开源的360K长文本能力,全面打通了RAG技术链路,为行业提供可靠的降低大模型“幻觉”概率的能力。
据了解,360智脑大模型目前已形成多参数、多模态、多场景应用的大模型矩阵,首批通过国家标准符合性测试,综合能力位列大模型第一梯队。此外,360不断夯实技术能力的同时,加速模型能力应用,打造新场景新应用,去解决用户刚需和痛点。今年以来,360重塑国民级产品,相继推出360AI浏览器、360AI搜索等产品,其中360AI搜索连续登榜全球AI产品数据增速榜榜首,领跑国内AI搜索引擎市场。
360智脑大模型以其卓越的文科表现和检索生成能力,加速了国内外大模型的技术进步,展示了其在多参数、多模态应用上的领先地位。
最新发现
相关资讯
SuperCLUE发布《中文大模型基准测评2024上半年报告》360智脑大模型稳居第一梯队
国内权威大模型评测机构SuperCLUE发布《中文大模型基准测评2024上半年报告》,360智脑大模型(360GPT2-pro)在多维度评估中脱颖而出,稳居大模型第一梯队,表现超越国内外竞争对手。
2025-05-14 09:33:19
大模型人才紧缺,字节跳动全球高校招聘进展解析
字节跳动加速全球高校招聘大模型技术人才,面向2024年博士毕业生展开专项招聘,竞争激烈。文章分析了大模型技术的重要性提升、人才市场供需紧张情况及公司招聘策略。
2025-05-14 09:31:43
人工智能大模型降价成热议焦点大模型降价底气何在
近期,人工智能大模型降价成为业内讨论的焦点,多家企业纷纷降价甚至部分免费。有观点认为,降价将降低企业和用户使用门槛,推动大模型应用落地,加快行业发展步伐。文章探讨了大模型降价的底层逻辑、产生的影响
2025-05-14 09:30:07
争相下场“浏览器插件”Kimi“大战”豆包:大模型轻量落地,“用户体验最关键”
Kimi正式推出了浏览器插件,集成了“点问笔”和“总结器”功能,支持多种应用场景,如网页术语查询和写作灵感提供。文章分析了Kimi与豆包的竞争优势,强调用户体验的关键性和大模型在轻量化应用中的重要性。
2025-05-14 09:28:31
AI制造的海量谣言,正在“劣化”舆论场
7月11日,澎湃新闻刊发主笔沈彬的评论文章,探讨AI制造的海量谣言对舆论场的影响。文章指出AI生成的信息泛滥可能导致舆论环境的恶化,呼吁保卫舆论自由。
2025-05-14 09:26:55
AI只需X射线片即可判断肺功能
科技日报讯 (记者刘霞)临床医生可以借助胸部X射线片,判断某人是否罹患结核病、癌症或其他疾病,但无法判断其肺部功能是否正常。在一项最新研究中,日本科学家开发出一款高精度人工智能(AI)模型,可以通过患者的
2025-05-14 09:25:19
今日热榜
聚焦人工智能“互联网之光”博览会今日开幕
2025-01-15 10:48:35五年1万亿元!中国银行推出“人工智能”专项综合金融支持
2025-03-12 13:08:25AI造谣乱象“野蛮生长”?专家:可设置敏感关键词禁止生成显著违法信息内容
2025-01-15 10:28:26古特雷斯:气候变化和人工智能无序扩张威胁人类生存发展
2025-03-12 14:48:53OpenAI新“靠山”?媒体:特朗普就职前和Altman通电话畅谈AI基建
2025-03-12 15:29:07未来是否有进军AI玩具的打算?协创数据回应
2025-03-12 16:09:17AI招聘法律风险解析:求职者陷低分出局困境
2025-05-09 11:50:42微软亚马逊挖AI独角兽核心团队遭调查
2025-05-09 15:11:33中国AIPC行业研究报告
2025-05-09 15:31:422024合肥市人工智能生态大会盛况回顾
2025-05-10 15:53:00热门推荐