8月4日消息,腾讯混元今日发布了四款开源的小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。
目前,四个模型均在Github和Huggingface等开源社区上线,Arm、高通、英特尔、联发科技等多个消费级终端芯片平台也都宣布支持部署。
新开源的4个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式——快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。
效果上,四个模型均实现了跟业界同尺寸模型的对标,特别是在语言理解、数学、推理等领域有出色表现,在多个公开测试集上得分达到了领先水平。
这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,技术上通过精心的数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以胜任深度搜索、excel操作、旅行攻略规划等任务。
此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》小说,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。
部署上,四个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLMandTensorRT-LLM)和多种量化格式均能够支持。
应用层面,四款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用:
依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。
在端侧应用上,腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。
在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与AI即问即答的无缝衔接。
在需求各异、约束严苛的垂直行业应用中,金融AI助手通过Prompt优化和少量数据微调实现95%+意图识别准确率,展现出金融级的高可靠性;游戏翻译和QQ飞车手游NPC充分利用模型的理解能力在多语言理解能力、方言翻译和智能对话方面有突出表现。
在大语言模型领域,腾讯混元此前陆续开源了激活参数量达52B的hunyuanlarge和首个混合推理MoE模型Hunyuan-A13B。
多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000个。上周,腾讯发布并开源了混元3D世界模型1.0。
附开源地址:
【Github】
Hunyuan-0.5B:https://github.com/Tencent-Hunyuan/Hunyuan-0.5B
Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B
Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B
Hunyuan-7B:https://github.com/Tencent-Hunyuan/Hunyuan-7B
【HuggingFace】
Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct
Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct
Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct
Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct
最新发现
相关资讯
腾讯混元0.5B、1.8B、4B、7B模型开源发布,消费级显卡即可运行
腾讯混元今日发布了四款开源的小尺寸模型,参数分别为05B、18B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。
2025-08-09 07:02:32
数十个外语专业被国内多所大学裁撤:AI背景下英语专业还有必要吗
8月4日消息,AI人工智能如火如荼的发展下,这也让一部分专业人才被迫调整,比如外语类的。近日,河北大学外国语学院发布公告,称自2026年起,拟停招英语口译、日语口译专业的研究生;同
2025-08-09 07:02:23
具身智能机器人,如何才能活出个“人样”?
消除“人机感”
2025-08-09 07:02:00
当代码遇见跑道:iFLYTEK·AI开发者大赛携手特步冲刺智慧未来
从第一行代码的敲下,到一款AI产品真正服务用户,开发者的成长与产品的落地,本质上是一场需要耐力、节奏与判断力的长跑。这场漫长又孤独的技术长跑中,需要的不仅是开发者本身的能力,更要有坚
2025-08-08 09:06:38
国家安全部:警惕人工智能数据投毒,0.01%虚假文本可致有害输出增加11.2%
国家安全部提醒,人工智能数据污染问题日益严重,仅001%的虚假文本就能使AI有害输出增加112%。数据污染可能导致金融、公共安全、医疗健康等领域的现实风险。加强源头监管和风险评估是关键。AI安全
2025-08-08 09:06:25
凭借一条私信,我如何入职OpenAI
获得机会的第一步是主动出击没有内推、没有背景,如果你想进入像OpenAI这样的顶级公司,该怎么办?OpenAI客户总监SophieRose的回答是:一条陌生人私
2025-08-08 09:06:17
今日热榜
何小鹏谈创新:下一轮汽车行业创新将叠加AI技术
2025-01-30 19:40:48SASE如何重塑网络安全新架构?全面解析SASE技术优势
2025-05-01 22:44:25一年3次调价,连Salesforce都搞不定,AI定价到底难在哪?
2025-07-30 09:12:43鸿蒙版腾讯地图重磅升级:新增AI搜索、导航无缝流转打造高效出行新体验
2025-07-30 09:12:49英特尔确认CoralRapids处理器规划,Intel18A节点服务至少三代产品
2025-07-30 09:13:02“保守1000亿”,这个赛道正在批量制造90后富豪
2025-07-30 09:13:12WAIC UP!之夜:一场关于AI与人类未来的星空思辨
2025-07-31 09:08:13消息称微软与OpenAI正进行深入谈判:确保AGI时代技术合作
2025-07-31 09:08:16“子曰”大模型多元场景加速落地网易有道携全矩阵AI应用亮相2025WAIC
2025-07-31 09:08:23Bragi与OpenAI合作推出ChatAI应用,为耳机装上GPT-4.1
2025-07-31 09:08:30热门推荐