智源大模型全家桶的发布让人们看到了大模型在AI技术领域的巨大潜力,尤其在语言模型、多模态、具身智能和生物计算方面取得的重大突破和进展。这些新技术的不断演进,提升了人工智能的应用价值和领域拓展。
6月14日,由智源研究院主办的第六届“北京智源大会”在中关村展示中心召开。在本次会议期间,智源研究院院长王仲远做2024智源研究院进展报告,并重点介绍了智源大模型全家桶。
在2024智源研究院进展报告中,智源研究院分享了自身在语言、多模态、具身、生物计算大模型的前沿探索和研究进展及大模型全栈开源技术基座的迭代升级与版图布局。在智源研究院看来,现阶段语言大模型的发展已经具备了通用人工智能非常核心的理解和推理能力,并且形成了一条以语言大模型为核心对齐和映射其他模态的技术路线,从而让模型具备了初步的多模态理解和生成能力。但这并不是让人工智能感知、理解物理世界的终极技术路线,而是应该采取统一模型的范式,实现多模态的输入和输出,让模型具备原生的多模态扩展能力,向世界模型演进。
“未来,大模型将以数字智能体的形态与智能硬件融合,以具身智能的形态从数字世界进入物理世界,同时,大模型这一技术手段可为科学研究提供新的知识表达范式,加速人类对微观物理世界规律的探索与研究突破,不断趋近通用人工智能的终极目标。”王仲远表示。
智源大模型全家桶是本次2024智源研究院进展报告中的一大亮点。记者在会议现场了解到,智源大模型全家桶由大语言模型系列、多模态大模型系列、具身智能大模型和生物计算大模型4个大模型研究方向,共计12项研究组成。以智源语言大模型系列为例,该方向包含了全球首个低碳单体稠密万亿语言模型Tele-FLM-1T和通用语言向量模型BGE(BAAIGeneralEmbedding)系列2项大模型研究。
“针对大模型训练算力消耗高的问题,智源研究院和中国电信人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型Tele-FLM-1T。该模型与百亿级的52B版本,千亿级的102B版本共同构成Tele-FLM系列模型。”Tele-FLM系列模型相关业务负责人告诉记者。据悉,Tele-FLM系列模型实现了低碳生长,仅以业界普通训练方案9%的算力资源,基于112台A800服务器,用4个月完成3个模型总计2.3Ttokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。“模型训练全程做到了零调整零重试,算力能效高且模型收敛性和稳定性好。目前,TeleFLM系列模型已经全面开源了52B版本,核心技术(生长技术、最优超参预测)、训练细节(loss曲线、最优超参、数据配比和GradNorm等)均开源,期望技术开源可以对大模型社区产生有益促进。Tele-FLM-1T版本即将开源,希望可以为社区训练万亿稠密模型提供一个优秀的初始参数,避免万亿模型训练收敛难等问题。”该负责人表示。
智源研究院自主研发的通用语义向量模型BGE系列,基于检索增强RAG技术,可以实现数据之间精准的语义匹配,支持大模型调用外部知识的调用。“自2023年8月起,BGE模型系列先后进行了3次迭代,分别在中英文检索、多语言检索、精细化检索3个任务中取得了业内最佳的表现,综合能力显著优于OpenAI、Google、Microsoft、Cohere等机构的同类模型。目前,BGE模型系列下载总量位列国产AI模型首位,并被HuggingFace、Langchain、LlamaIndex等国际主流AI开发框架及腾讯、华为、阿里、字节、微软、亚马逊等主要云服务提供商集成,对外提供商业化服务。”通用语义向量模型BGE系列相关业务负责人告诉记者。
智源研究院在AI技术的探索道路上不断创新,为人类的科技发展做出了积极贡献。大模型的不断发展和推进,将促进人工智能技术的广泛应用,推动科学研究和产业发展迈向更加智能化和高效化的新阶段。
最新发现
相关资讯
智源大模型全家桶首次曝光,重磅惊艳科技圈
6月14日,智源研究院主办的第六届“北京智源大会”中王仲远介绍了智源大模型全家桶。智源研究院在2024年的进展报告中分享了大模型的前沿探索和研究进展,强调了语言大模型的重要性,表示大模型的演进是通往通用人工
2025-06-01 08:12:58
海淀融媒记者实地探访2024智源大会AI创新展
2024北京智源大会在海淀区展示中心开幕,展示了具身智能机器人Galbot等大模型技术。智谱AI与百度等公司展示了各自的大模型成果,探讨海淀区的科技创新和文化魅力。快手展示了快意大模型和视频生成技术,展望AI在
2025-06-01 07:48:58
探寻中国企业“百模大战”现状,大模型应用展望未来
中国企业自去年延续至今的“百模大战”态势正在持续,科技巨头竞赛加剧。市场洗牌或已在酝酿中,大模型产品价格竞争激烈,带来商业模式挑战。人工智能大模型应用需要结合专业知识与算法优化,涉及到数据、算力的平
2025-06-01 07:24:58
企业如何依靠AIAgent提高智能决策与业务增长
当前大模型技术在ToB领域蕴藏机遇,结合Agent让企业具备学习能力,数据分析和决策是重要应用方向。SwiftAgent 2 0 升级带来变革,统一语义层、多模态数据链接、用户干预等功能解决现有问题,为企业提供智能分析助
2025-06-01 07:00:58
惊!全国首个心理应用大模型发布解锁“Agent智能体+各领域”
2024年,连信数字发布国内首个心理行业应用大模型“洞见人和”,提供全新数智化解决方案,覆盖社会治理、心身健康、产业互联等领域。结合人工智能技术,实现精准的数据识别分析,为用户提供个性化、精准化的决策管
2025-05-31 14:37:21
Copilot惊艳登场!微软AIDay现场演示报销核对新技术
微软AI Day现场展示Copilot如何提升生产力,通过Copilot for Finance在Excel账号中迅速完成报销核对。微软以生成式智能为代表的AI技术创新正在加速演进,Copilot带来个人和企业生产力提升。合作案例包括携程、联
2025-05-31 14:13:21
今日热榜
英伟达新品发布,这些人工智能企业应声上涨!基金提前布局
2025-03-24 15:27:062025人工智能行业趋势报告|大模型之家年度专题
2025-03-25 11:02:09中泰证券:AI进入推理时代,看好通信板块投资机会
2025-03-26 13:06:37DeepSeek再爆火AI竞赛崛起中国创新势力
2025-03-26 13:46:47为什么说“人工智能”这个词不够准确?
2025-03-27 12:54:47人工智能是必须要拥抱的新方向
2025-04-03 12:04:18月活用户超百万AI类App达11个
2025-04-04 13:12:24湖南师大刘双龙研究团队在人工智能加速器设计领域又获新突破
2025-04-16 17:24:53到2030年人工智能模型可扩大10000倍
2025-04-18 10:52:31人工智能公司正在从创造上帝转向做好产品,这是好事
2025-04-18 12:12:38热门推荐