2023 REAL科技大会上,北京智源人工智能研究院副院长林咏华发表了题为《打造大模型技术的“Linux”,为AI未来十年发展打下坚实根基》的主题演讲。
在生成式人工智能的热潮下,大模型及相关应用正在步入研发落地的新阶段。而回望人工智能产业的发展,“质量”成为实现AI落地的“最后一公里”问题,即能否达到产业、工业的发展要求。针对这一点,林咏华的观点是,大模型会比小模型更具挑战。
她特别提到,大模型的训练数据、数据配比、训练数据输入顺序,训练过程中的所有超参设置都没有完全公开,因此难以完全复现大模型的能力和问题;同时,大模型进行算法修改和重新训练的投入极高,使得企业很难对其进行修补。再者,算法、数据和过程都有可能存在“debug”,问题成因难以分析。
这些因素都决定了基础模型将会影响下游模型的能力,做基础模型的企业机构需要不断打磨。
林咏华强调,未来10年,大模型必然牵引人工智能走向美好的星辰大海,但在当下面临多种挑战,包括基础大模型费用昂贵、训练数据集获取不易、评测方法参差不齐、工具碎片化、计算资源日益受限等。
在她看来,开源开放让从业人员得以站在前人的基础上继续前行。智源此前的一系列发布动作也表明,其试图利用开源开放来解决上述产业挑战。
具体到基础大模型方面,近日智源宣布悟道·天鹰Aquila大语言模型系列全面升级,其中340亿参数的Aquila2-34B在多个榜单均表现抢眼。此外,智源将Aquila2模型系列全部开源,Aquila2的创新训练算法、FlagScale框架、FlagAttention算子集以及语义向量模型BGE均已同步开源。
据林咏华透露,智源研究院所开放的全球最大的中文数据集WuDaoCorpora目前已对外开放低风险数据200G,至今已有数万次下载。
评测方法方面,林咏华指出,大模型在生成能力、认知能力、人类思维能力的测评方面都面临着挑战:除少数生成任务外,生成能力仍主要依靠人类评分;认知的边界难以确定;测评人类思维能力需要新的复杂测试集合、定义新的测试方式。
计算资源方面,国内厂商所采用的架构和开发工具链的不同、众多的AI框架、层出不穷的场景等等因素,使得异构芯片间适配工作量大、开发复杂度高、评测标准也难以统一。
针对这两方面的挑战,智源研究院分别推出了大模型评测体系及评测平台FlagEval以及AI芯片评测开源项目FlagPerf。
“大模型已经从语言模型走向多模态,这是技术走向落地的一个重要阶段。”林咏华表示,未来大模型会从互联网应用逐步走向千行百业,“我们希望看到大模型走出数字世界,走向物理世界,走向自动驾驶、机器人等场景。”
最新发现
相关资讯
大模型将从互联网应用逐步走向千行百业:北京智源人工智能研究院林咏华
2023 REAL科技大会上,北京智源人工智能研究院副院长林咏华发表了题为《打造大模型技术的“Linux”,为AI未来十年发展打下坚实根基》的主题演讲。在生成式人工智能的热潮下,大模型及相关应用正在步入研发落地的新
2025-07-05 10:13:37
首个基于“时空信息”的产业“融合大模型”,助力360行,行行链接AIGC!
2023年云栖大会上,高德地图旗下高德云图正式发布自主研发的产业大模型——“云睿”,融合地图时空类数据部署训练模型,面向多行业提供可定制扩展的生成式人工智能(AIGC)融合解决方案,这也是业内首个基于时空信息
2025-07-05 09:49:37
AIGC羊毛,为“薅”而“薅”有企业把自己玩惨了!
单季度净利润告负,或许为了撑住股价,昆仑万维把自己玩亏了。10 月 26 日,昆仑万维发布的三季报显示,公司第三季度营收同比增长 9 27% 至 12 56 亿元,净利润出现约 3000 万元的亏损。据节点财经查询,这也是自
2025-07-05 09:25:37
AIinall,“AIGC开放战略”推进海外市场应用升级-新华三
据彭博智能全球产业调查分析,未来十年生成式AI产业的复合增长率可达42%,2032年的市场规模将达到1 3万亿。IDC 预测,2026 年中国 AI 大模型市场规模将达到 211 亿美元,人工智能将进入大规模落地应用关键期。生
2025-07-05 09:01:38
超凡创意Prompt,大模型AIGC产业沙龙成功在京举行
随着AI技术的发展,大模型已经成为了各行各业发展的新趋势和新机遇。通过学习海量的文本数据,生成各种形式和风格的内容,不仅扩大了内容的范围,更重新定义了创作的边界,为文学、新闻、广告、娱乐等领域带来了
2025-07-05 08:37:37
2023年大学生数字技能应用大赛,火热报名中!
一、大赛背景大学生数字技能应用大赛& 8211;人工智能 AIGC 赛道是适应新形势,落实国家发展战略,适应人工智能 AIGC 对各行业带来的生产工具普遍性、颠覆性变革的时代要求,为社会培养高适配、高素质技能人才的重要
2025-07-05 08:13:37
今日热榜
南京科技赋能反诈宣防:AI数字人和语音外呼技术的创新应用
2025-02-27 17:27:31AI训练AI:研究显示越练越“傻”现象及应对策略
2025-05-05 19:14:00AI“魔改”短视频要严守二创边界
2024-12-20 01:31:46北京市将推进“人工智能+教育”新场景建设丰富学生课间活动
2024-12-24 13:05:09券商追逐大模型赋能投研,分析师用AI写研报再进一步
2024-12-24 13:45:17ENJOYAI!闵行项目亮相全球总决赛!
2024-12-26 15:36:24广电总局发文规范AI“魔改”短视频
2024-12-26 17:56:57第三届全国人工智能应用技术技能大赛决赛在山东省青岛市开幕
2024-12-27 16:58:06商汤向生成式AI发起冲刺
2024-12-27 18:18:19艾力斯:计划利用AI模型预测生物分子的相互作用,提高新药研究的效率
2024-12-30 11:36:56热门推荐