3月18日,月之暗面宣布其对话式AI助手产品Kimi智能助手现已支持200万字的无损上下文输入。在去年10月发布时,Kimi可支持的无损上下文输入长度为20万字。
与此同时,月之暗面还为Kimi智能助手提供了更多数据源。据月之暗面工程副总裁许欣然介绍,当面对一个问题时,Kimi智能助手会尝试不同的方向搜索并据此做出回答;在回答速度上也有提升,许欣然表示,基于infra层的优化,Kimi智能助手生成速度较去年10月份提升了三倍。
目前,Kimi智能助手已上线了网页版、安卓、iOS、小程序应用。据SimilarWeb数据显示,Kimi智能助手网页版于今年2月的访问量为291.9万,同比上月增长104.99%。
上下文窗口一直是各家大模型公司技术角逐的重点。
在长文档问答、长文本摘要等多种应用场景中,上下文窗口尤为重要。在接受腾讯科技专访时,月之暗面CEO杨植麟曾将大模型形容作计算机,long context(长上下文)形容作计算机的内存。在他看来,这是将新计算范式变成更通用的基础。
提升上下文长度也存在一些技术路线。如基于检索增强的RAG(retrieval augmented generation)方法、滑动窗口方式,但是这些方法在提升上下文长度的同时往往也会带来诸如智能水平下降、成本提升等负面效果。
至于月之暗面的解决办法,杨植麟此前曾表示主要在两方面,一是创新网络结构,二是进行工程优化。许欣然在沟通会现场进一步称,上下文长度的无损提升需要在数据、Infra、模型训练、产品等层面协同合作才能实现,此次团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发。
随着上下文长度提升,Kimi智能助手的使用场景也被扩展。在读论文、分析财报等传统使用场景中,可以更精准地满足用户需求,此外,还扩展出桌上角色扮演游戏(TRPG)主持人等全新使用场景。
值得一提的是,上下文长度提升后也为模型评测带来难题。以往测评某一大模型产品的上下文长度时会采用“大海捞针”的方式,即将一个与文本无关的句子隐藏在大量的文本中,然后通过自然语言提问的方式(Prompt),观察AI能否准确提取出这个隐藏的句子。
但随着业内都按照特定指标进行专项训练之后,大海捞针式的测评方法逐渐失去了原先的参考意义。当大模型上下文长度进一步提升后,评测的维度也会变得更加丰富。许欣然直言,目前在学术界这仍是一个有待探讨的开放式问题。
尽管月之暗面科技有限公司在长文本处理方面取得了进展,但其他AI企业在自然语言理解、多模态交互等技术领域的发展也不容忽视。Sora所展现出的视频生成能力使得Diffusion Transformer架构(DiT)初步成为业内共识,如生数科技、爱诗科技都表态称要在今年内追赶Sora。
对于多模态方面的进展,此次沟通会上月之暗面并未对外披露。月之暗面联合创始人周昕宇表示,在Sora发布之前月之暗面就已经有多模态方面的研发,目前正在按照固有节奏推进,预计在今年将会有相关产品发布。
在成立不到一年的时间里,月之暗面已完成两笔大额融资,今年年初完成超10亿美元融资之后,公司估值更是来到了25亿美元,但其公司规模仍在80人左右。对此周昕宇回应称,人才密度比人数更重要,未来会按照需求进行人员扩张,“招的每一个人都要提高团队平均水平。”
最新发现
相关资讯
KimiChat公司月之暗面,支持200万字长文输入,预计2024年将发布多模态产品!
3月18日,月之暗面宣布其对话式AI助手产品Kimi智能助手现已支持200万字的无损上下文输入。在去年10月发布时,Kimi可支持的无损上下文输入长度为20万字。与此同时,月之暗面还为Kimi智能助手提供了更多数据源。据
2025-06-18 15:30:01
AI引领新质生产力:大湾区人工智能应用协同体人工智能+教育专委会成立
3月17日-18日,由大湾区人工智能数字产业联盟举办的“人工智能+教育”专委会成立仪式暨未来教育研讨会”顺利召开,此次会议作为“2024深圳国际人工智能创新大会”的重要议程之一,旨在全面落实党和国家人工智能引领新
2025-06-18 15:06:01
英特尔至强W系列处理器加持,英特尔将与产业伙伴挖掘AIGC应用创新场景!
3月20日,英特尔展示了英特尔至强 W 系列处理器带来的全大核、高性能、内嵌AI加速器、大内存支持、高扩展等特性,并针对产业实际需求提出了选择 AIGC 工作站和服务器CPU的倡导,为 AIGC 场景的工作站和服务器带来
2025-06-18 14:42:01
世悦星承(StarHeir Technology)宣布推出AIGC应用工具平台RichBrainAI
近期,世悦星承(StarHeir Technology)宣布推出AIGC应用工具平台RichBrain AI。据悉,该AIGC部门由美国MIT麻省理工学院博士Leo Qu所带领的国际化AI算法产研团队,与前TikTok、Amazon海外电商化部门高管Stephan
2025-06-18 14:18:01
【英伟达GTC2024】无限可扩展的高性能AI网络专题-会议要点总结
【GTC 2024】无限可扩展的高性能AI网络专题 会议要点开场 & 8211; 孟庆, NVIDIA中国区网络市场总监强调了在大模型训练和推理快速发展的背景下,对AI算力的无限需求。讨论了如何通过提升GPU效率和使用率来在AI训练
2025-06-18 13:54:01
走进上海“人工智能+”产业探寻新质生产力:AI应用创新是今年AIGC产业发展方向,3D数字人将面向公众开放
人工智能将如何重塑我们的工作和生活?有人说“所有的行业都值得用AI重做一遍”,有人说“未来淘汰你的不是AI,而是会用AI的人”……在这个“AI机遇”和“AI焦虑”并存的时代,如何与AI共存成为从打工人、管理层到创业者都在
2025-06-18 13:30:01
今日热榜
科大讯飞“牵手”中国华能集团,打造人工智能赋能能源电力行业典型示范
2024-12-27 15:57:44人工智能风潮下要“乘风”更要“造风”
2025-01-16 10:44:34到2030年人工智能模型可扩大10000倍
2025-04-18 10:52:31大厂不想你有AI女友
2025-04-18 15:53:51人工智能赋能新质生产力发展,政协委员献策未来发展
2025-05-02 07:51:09四川人工智能产业地基坚固如何添砖加瓦?
2025-05-02 08:31:17人工智能驱动的服务模型加速故障排除
2025-05-02 08:51:19大模型的人才黑洞效应,还在持续,ResNet作者张祥雨,投身AI大模型
2025-05-02 09:51:29T3出行领行阡陌大模型国家备案与数字化智能化发展
2025-05-02 11:11:43T3出行领行阡陌大模型国家网信办算法备案通过
2025-05-02 11:31:45热门推荐