今年10月,作为苹果公司与哥伦比亚大学的研究成果,Ferret就已经发布过一次,只是当时仅供研究使用而非商业许可,所以并未引起多大关注。如今情况发生了转变,随着各大科技公司你追我赶地公布研发成果,关于本地模型为小型设备提供智能体验的讨论也越来越多。
12月以来,苹果也陆续公布它在AI领域的研发进展。12月初苹果公布Apple Silicon平台专用AI框架MLX、以及能在设备端执行大语言模型的方法,后者能在边缘设备上执行DRAM两倍大的模型,可节省执行大模型所需的运算资源,也更能确保隐私安全。
上周,苹果再次公布全新成果——Ferret大语言模型以及相关标竿测试工具与数据集。
作为一款多模态模型,Ferret可以接受文字、声音、影像或数据的输入。根据苹果10月公布Ferret的研究论文,Ferret能理解任何形状或任何图片颗粒(granularity),并且可以准确定位(ground)开放词汇的描述。为了把引用(refer)和定位能力整合到模型中,Ferret采用一种混合区域表征(hybrid region representation)技术,整合个别方位和连续性的特征,以表示图片中的某一区域。为提取出区域中的连续特征,苹果研究人员提出一种空间感知的视觉采样器,它能处理不同形状多种稀疏性。这也使Ferret可以接受多样化区域输入,像是点、边界框、自由形式的形状。
为提升Ferret的能力,苹果团队使用了GRIT数据集(Ground-and-Refer Instruction-Tuning),后者为是一个广大的refer-and-ground指令微调数据集,包含110万个样本,内有丰富的阶层化空间知识,以及9.5万个负样本,以提升模型的判断力。
与Kosmos-2、GPT4-ROI、LLaVA、Shikra等多模态大语言模型比较,最后苹果得到的模型Ferret-13B,在传统引用及定位任务具有优异效能,此外,在区域为基础、需要本地化的多模态对话、细节描述,以及复杂推理等任务上,Ferret-13B的表现同样优于其他模型。在视觉化比较任务,苹果说它的模型展现优异的空间理解及常识推理能力。此外,苹果宣称其物件幻觉也较Shikra、InstructBLIP、MiniGPT4、LLaVA、MM-GPT及 mPLUG-Owl等知名模型少很多。
苹果公布了Ferret7B、130B二模型的 代码、GRIT数据集、标竿测试工具Ferret-Bench,上周也公布了Ferret 70B及130B检查点(checkpoint)。
有趣的是,在人工智能社区中,很多人都是到最近才发现苹果的大模型,Bart de Witte也在X上感叹自己居然错过了这个消息,同时也表示:“期待着有一天,本地大型语言模型能作为重新设计的iOS的集成服务,运行在我的iPhone上。”
随着苹果大模型的开发有了新的进展,Anthropic和OpenAI据称也在为其专有大语言模型的开发工作谈判新的巨额融资。
最新发现
相关资讯
iPhone的AI时刻不远了?苹果Ferret多模态大模型登场
今年10月,作为苹果公司与哥伦比亚大学的研究成果,Ferret就已经发布过一次,只是当时仅供研究使用而非商业许可,所以并未引起多大关注。如今情况发生了转变,随着各大科技公司你追我赶地公布研发成果,关于本地
2025-06-26 15:32:41
AI大模型在金融领域陆续落地,专家建议强化跨平台、跨市场监管
随着全国首个官方“大模型标准符合性测试”结果公布,AI大模型商业化应用的关注度进一步提升。在金融领域,AI大模型被不少业内人士视为第二次数字化浪潮,是金融科技向智能金融的进阶升级。但目前来看,智能金融的
2025-06-26 15:08:42
AI大模型的商业狂响:细数18张“潜力拼图”一文拆解“AI大模型”的18张商业潜力图谱
大戏开始前,一片漆黑,当一抹边角被光线撕开,盛装演出的大幕也就将启了。直至AI大模型ChatGPT向认知智能突破之前,AI的前景还一度“万古如长夜”,如无出意外,以ChatGPT、Gemini、文心一言等为代表的AI大模型,
2025-06-26 14:44:41
阿里云诠释“通义听悟”:AI大模型化身工作生活好帮手
如果你是一名职场人,通义听悟可以帮你记录和回顾你的每一场会议;如果你是一位学生,通义听悟可以让你不遗漏老师讲授的每一个重点;如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈
2025-06-26 14:20:41
甲骨易成为中国信通院大模型基准测试体系“方升”首批合作伙伴
为满足大模型产业化落地选型测试和能力监测需求,中国信通院于“2024中国信通院ICT深度观察研究成果报告会”上发布大模型评测体系“方升”,旨在建立业界大模型基准测试统一的“度量衡”,规范大模型产业发展。甲骨易是
2025-06-26 13:56:41
中国青少年研究会:发布年度关键词“AIGC”、“平替”引领全年潮流
2023年即将落幕,有哪些关键词组成了你的年度记忆?12月26日,中国青少年研究会联合夸克App发布《2023年轻人搜索关键词报告》并举办主题研讨会,AIGC、在线学艺、上岸、平替、MBTI测试、松弛感、City walk、精神
2025-06-26 13:32:41
今日热榜
2024世界人工智能大会:孙林君分享实在Agent创新应用与落地进展
2025-05-13 13:19:45国务院国资委:要大力发展人工智能,加快建立适应人工智能发展的体制机制
2025-03-24 13:26:36智汇瓯江,数创未来!2024中国人工智能数字创新大会在温举行
2025-04-02 15:46:08高盛分析:AI对未来石油价格的双重影响与挑战
2025-04-17 12:07:10上海人工智能实验室乔宇:大模型推动交互式创作式阅读
2025-04-28 18:27:58美银三大理由反驳AI巨额投入恐打水漂的担忧
2025-04-29 12:26:15国际劳工组织报告:人工智能加剧全球发展鸿沟
2025-05-01 09:21:38上海加快教学设备更新聚焦集成电路与AI领域
2025-05-01 09:41:39生成式AI学术写作:剽窃边界与应用指南详解
2025-05-01 20:23:58SASE如何重塑网络安全新架构?全面解析SASE技术优势
2025-05-01 22:44:25热门推荐