IT之家8月5日消息,阿里通义千问团队今日宣布开源Qwen-Image,这是一个20B的MMDiT模型,也是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。
Qwen-Image的主要特性包括:
文本渲染能力:Qwen-Image在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。
一致性的图像编辑能力:通过增强的多任务训练范式,Qwen-Image在编辑过程中能保持编辑的一致性。
跨基准性能表现:在多个公开基准测试中的评估表明,Qwen-Image在各类生成与编辑任务中均获得SOTA。
通义千问团队在多个公开基准上对Qwen-Image进行了全面评估,包括用于通用图像生成的GenEval、DPG和OneIG-Bench,以及用于图像编辑的GEdit、ImgEdit和GSO。
Qwen-Image在所有基准测试中均取得了最先进的性能。此外,在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的结果表明,Qwen-Image在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型。
IT之家附示例如下:
宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着“阿里云”卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着“云存储”的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着“云计算”的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着“云模型”的牌子,门口放着一个大酒缸,上面写着“千问”,一位老板娘正在往里面倒发光的代码溶液。
一副典雅庄重的对联悬挂于厅堂之中,房间是个安静古典的中式布置,桌子上放着一些青花瓷,对联上左书“义本生知人机同道善思新”,右书“通云赋智乾坤启数高志远”,横批“智启通义”,字体飘逸,中间挂在一着一副中国风的画作,内容是岳阳楼。
一个穿着“QWEN”标志的T恤的中国美女正拿着黑色的马克笔面相镜头微笑。她身后的玻璃板上手写体写着“MeetQwen-Image--apowerfulimagefoundationmodelcapableofcomplextextrenderingandpreciseimageediting.欢迎了解Qwen-Image,一款强大的图像基础模型,擅长复杂文本渲染与精准图像编辑”
除了文本处理,Qwen-Image在通用图像生成方面支持多种艺术风格。从照片级写实场景到印象派绘画,从动漫风格到极简设计,该模型能够灵活响应各种创意提示。
在图像编辑方面,Qwen-Image支持风格迁移、增删改、细节增强、文字编辑,人物姿态调整等多种操作。这让普通用户也能实现专业级的图像编辑。
IT之家附开源地址如下:
ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image
HuggingFace:https://huggingface.co/Qwen/Qwen-Image
GitHub:https://github.com/QwenLM/Qwen-Image
Technicalreport:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf
Demo:https://modelscope.cn/aigc/imageGeneration?tab=advanced
最新发现
相关资讯
阿里通义千问首个图像生成基础模型Qwen-Image开源,支持中文高保真输出
阿里通义千问团队今日宣布开源Qwen-Image,这是一个20B的MMDiT模型,也是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。
2025-08-06 09:15:25
OpenAI将为ChatGPT用户增加时长提醒:别沉迷AI聊天,健康最重要
OpenAI宣布调整ChatGPT运作方式,新增使用时长提醒功能,建议用户适当休息。公司强调开发初衷是帮助用户高效使用AI,而非吸引注意力。同时改进高风险问题回应,并与多国医生合作优化产品。AI健康
2025-08-06 09:15:19
奥特曼携手跃然创新全球首款奥特曼AI玩具震撼来袭
“新的风暴已经出现,怎么能够停滞不前,穿越时空,竭尽全力,我会来到你身边!”作为一名骨灰级奥特曼粉丝,奥特曼系列作品早已融入我的生活,成为不可或缺的一部分。从儿时守在电
2025-08-06 09:15:14
苹果被贴脸开大:AI跳票后被谷歌公开嘲讽
8月5日消息,今天谷歌发布一则广告片,谷歌在这则广告中就苹果AI跳票进行了嘲讽,喊话苹果用户应该购买Pixel10系列智能手机。谷歌在广告片中表示,如果你因为某个“即将推出&rdqu
2025-08-06 09:15:10
百川智能王小川:最孤独的AI创业者
终究还是一个人抗下所有,成为最孤独的创业者。
2025-08-05 10:47:08
企业AI裁员后遗症:催生“纠错”专员岗位
8月5日消息,据媒体报道,2025年的硅谷,裁员潮仍未平息。在这场风暴中,人工智能(AI)被众多企业CEO奉为提升效率的革命性工具,承载着重塑生产力的厚望。然而,对广大基层员工而言,A
2025-08-05 10:46:56
今日热榜
何小鹏谈创新:下一轮汽车行业创新将叠加AI技术
2025-01-30 19:40:48SASE如何重塑网络安全新架构?全面解析SASE技术优势
2025-05-01 22:44:25一年3次调价,连Salesforce都搞不定,AI定价到底难在哪?
2025-07-30 09:12:43鸿蒙版腾讯地图重磅升级:新增AI搜索、导航无缝流转打造高效出行新体验
2025-07-30 09:12:49英特尔确认CoralRapids处理器规划,Intel18A节点服务至少三代产品
2025-07-30 09:13:02“保守1000亿”,这个赛道正在批量制造90后富豪
2025-07-30 09:13:12WAIC UP!之夜:一场关于AI与人类未来的星空思辨
2025-07-31 09:08:13消息称微软与OpenAI正进行深入谈判:确保AGI时代技术合作
2025-07-31 09:08:16“子曰”大模型多元场景加速落地网易有道携全矩阵AI应用亮相2025WAIC
2025-07-31 09:08:23Bragi与OpenAI合作推出ChatAI应用,为耳机装上GPT-4.1
2025-07-31 09:08:30热门推荐