简介
通义万相拥有的文生图和图生图能力,可以辅助人类进行图片创作,大幅降低图片设计门槛。未来还可应用于艺术设计、游戏和文创等应用场景。通义万相只要包括文本生成图像、相似图像生成和图像风格迁移三大功能。
通义万相是阿里云通义系列ai绘画创作大模型,基于阿里研发的组合式生成模型Composer,它拥有 50 亿参数,并在数十亿个文本、图像对上进行训练,通过一个基于扩散模型的「组合式生成」框架,Composer 能够对配色、布局、风格等图像设计元素进行拆解和组合,实现了高度可控性和极大自由度的图像生成效果。
通义万相功能:
1、文生图:文生图页面左侧有一个简洁的界面,上方有一个文本输入框,在输入框内可以输入prompt。文本框下方提供8个可选的画面风格,你可以在水彩、油画、中国画、扁平插画、二次元、素描、3D 卡通等多种风格中进行选择。在输入文字描述并选定风格后,ai 便可自动生成创作图片了。同时为了方便使用,输出图像的比例有现成的 1:1、16:9 和 9:16 三种可选。
2、相似图生成:用户只要提供提供一张参考图像,可获取内容、风格相似的 AI 画作。这里要注意,上传的图像大小要在 10M 以下,格式则支持常见的 JPG、JPEG、PNG、BMP 等,通义万相文本生成的图片可以直接生成相似图,点击生成按钮,右侧生成4张相似图片可供下载。
3、风格迁移:风格迁移界面支持输入两张图片,一张为原图,一张为指定风格图。生成的图像会保留原图的内容和风格图的风格。你只要上传想要变换风格的原图和目标风格的示意图,就可以很快将原图处理为目标风格的创意图了。与相似图像生成一样,原图和风格图的大小不得超过 10M,格式相同。
无论是文生图还是图生图,通义万相从语义相关性、画面完整性以及细节丰富度等方面来看,都给了我们很大的惊喜。
通义万相优点:
生成速度快。
文生图风格多样:支持8种风格,并且风格之间的差别,特色都十分显著。无论是二次元风格还是写实风格,表现力都不错。
相似图与原图贴合程度极高:产品将相似图片与原图进行精确匹配,保留了原本图片的特征和细节。使用过程中无需担心生成的图片与原图差异过大。
风格迁移保留原本图像信息:万相能够保留原本图像的信息,使得生成的图片在拥有新的艺术风格的同时仍然能够保持原始图像的特征。
通义万相的推出标志着阿里云在人工智能领域的持续创新。在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相。此后,通义千问、通义听悟等模型和产品相继推出,家族新成员通义万相的亮相,至此,AI 的三大主要方向已经全部打通。意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。
相关资讯
AI技术打开高端手机市场新空间
近年来,国内手机用户换机周期延长,市场竞争白热化,AI技术的出现则给产业打开了新空间,但业界认为,手机厂商的突围之道仍需依靠技术创新。AI搅热高端机市场近日,记者在位于上海领展广场内的苹果Apple零售店内
2025-02-14 12:48:14
植入AI基因,申城学校用科技点燃学生梦想
老师课后答疑时,办公室总是“人满为患”,学生有时不得不在办公室门口排队,这个问题有更好的解决办法吗?上海市位育中学学生沈伯尧、胡馨尹、顾承轩用学校芯片科技教育特色课程中学习到的设计思维和编程技术,开
2025-02-14 12:28:09
借着AI的光,它也红了
如果用一句话形容这几年的存储行业,那就是起起伏伏。前两年行情一直很差的存储行业,从去年Q3开始,通过控产强势涨价,并且在今年逐渐强势回暖,走出阴霾。本来,最近一阵子总是有人说存储行业又要凉了,各种难
2025-02-14 12:08:08
AI赋能智绘未来——人工智能应用创新专场活动在京成功举办
当前,以大模型和生成式人工智能(AIGC)为代表的人工智能突飞猛进,正推动新一轮科技革命和产业变革加速演进,人工智能成为提升产业竞争力、推动经济高质量增长的战略性力量。9月25日下午,由北京中关村科学城科创
2025-02-14 11:48:03
角逐货币市场数字蓝海AI颠覆传统交易模式
随着科技的飞速发展,人工智能正逐步渗透至金融的各个角落。本币货币市场作为金融市场的重要组成部分,近期密集迎来人工智能技术的深度应用。多家银行巨头纷纷推出基于人工智能的交易机器人和智能系统,旨在通过
2025-02-14 11:07:52