AIGC系列深度研究报告:《AIGC专题:中国AIGC文生图产业白皮书》
(报告出品方:中国 AIGC 产业联盟 x 无界 AI)
AIGC,即 Artificial Intelligence Generated Content,人工智能生成内容。它是 生成式 AI(Generative AI)技术所激发的新一轮内容创作者经济浪潮;让人人都 可以简易、便捷、低成本地借助 AI 的力量完成文本、图片、视频、音频等多媒体内 容的高效高质量生产;是对以短视频、自媒体等为代表的大规模 UGC(用户生成内容)经济的进一步范式升级,故称“AIGC”。AIGC 擅长制造和传播爆款内容,尤 以图片、视频等视觉形态最为突出。
AI“新西湖”全名为《新西湖繁盛全景图》,由人类画师与 AIGC 共同参与完成。主要用到三项主流的 AI 绘画技术:线稿上色(controlnet Lineart)、无限拓展(Outpainting)、建筑模型训练(Dreambooth Lora)等。创作方将该作品的使用权无偿捐赠给杭州市贸易促进会、中国国际 动漫节执行委员会、杭州西湖风景名胜区管委会、杭州万事利丝绸文化股份有限公司、杭州灵伴科技有限公司(Rokid)等多家单位和企业以共创、推广 杭州文化,共享 AI 作品版权。
AI“古温州”,则以温州朔门古港遗址的资料为基础,以“千年商港,未来温州”为主题,借助 AI 工具为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。2023 年 3 月 29 日,这幅图片刊登在温州日报,成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。
案例虽小,管中窥豹,可见一斑。从 2022 年至 2023 年,国内 AI 绘画产业正是从这样微小的案例开始了举世瞩目的产业应用浪潮,从最初的静态图片 走向复杂、交互式的 AIGC 产业应用场景。
2022 年春,国内掀起的 AI 艺术热潮源于海外 A 技术在图像生成领域的革命性进步,以 DiscoDiffusion、Stable Diffusion、Midjourney 等为头部代表的扩散模型(Diffusion Model)开始在数字艺术领域大放异彩!这一关键节点要早于随后大火的 ChatGPT 以及大模型(LLM)风口。因此可以认为,国内第一批全民级大规模参与 AIGC 活动的用户群来自 AI 绘(即文生图)领域。
故事始于 2022 年春天,Disco Diffusion 的开源打开了 AI 绘画的浪潮之门——
2022 年 4、5 月份:AI 绘画只擅长抽象之美或者色彩美学,以令人“眼花缭乱”的色彩涂抹构图向世人展 示出 AI 艺术的别样魅力。这段时期人们常用的工具是 Disco Diffusion 以及 Midjourney 初代版本。
2022 年 6、7、8 月份:AI 绘画开始集中突破绘画的逻辑性和质量,可以逐步写实、产出具有艺术性的作 品。这段时期以 Midjourney 为主要工具代表。
2022 年 9 月份:AI 绘画最重要开源力量 Stable Diffusion 成为社区大热门,且凭借成本低、高质量、高逻 辑性、更强的通用绘制能力以及快速生成等优势迅速占领市场,AI 绘画的艺术质量和逻辑能力开始进入“飞轮式”发展,且 Midjourney 也开始引入其开源技术。
2022 年 10、11 月份:AI 绘画的第一个现象级潮流“二次元模型”横空出世,以 NovelAI 等开源产品和力量为突出代表,进一步蔓延到整个 Stable Diffusion 社区,更多的开源模型和产品加入到这个队伍中,生态力量开始形成。二次元模型的高质量性和现实影响力也令世人展开了对 AI 绘画版权的争议。11 月份,国内 AI 绘画第一波大浪潮启动,抖音迅速推出的“抖音 AI 绘画(二次元)”流量成功辐射数以千万计网民,国内第一波千万级 AI 绘画用户群形成。 2022 年 12 月份:紧接着二次元浪潮,人们仿佛打开了“通往异次元的大门”,开始让三次元、2.5 次元照 进 AI 绘画,于是新一波浪潮“ AI 真人模型”形成。传统互联网上充斥着大量由 AI 生成的“美女”、“真 实场景”、“平行时空新闻”等新形态内容。与此同时,闭源力量 Midjourney 也几近 AI 绘画的艺术巅峰, 各行业的大量设计师与内容工作者群体开始用 Midjourney 生成极高质量且满足现实生产需求的 AI 图片。
2023 年至今:AI 绘画在极高质量、通用逻辑能力、细节完美度以及精准控制层面已经开始大范围“侵蚀”各行各业的生产与消费过程,各产业以及互联网都到处充斥着 AI 生成的内容。第一波 AI 大范围赋能产业的 共识正逐步形成。Stable Diffusion 生态力量和 Midjourney 产品力成为当下人们唯二选择。
我们在 2022 年曾预测,2023 年数以亿计的 AIGC 内容将充斥着整个互联网,绝大多数网民在刷抖音或者小红书时都会在 不知不觉中浏览到 AIGC 内容,占比可能达到 5~10%;以小红书平台为例,都会将疑似 AI 生成的内容打上“疑似包含 AI 创作信息,请注意甄别真实度”的标签以供用户警惕。一时间,泛娱乐场景成为 AI 文生图商业化的“第一阵地”。
面对 AI 绘画一年来指数级的进化速度,2023 年 AI 绘画正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,数以千万甚至上亿计的互联网用户群深受其影响。其中以“摄影模型”和“真人模型”等为代表的“真实世界模型”对现实世界的冲击最为显著,包含商业应用、泛娱乐消费甚至诸多负面影响。
一切都始于 CLIP 开源,CLIP 是一个通过自然语言监督有效地学习视觉概念的神经网络。通过使用 CLIP 可将文本和图像连接在一起。
CLIP(Contrastive Language–Image Pre-training)是文本和图像对照的预训练模型,数据集使用的是 LAION-400M,包含 4 亿组从互联网上收集的文本图像对。文本编码器 提取文本特征,图像编码器提取图像特征,两个放到一起对比相似度,从而让 AI“掌握”文本图像的匹配关系。
2022 年 8 月,AI 绘画最为重要的开源力量 Stable Diffusion 正式向全世 界开放其模型代码、训练数据集、生产内容的版权归属协议。完全自由的开源运动激起了全世界开发者、创业者、产业公司和普通爱好者的热忱, 在短短半个月时间内,SD 的谷歌搜索趋势彻底超越大名鼎鼎的 DALL·E,成为人们谈论 AI 绘画不可规避的话题。SD 的开源也令 AI 巨 头们倍感震惊。
2022 年,Stable Diffusion 的开源发布由两大公司实体驱动,分别是 Stability.Ai 和 RunwayML。二者共同促进了 SD 大版本的成功。
截止 2023 年 7 月份,Stability.Ai 已将 SD 开源版本迭代至 Stable Diffusion XL 1.0(SDXL 1.0)。
SD 所基于的开创性的“潜在空间”(Latent Space)技术将扩散模型 (Diffusion Model)再次推上新的台阶,是 AI 绘画走向大规模商用化的 关键一步(如 latent 空间让快速生成高分辨率图像成为可能,对比之下, 过往的 DALL-E2 和 Google Imagen 则是基于传统的 pixel 空间)。
仅依靠 SD 官方基础版本大模型并不足以产生五彩缤纷的 AI 绘画体验,它只是一 个基础的“通用底子”,需要更多开发者在其之上进行更多样化、更高质量的风格 化训练。便有了以模型广场、精准控制、训练框架为代表的开源模型生态的繁荣。 可以适配千行百业的垂直模型开始涌现,同时也造就了行业应用 AI 的场景涌现。
2023 年初,Stable Diffusion 生态重要控制组件 ControlNet 横空出世,给出了 一条完美解决 AI 绘画发展进程中“精准控制”难题的道路。
该开源技术使用了一种称为 “Conditional Generative Adversarial Networks”(条件生成对抗网络)的技术来生成图像,与传统的生成对抗网络 不同,ControlNet 允许用户对生成的图像进行精细的控制。
例如它将传统意义上的【设计】抽象分解为 AI 或者计算机视野下的【线/轮廓】、【深度】、【语义】、【姿势】 等众多基础原子操作。根据应用场景, 随心所欲地组合这些基本原子和元素, 实现绘制的整体可控性和对大千世界通 用场景的绘制。
腾讯 AI 实验室开源推出的 IP-Adapter 模型为 Controlnet 生态做出了突出贡献,可识别参考图的风格和内容,然后生成相似的作品,且可搭配其他控制器使用。
报告共计:48页
最新发现
相关资讯
中国AIGC产业联盟x无界AI:中国AIGC文生图产业白皮书
AIGC系列深度研究报告:《AIGC专题:中国AIGC文生图产业白皮书》(报告出品方:中国 AIGC 产业联盟 x 无界 AI)人工智能生成内容(AIGC)风靡全球AIGC,即 Artificial Intelligence Generated Content,人工智能
2025-06-25 13:54:15
龙舞光影逐梦起航,2024Al贺新岁,故事接龙StoryStormAI短片大赛,24/2/19截止投稿
龙舞光影 逐梦起航——2024 Al贺新岁故事接龙StoryStorm AI 短片大赛 “龙舞闹春来,光影绘梦开。随着人工智能的飞速发展,我们走进了一个充满无限可能的新时代。我们期待您用Al的魔法,将传统的龙年元素转化为
2025-06-25 13:30:16
映映迎新春AI绘图大赛,24/1/14投稿截止
映映迎新春 AI绘图大赛 一、活动介绍来自映宇宙的新生代虚拟偶像“映映”外表高冷,性格活泼搞怪,出道一年以来,以直播、短视频等形式亮相各新媒体平台,累计曝光突破三千万人次,成为数字人领域的新生
2025-06-25 13:06:15
【1.1819:30】站酷公开课直播:设计师进阶必修之“设计思维”
设计思维36计公开课:“设计思维”(免费)是设计师的高级必修课。2024 01 18 19:30开播讲师:纪晓亮(站酷ID):qouop)网站酷网总编辑 智能时代来了,设计师该走了?相反,我认为智能时代是设计师回归应有位置的
2025-06-25 12:42:15
【1.27北京】大模型智能应用生态大会
1 月 27 日(星期六)由中关村论坛办公室指导,中关村科学城管委会CSDN 联合主办的中国开发者网络 & 8220;大型智能应用生态大会& 8221; 将在北京 · 海淀区隆重举行。中关村论坛成立于 2007 年,以 & 8221; 创
2025-06-25 12:18:15
OpenAI2024头号重磅!GPTStore上线,企业客户新品也跟着来了
周三,OpenAI推出了两款新的产品和服务:GPT Store和ChatGPT Team。先前由于人事的动荡,公司延后了这一功能的推出。图片来源:OpenAI官网截图ChatGPT Team是OpenAI企业产品的较小版本,适用于用户数量少于150名
2025-06-25 11:54:15
今日热榜
国务院国资委:要大力发展人工智能,加快建立适应人工智能发展的体制机制
2025-03-24 13:26:36智汇瓯江,数创未来!2024中国人工智能数字创新大会在温举行
2025-04-02 15:46:08高盛分析:AI对未来石油价格的双重影响与挑战
2025-04-17 12:07:10上海人工智能实验室乔宇:大模型推动交互式创作式阅读
2025-04-28 18:27:58美银三大理由反驳AI巨额投入恐打水漂的担忧
2025-04-29 12:26:15国际劳工组织报告:人工智能加剧全球发展鸿沟
2025-05-01 09:21:38生成式AI学术写作:剽窃边界与应用指南详解
2025-05-01 20:23:58SASE如何重塑网络安全新架构?全面解析SASE技术优势
2025-05-01 22:44:25英伟达在AIGC浪潮中的身份及其影响力
2025-05-03 10:52:11人工智能投资可多些耐心
2025-05-03 14:33:01热门推荐