AIGC全称为AI-Generated Content,即利用人工智能技术来生产内容,在创意、表现力、创作速度、迭代、传播等方面都具有显著的技术优势,已经成为继PGC(专业生产内容)和UGC(用户生产内容)之后新型的内容创作方式。其中,AI绘画是AIGC的重要分支。
2022年8月,AI绘画作品《太空歌剧院》在美国科罗拉多州举办的新兴数字艺术家竞赛中获得了“数字艺术”类别的一等奖,该作品通过AI绘画应用Midjourney生成,获奖者仅是在生成绘画的基础上用Photoshop对作品进行调整。
此事引发了热议,AIGC进入大众视野,受到广泛关注。2021年以前,AIGC还是以文字生成为主,2022年开始AIGC发展迅速,年初还处于技艺生疏阶段,几个月之后就达到专业级别,可以处理的格式也从最初的文字内容到现在囊括文字、图像、视频、语音、代码、机器人动作等多种内容形式,包罗万象。
(资料图)
而AIGC能够呈现指数级的发展增速,得益于深度学习模型的不断完善、开源模式的推动以及数字内容供给需求的不断增长。AIGC最初可生成的内容形式以文字为主,经过2022年指数级的发展增速,目前可生成的内容形式已经得到了扩展,囊括文字、图像、视频、语音、代码、机器人动作等多种内容形式,包罗万象。
Diffusion推动AIGC突破性发展
最早出现的深度学习模型是“对抗生成网络”GAN,它有明显的不足,即对输出结果的控制力较弱、容易产生随即图像、生成图像分辨率较低及生成的图像是对现有作品的模仿,难以创作出新图像。
2021年出现的CLIP模型能够同时进行自然语言理解和计算机视觉分析,实现图像和文本匹配,并且利用互联网图片进行了巨量的文本-图像匹配训练,为后续AIGC应用的落地打下了基础。
2022年深度学习模型Diffusion扩散化模型的出现,直接推动了AIGC技术的突破性发展。Diffusion模型有两大突破,首先,通过增加噪声破坏训练数据来学习,使得模型可以从随机输入中合成新的数据。
其次将模型的计算空间降维到一个可能的低维空间里,大幅降低计算量和计算时间,提升模型的训练效率。
海外AIGC应用带动行业发展
作为AIGC以及全球人工智能领域的领头羊,Meta和Google在AIGC最能体现算力实力的视频应用场景上也早早进行了布局。Meta于2022年九月发布了新款AIGC系统Make-A-Video,而谷歌则是推出了Imagen Video来完善其AI产品线。
Meta推出的Make-A-Video是一款直接文字输入即可生成短视频的AIGC系统,系统生成视频画面准确率高,仅需一段简单的文字描述即可生成一段生动的视频。背后的AI系统更是通过日积月累的用户指令来丰富系统创作的想象力。
而谷歌的Imagen Video则是在作品的清晰度,真实性,创作视频所需时间上都略胜一筹,谷歌背后强大的算力数据支持以及较为庞大的AI智能用户数量成为了关键因素。相较海外,我国AIGC相关应用还处于早期阶段。并主要以输入文字描述,计算机生成图像作品为主。相较于PGC与UGC,AIGC能更好的满足人类对生产效率,生产质量甚至生产创意的需求。
但是其在硬件端例如计算机算力的高门槛以及在软件端例如AI智能算法模型,自然语言处理技术等方面都有着较高的要求。使得行业技术壁垒较高,国际科技巨头企业带动全球AIGC行业发展成为大势所趋。
我国AIGC相关企业
视觉中国:
公司目前提供4亿张图片、3000 万条视频和35万首音乐等可销售的各类素材,是全球最大的同类数字版权内容平台之一。2016年收购比尔盖茨创立的全球知名图片库Corbis资产,2018年收购并经营位于加拿大的全球领先的摄影师社区500px。
公司聚集了来自近200个国家和地区的1700余万名优秀摄影师和摄影爱好者的500px社区,将于11月22日13点在元视觉上线500px摄影师通过和AIGC协作创作的数字艺术品,以最大化凸显优质影像作品的经济价值和社会价值。
视觉中国依托海量资源,构建模型训练核心优势。通过互联网版权交易平台提供亿级的高质量、专业性的图片、视频及音乐素材,更方便进行深度学习算法的训练和优化,在模型训练中具有独特优势,有望构筑AIGC竞争力。
蓝色光标:
2022年是蓝色光标确立数据科技发展战略的第10个年头,把握住每一个技术节点的跃进,是其转型战略得以顺利推进的重要原因之一。2020年,蓝标发布了自主研发的全新智能营销产品销博特,通过AI赋能创意,并在此后不断升级,智能创意亦成为其重要场景功能之一。
蓝色光标销博特的项目负责人洪磊认为,销博特等智能创意工具,是创意团队在进行头脑风暴过程中的灵感发散的重要支持,同时加速了团队的提案效率;机器学习或者AI创意更多被理解为团队“创意工作台”,即作为推动生产的辅助协作平台。
拓展AIGC内容范围,确立行业领先地位。2021年,公司销博特全新上线AI易稿模块,辅助营销人员轻松写作,用户只需输入公司、产品、行业、标题四项关键内容即可一键生成新闻草稿;此外,还能轻松创作虚拟人配音的可“聆听”的新闻稿件音频版。
近期,公司进一步推出“创意画廊”,利用AIGC算法试生产不同风格的抽象画作,适配营销活动场景,例如活动海报制作。该抽象画平台具有一键生成的特点,也被称为“康定斯基模型”。用户使用“康定斯基模型”输入文本,即可在6分钟内生成一幅抽象画作。该模型的诞生标志着公司AIGC所涉领域进一步拓展,能力范围从原有AI写作拓展到AI绘画。
中文在线:
公司应用 TTS 技术,通过捕捉声纹,人工智能做情感标识,产出高质量仿真语音,极大加速了网络文学到音频内容的生产能力,扩充了内容传播的渠道。公司的“AI主播”以全球领先的神经网络设计和先进的深度学习合成器为依托,实现了单播、双播、多人播制作方式,支持制作玄幻、悬疑、武侠、历史、言情等不同类型的作品,实现旁白、角色音的区分,演绎更丰富、贴合剧情。
2021年,AI 主播录制作品有《正义的使命》、《唐朝地主爷》等超两千部作品,作品在喜马拉雅、蜻蜓 FM 等各大平台上线后,深受用户好评。 “AI主播”节约成本,每天单机生产速度超500万字,生产效率远高于人工主播,录制成本则可节约90%以上,并保证录音品质保持在统一标准。
AI辅助创作功能全面推行。公司以内容为基石,深耕数字内容,助力平台作者。公司已推出AI绘画功能和AI文字辅助创作功能,其中AI文字辅助创作功能已上线,该功能已向公司旗下17K文学平台全部作者开放。通过深度结合作者的真实写作场景,创作者在使用AIGC功能时,可以针对不同的描写场景填写关键词和辅助短语,随即生成对应的文字内容描写,提高写作效率。
在对人物、物品等进行AI辅助创作时,可以针对不同的作品类别如古风、都市等进行语言调整,从而带来最佳的内容产出体验,大幅提升创作效率和内容的可读性。
昆仑万维:
昆仑万维旗下StarX是海外社交娱乐领域头部平台,其主打产品StarMaker在音频社交领域处于龙头地位,以K歌为抓手,进一步切入语音房、直播、休闲游戏等在线娱乐场景,凭借海量的曲库资源以及丰富多样的在线娱乐方式,推进社交互动功能。并截至1H22,StarMaker累计在102个国家音乐/音频类畅销榜排名前五,其中84个国家位列第一,累计在100个国家音乐/音频类下载榜排名前五,其中77个国家位列第一。
目前StarX已经围绕“音乐+社交”的核心发展思路,积极渗透AIGC及VR/AR等领域。初入AIGC领域表现亮眼。此外公司借助AI技术实现降本增效,1H22旗下StarX MusicX Lab音乐实验室完成并发布首批五首完全由AI作曲的歌曲,目前这五首歌曲已在Spotify、SoundCloud、QQ音乐和网易云音乐等海内外180余个音乐平台上线。
今年三季度再推10首新作AI歌曲。AI作曲在为StarMaker提供海量音乐作品的同时,亦可进一步增强应用的可玩性和功能性,帮助平台内广大音乐爱好者和独立音乐人大幅降低创作门槛,有效缩短创作周期,产出更多优质内容。
同时,在商业化方面也取得了初步进展,公司方面表示已经接到采购AI创作歌曲的意向。公司的长期目标依托成熟专业的全链路音乐制作和发行能力,向全球输出高质量的AI创作内容。