null - 程序员宅基地

2022，AIGC元年？-程序员宅基地

文｜世昕

编｜石灿

2022年12月16日，Science杂志发布了2022年度科学十大突破，韦伯望远镜当选为年度最大科学突破，可谓实至名归。而在其他入选的科学突破中，AIGC也赫然在列。

这或许是当下最炙手可热的概念了。无论是火遍全网的AI绘画，还是震惊世人的ChatGPT，都属于AIGC这一概念，即生成式AI。凭借着诸多明星技术、产品的问世，谁也没有想到，在元宇宙、web3等概念叱咤风云的2022年里，AI凭借“创作”强势崛起了。

有人认为，AIGC将会改变内容领域的生产方式，带来整个行业的变革，也有人认为AIGC将会取代大多数创作者，带来灾难性的影响。在各种言论甚嚣尘上之时，一个共识似乎悄然达成了，从2022年开始，AIGC将迎来完全不同的发展时期。

2022年，真的是AIGC的元年吗？

AIGC编年史

首先明确一个定义，何为AIGC？

跟PGC、UGC、PUGC等概念一样，AIGC即是指利用人工智能技术生成内容，也就是说内容的制作者从实打实的人或机构变成了AI。

AI绘画最早要追溯2014年，GAN（生成式对抗网络）的诞生。据说人工智能专家Ian Goodfellow在一次酒后想到了这一深度模型概念，基于CNN（深度卷积神经网络），GAN创造性地将两个神经网络进行对抗，即生成器与鉴别器。生成器用于生成“造假数据”，鉴别器用于判断数据的真伪，在两者的对抗中，逐渐演化出强大的“造假能力”，而这种造假能力则用于图像的合成。

GAN之父Ian Goodfellow，图源网络

GAN被称为21世纪最强大的算法模型之一，Ian Goodfellow也一跃成为AI领域最知名的专家之一。2015年开始，GAN开始被投入实际运用中，相关的论文也爆发式增长，也成为AI生成图像、处理图像任务里最常见的存在。

在GAN大放异彩的2015年，一家公司在美国硅谷成立，其背后站着“钢铁侠”埃隆·马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔等一众硅谷大佬，这家公司就是ChatGPT的缔造者——OpenAI。

OpenAI创立的初衷是预防人工智能带来的灾难性影响，推动人工智能发挥积极作用，虽为公司，但OpenAI是一家非营利机构，是马斯克等大佬用爱发电的产物，在创立之初，大佬们投入了10亿美元用于AI的开发。2016年，OpenAI进一步明确了自己的目标，即向AGI（通用人工智能）研究发力，致力于让AI成为改变人类生活的新技术。

OpenAI最大的特点即是“Open”，即开放AI能力，全球研发者都可以通过其提供的开发与研究框架投入AI开发中，共同促进AI技术的发展。也是从2016年开始，OpenAI推出了自己的AI平台Universe。故事轰轰烈烈地开始了。

时间来到2018年，Transformer 架构的发展改变了NLP（自然语言处理）技术的发展，预训练模型的引入改变了一切。GPT系列正是OpenAI在NLP（自然语言处理）领域打造的模型，其第一款产品GPT-1也是在2018年正式推出。GPT-1的独特之处在于“半监督”，在此前的NLP模型中，AI需要基于特定任务对大规模数据集进行学习，而这些数据是需要“监督”的，即人为地对数据进行标注。

GPT-1则可以在开始进行无监督学习的预训练，通过对数据的学习增强语言能力，最后进行部分有监督的微调。简单来说，GPT-1可以用更少的资源和数据进行更具效率的学习，但GPT-1仍旧是青涩的，一方面碍于训练数据的有限，AI的“世界观”很有限，另一方面其性能仍旧不够好，远远达不到对话的能力。

自2018年开始NLP领域迎来了飞速发展，也从某种程度上改变了AI生成图像的未来，也就是AI绘画。

2020年是翻天覆地的一年。彼时，OpenAI推出了GPT-3，相比前两代，这一次GPT实现了进化，GPT-3的参数超过1750亿个，是人脑神经连结的十分之一，与此同时GPT-3的性能也更强，它能够识别更深层次的文本含义，并进行反馈。GPT-3的推出是一场革新。

与此同时，在图像生成领域，一场革命也在发生。尽管GAN已经能生成较高质量的图片及内容，但相较来说，其效率较低，同时生成的图像始终难以令人满意。而Transformer架构的出现改变了一切，自此开始，图像合成领域告别了GAN时代，NLP与计算机视觉技术搭配的新时代来临了。

随后便是我们熟知的故事了。2022年9月，AI绘画爆火，11月30日，ChatGPT横空出世，正式让全世界看到了AIGC的“强大”。

AIGC国内玩家

在OpenAI等行业巨头的带领下，海外AIGC产业正处于一个高速发展时期，那么在国内，AIGC发展到哪一步了？

首先我们需要认识到一个现实，相较于美国，国内AIGC领域的发展是相对滞后的，但近几年来，阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿。

国内AI领域，绕不开的一家公司即是百度。

在五个月前的百度世界大会上，百度CEO李彦宏就着重强调了AIGC，他认为，AIGC不仅能够提升内容生产小笼包，还能创造出有独特价值的独立视角的内容。在世界大会上，百度AI也展示出了自己的实力：在十分钟内复原了《富春山居图》的残卷，其背后依赖的深度学习模型，即是百度的当家模型——文心大模型。

百度AI复原的《富春山居图》，图源网络

文心大模型起源于2019年，是百度深耕预训练模型的产物，其核心特色在于“知识增强”，能够对海量数据进行深度学习，并为多种AIGC应用提供支持。目前为止文心大模型已经发布了超过十多个大模型，形成了一个大模型家族。

在世界大会两个月后的万象大会上，百度还发布了AI助理，根本上是多种AIGC应用的集合，包括文本生成、图片生成，图片转换视频等多种功能，最值得关注的一点是，其直接面向用户与内容创作者，也就是说，AIGC技术的C端应用化正在实现。

AIGC也不止图像生成、文本生成等领域，AI创作同样是多元的，音乐、编程等领域同样在飞速发展。

就在不久前，昆仑万维高调宣布入局AIGC领域，并发布了“昆仑天工”模型。这一成立于2008年的公司早期以游戏代理起家，自2016年起，昆仑万维在海外建立起庞大业务，成为国内知名的出海巨头之一，近年来，昆仑万维更是发力元宇宙社交等领域，而这一进军AIGC，也是早有准备。

自2020年起，昆仑万维便组建了超过200人的AIGC团队，训练集群200张卡，投入数千万元，并在2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是，在很多人忽略的音乐领域，昆仑万维也取得了不错的进展，于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

值得注意的是，昆仑天工选择开源，与百度一样，昆仑万维坚信开源能够给AIGC带来更长效的发展力，并致力于降低AIGC技术的使用门槛，让AI能够帮助更多内容创作者。

除了以上提到的这两家公司外，在国内AIGC领域，垂直赛道的初创公司也势头正劲，覆盖AI音乐、虚拟人、AI音频语音、AI游戏等领域。

但另一个事实也同时存在，相较于OpenAI等海外巨头，国内AIGC领域公司仍存在较大的差距，一方面在组织架构方面，国内基本都基于公司自身的科研团队，而OpenAI等组织更类似一个研究院，能够通过开放共享的模式吸纳全球顶尖科研人才。

另一方面，国内AIGC相关公司面对的营收压力客观存在，很难像OpenAI等平台不计成本的进行投入。但伴随着AIGC逐渐成熟的商业化以及更广泛的应用，或许国内AIGC领域即将迎来春天。

为何元年？

回到最开始的那个问题，2022年为何会被看作AIGC的元年？

其实深入了解AI绘画与ChatGPT就能理解这一说法：

2022年8月，人工智能公司Stability AI推出了AI文生图模型Stable Diffusion（扩散模型），将AI图像生成的效率与精度提升到了前所未有的量级，在最基础的终端设备上，只需输入关键词，就能生成高质量的AI图像，几乎让整个世界为之疯狂。AI绘画的爆发式发展也第一次让C端感受到了AIGC的强大魅力。

而ChatGPT的到来更令人震惊。作为基于GPT-3.5的对话式AI，ChatGPT最大的特点即是能够“理解”对话者的语义，能够进行更有效的反馈，并进行连续对话。基于对超大规模数据的深度学习，ChatGPT在文本生成领域几乎能“以假乱真”，让你认为其真的拥有了意识。此外，ChatGPT不仅能答疑解惑，还能写故事、作诗，甚至编程，生成内容的能力空前提高。

AIGC元年的秘密就藏在这两个模型里。

第一，在性能上，AI已经实现了“进化。相比以前的GAN图像生成模型，Stable Diffusion最大的特点就在于精准，只要输入对关键词，其就能产生较为接近的图像结果，这是此前的图像生成很难做到的。ChatGPT也同样是高性能的，有人几乎把它当做了谷歌一样的搜索引擎，正是在于其对于文本的深度分析并能够生成较为精确的反馈。而各种生成内容则进一步显示了其性能的强大。

第二则在于“理解”。这点在ChatGPT上体现的更加明显，相比此前的对话AI，人们惊奇的发现，ChatGPT似乎能够理解文本更深层次的含义，无论是连续流畅的对话，还是对于错误想法的纠正，都让人感觉到对面的AI似乎是有思想的，尽管其只是类似“中文屋”的深度学习的产物，但强化学习模型的加入会让其不断进化，对话任务也完成的更加出色。

最后则在于更大范围的应用。相比于此前的“圈内狂欢”，2022年的AIGC真正做到了全民关注，这是技术飞速发展下的产物，以Stable Diffusion为例，其最大的特点即是低门槛，不需要多强大的显卡与服务器，最普通的PC就能完成任务。同时平台的封装也让AIGC更加“平易近人”，AI绘画仅需要输入关键词，ChatGPT也只需要网页和提问栏就能实现对话，这让普通人接触AIGC的机会大大增加了。

AIGC在2022年的火爆，是技术积累与发展策略双重变革的产物，从某种角度来看，称之为元年也并不为过，只不过2022年更应该是AIGC的“应用元年”。

AIGC也还有很长的路要走。一方面，在“创造”这一概念面前，基于深度学习的AI的创作是否真正是创造还难以定论，另一方面知识产权问题也像一把达摩克利斯之剑始终悬在AIGC头上，如何解决AI学习背后的伦理问题也是一大难题。

但在AI技术的发展问题面前，以上问题可能都是细枝末节了。正如OpenAI等平台所期望的那样，AIGC并不是最终目的，真正实现通用人工智能才是最核心的目标。

中文推特：https://twitter.com/8BTC_OFFICIAL

英文推特：https://twitter.com/btcinchina

Discord社区：https://discord.gg/defidao

电报频道：https://t.me/Mute_8btc

电报社区：https://t.me/news_8btc

本文链接：https://blog.csdn.net/weixin_44383880/article/details/128379599

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

oracle 12c 集群安装后的检查_12c查看crs状态-程序员宅基地

文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下：http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态：[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态

解决jupyter notebook无法找到虚拟环境的问题_jupyter没有pytorch环境-程序员宅基地

文章浏览阅读1.3w次，点赞45次，收藏99次。我个人用的是anaconda3的一个python集成环境，自带jupyter notebook，但在我打开jupyter notebook界面后，却找不到对应的虚拟环境，原来是jupyter notebook只是通用于下载anaconda时自带的环境，其他环境要想使用必须手动下载一些库：1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境

国内安装scoop的保姆教程_scoop-cn-程序员宅基地

文章浏览阅读5.2k次，点赞19次，收藏28次。选择scoop纯属意外，也是无奈，因为电脑用户被锁了管理员权限，所有exe安装程序都无法安装，只可以用绿色软件，最后被我发现scoop，省去了到处下载XXX绿色版的烦恼，当然scoop里需要管理员权限的软件也跟我无缘了（譬如everything）。推荐添加dorado这个bucket镜像，里面很多中文软件，但是部分国外的软件下载地址在github，可能无法下载。以上两个是官方bucket的国内镜像，所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn

Element ui colorpicker在Vue中的使用_vue el-color-picker-程序员宅基地

文章浏览阅读4.5k次，点赞2次，收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了，例如：这里的:sty..._vue el-color-picker

迅为iTOP-4412精英版之烧写内核移植后的镜像_exynos 4412 刷机-程序员宅基地

文章浏览阅读640次。基于芯片日益增长的问题，所以内核开发者们引入了新的方法，就是在内核中只保留函数，而数据则不包含，由用户（应用程序员）自己把数据按照规定的格式编写，并放在约定的地方，为了不占用过多的内存，还要求数据以根精简的方式编写。boot启动时，传参给内核，告诉内核设备树文件和kernel的位置，内核启动时根据地址去找到设备树文件，再利用专用的编译器去反编译dtb文件，将dtb还原成数据结构，以供驱动的函数去调用。firmware是三星的一个固件的设备信息，因为找不到固件，所以内核启动不成功。_exynos 4412 刷机

Linux系统配置jdk_linux配置jdk-程序员宅基地

文章浏览阅读2w次，点赞24次，收藏42次。Linux系统配置jdkLinux学习教程，Linux入门教程（超详细）_linux配置jdk

随便推点

matlab(4)：特殊符号的输入_matlab微米怎么输入-程序员宅基地

文章浏览阅读3.3k次，点赞5次，收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图：_matlab微米怎么输入

C语言程序设计-文件(打开与关闭、顺序、二进制读写)-程序员宅基地

文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件，可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中，对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数，而关闭则使用fclose函数。在C语言中，可以使用fread和fwrite函数进行二进制读写。‍ Biaoge 于2024-03-09 23:51发布阅读量：7 ️文章类型：【 C语言程序设计】在C语言中，用于打开文件的函数是____，用于关闭文件的函数是____。

Touchdesigner自学笔记之三_touchdesigner怎么让一个模型跟着鼠标移动-程序员宅基地

文章浏览阅读3.4k次，点赞2次，收藏13次。跟随鼠标移动的粒子以grid（SOP）为partical（SOP）的资源模板，调整后连接【Geo组合+point spirit（MAT)】，在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in（CHOP)鼠标位置到metaball的坐标，实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动

【附源码】基于java的校园停车场管理系统的设计与实现61m0e9计算机毕设SSM_基于java技术的停车场管理系统实现与设计-程序员宅基地

文章浏览阅读178次。项目运行环境配置：Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成，B/S模式 + Maven管理等等。环境需要1.运行环境：最好是java jdk 1.8，我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计

Android系统播放器MediaPlayer源码分析_android多媒体播放源码分析时序图-程序员宅基地

文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多，会从Java-&amp;gt;Jni-&amp;gt;C/C++慢慢分析，后面会慢慢更新。另外，博客只作为自己学习记录的一种方式，对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析时序图

java 数据结构与算法 ——快速排序法-程序员宅基地

文章浏览阅读2.4k次，点赞41次，收藏13次。java 数据结构与算法 ——快速排序法_快速排序法