海量研报在线阅读 高效提升商业认知
2023AIGC市场研究报告及ChatGPT推动的变革趋势与投资机会
2023-02-27
出品机构:甲子光年智库
研究团队:张一甲、宋涛
发布时间:2023.02
Part 01 人工智能的概念与界定
P02
Part 02 人工智能的技术演进与趋势
P06
Part 03 ChatGPT带来的变革趋势
P26
Part 04 AIGC风口下的投资机会
P41
现在一说起人工智能的起源公认是1956年的达特茅斯会议殊不知还有个前戏1955年美国西部计算机联合大会
Western Joint Computer Conference在洛杉矶召开会中还套了个小会:学习机讨论会Session on Learning
Machine)讨论会的参加者中有两个人参加了第二年的达特茅斯会议他们是塞弗里奇(Oliver Selfridge)和纽厄
尔(Allen Newell)。塞弗里奇发表了一篇模式识别的文章而纽厄尔则探讨了计算机下棋他们分别代表两派观点
讨论会的主持人是神经网络的鼻祖之一皮茨(Walter Pitts),他最后总结时说:
“(一派人企图模拟神经系统,而
纽厄尔则企图模拟心智(mind)……但殊途同归。”这预示了人工智能随后几十年关于结构与功能两个阶级两条
路线的斗争。
——尼克《人工智能简史》
曾经建制派被看作唯一的主导力量”,“逻辑驱动的人工智能曾主宰数十年彼时人们相信依据逻辑的程序是
简单的为了抵达智能科学家们为每个不同问题编写不同程序纷纷变成劳动密集型工种但人们低估了现实世
界的复杂度问题越大程序越复杂逐渐错误百出频频崩溃使这条路进展缓慢;另一派野路子便是深度学习
作为跨学科产物深度学习不追求解释和逻辑以神经网络开启了暴力美学大门——计算机从数据中学习进化
让人工智能变成“数据密集型”学科,最终从应用表现中大幅胜出,主宰当今人工智能世界。
——《甲小姐对话特伦斯:进化比你聪明》
1.1 人工智能源起
三大学派:路线相爱相杀,理念相辅相成,一斗六十年
又称:逻辑主义、心理学派或计算机学派。
原理:物理符号系统 (即符号操作系统) 假设和有
限合理性原理。
起源:源于数理逻辑/逻辑推理。
学派代表:纽厄尔、西蒙和尼尔逊等。
主张:将符号作为人工智能的基本元素人工智
能的运行建立在由符号构成的数理逻辑之上。
又称:仿生学派或生理学派。
原理:神经网络及神经网络间的连接机制与学习
算法。
起源:源于仿生学,特别是人脑模型的研究。
学派代表:麦克洛奇、皮茨、 霍普菲尔德、鲁梅
尔哈特等。
主张:试图使机器模拟大脑通过建立一个类似
于人脑中神经元的模拟节点网络来处理信号。
又称:进化主义或控制论学派。
原理:控制论及感知—动作型控制系统。
起源:源于控制论。
学派代表作:布鲁克斯的六足行走机器人一个
基于感知-动作模式的模拟昆虫行为的控制系统
主张从还原论的立场出发放弃对意识的研究
专注于人和动物等有机体行为的研究。
联结主义(Connectionism符号主义(Symbolism
行为主义(Actionism
1.2 人工智能的六大学科
人工智能主要包括六大学科,当下业界讨论往往聚焦机器学习这一学科
计算机视觉
自然语言
理解与交流
认知与推理 机器人学 博弈与伦理 机器学习
暂且把模式识别、
图像处理等问题
归入其中
暂且把语音识别、
合成归入其中,
包括对话
包含各种物理和
社会常识
机械、控制、设
计、运动规划、
任务规划等
多代理人agents
的交互、对抗与
合作,机器人与
社会融合等议题
各种统计的建模、
分析工具和计算
的方法
感知、认知、
决策
人类情感、伦
理与道德观念
认知、决策感知、认知、
决策、学习、
执行
感知、认知、
决策、学习、
执行和社会协
作能力
感知、认知、
决策、学习、
执行和社会协
作能力
p 机器学习之所以如此火爆,是因为它是一种可以让计算机自动学习和改进的技术。
p 与传统的程序设计方法不同,机器学习允许计算机从数据中学习规律和模式,并在未知数据上进行预测和决策。这使得机器学习在各种领域
都具有广泛应用前景,包括自然语言处理、计算机视觉、机器人技术、金融、医疗、电子商务等等。
机器学习火热背后的原因:
数据量的爆炸式增长:随着数字化时代的到来人类生产的
数据量正在呈指数级增长这些数据中蕴含着很多宝贵的信
息,而机器学习可以通过对这些数据的分析和学习发现其
中的规律和模式,并将其应用于各种领域。
计算能力的提高:随着计算机硬件和软件技术的不断发展
计算能力越来越强能够处理大规模的数据和复杂的算法
这使得机器学习变得更加高效和实用。
开源框架的出现:出现了许多优秀的机器学习框架
TensorFlowPyTorch它们不仅提供了丰富的工具和算
法,而且是免费开源的使得机器学习技术更加普及和易用
商业应用的需求:机器学习技术在商业应用中也有广泛的应
用,如推荐系统广告投放欺诈检测等等这些应用在商
业领域中起着至关重要的作用推动了机器学习技术的快速
发展。
六大学科是七种能力的排列组合:
①感知、②认知、③决策、④学习、⑤执行、⑥社会协作能力(人机交互),⑦符合人类情感、伦理与道德观念
1.3 人工智能的七种能力
AI七大关键能力在进化中逐步扩展累积,逐步“解放大脑”
p 人工智能的出现,意味着具有自主的感知、认知、决策、学习、执行、社会协作能力,符合人类情感、伦理与道德观念的智能机器逐步浮现,成
为帮助人类提高生产能力和效率的新型工具。
p 与人类几千年来创造出来的各种“解放四肢”的工具和机器不同,其是一类逐步“解放大脑”的工具。
1956 1974 1980 1987 1995 2013 2020 2021 2022
2023
2025
AI能力
感知
认知
决策
学习
执行
社会
协作
情感
伦理
图:不同时期AI侧重能力进化路线
决策
+认知
+学习
+感知
+
社会协作
(交互)
+执行
+
情感?
备注:此处的认知属于狭义的认知,更偏向于判断和推理。
七大能力之间存在阶段性侧重和先后关系,但同时也是相
互关联、相互作用的,不断地相互影响和改进。
感知是智能机器获取外界信息的基础。智能机器需要
通过传感器、摄像头等设备收集、处理、分析环境中
的信息,以便更好地理解周围的环境和物体。
认知和决策能力是智能机器进行智能处理和决策的基
础。通过分析、理解和推理数据和信息,智能机器可
以更好地判断和决策,以便更好地执行任务。
学习能力是智能机器不断优化和改进的基础。通过不
断地从数据和经验中学习,智能机器可以自我改进和
适应,更好地适应不同的环境和任务。
执行能力是智能机器实现任务的基础。智能机器通过
控制执行机器人等设备完成任务。
社会协作能力是智能机器与人类和其他机器进行合作
的基础。智能机器需要通过自然语言处理和其他技术,
与人类进行交互和合作,以便更好地实现任务。
Part 01 人工智能的概念与界定
P02
Part 02 人工智能的技术演进与趋势
P06
Part 03 ChatGPT带来的变革趋势
P26
Part 04 AIGC风口下的投资机会
P41
2.1 AI技术的演进历程
AI技术演进已经历四个阶段,如今正向全AI能力覆盖方面演进
1956 1974 1980 1987 1995 2013
时间
AI能力
2020 2021 2022
感知
认知
决策
学习
执行
社会
协作
情感
伦理
2023
2025
图:AI能力进化路线下的技术演进路径
p 人工智能从出现到现在已经历四个阶段,第一个阶段的AI是以逻辑推理为主,AI能力以聚焦决策和认知为主;第二个阶段的AI则是注重以概率统
计的建模、学习和计算为主,AI能力开始聚焦感知、认知和决策;第三个阶段的AI聚焦学习环节,注重大模型的建设,AI能力覆盖学习和执行;
第四个阶段则聚焦执行与社会协作环节,开始注重人机交互协作,注重人类对人工智能的反馈训练,当下正处于此阶段。
p 短期的未来,AI会携带多种能力走向千行百业;长期的未来,仍有很多待解问题,比如:是否会产生情感?
逻辑推理为主,聚焦决策、认知能力 产生情感?
聚焦学习环节,
大模型
聚焦执行与社
会协作环节
以概率统计的建模、学习和计算为
主,聚焦感知、认知、决策
逻辑
推理
机器
学习
深度
学习
Transfo
rmer
神经网
GPT3
ChatGPT
分解为
五大学科
2.2 AI技术宏观演进趋势:合久必分、分久必合
从混沌到分科再到归一,呈现多模态多学科融合归一趋势
p 纵观人工智能技术发展的70年历程,AI技术宏观趋势呈现出由混沌唯一走向分化,然后再走向归一的趋势
p 在人工智能发展的前30年,人工智能技术是出于一个混沌状态,并未形成完整的学科和研究领域,从80年代末开始逐步分化形成五大研究领域,
但随着技术的发展,从2013年开始各大学科又开始逐步融合,未来将实现多模态融合和多学科融合归一的趋势。
1956 1974 1980 1987 1995 2013
时间
AI能力
2020 2021 2022
逻辑
推理
机器
学习
深度
学习
Transfo
rmer
感知
认知
决策
学习
执行
社会
协作
情感
伦理
神经网
2023
2025
GPT3
ChatGPT
计算机视觉
认知科学
机器人学
自然语言理解
机器学习
图:AI能力进化路线下的技术演进路径
图:AI能力的进化路线
混沌状态
分化为五大学科
五大学科归一
2.2 AI技术宏观演进趋势:范式变迁
当下数据、算力、范式一路向“大”,未来不一定
p 人工智能研究构架在1987-2020年之间的主导逻辑是大数据、小算力、专用决策范式。GPT-3的出现改变了这一切,让大数据、大算力和通用范
式成为典型模式。
p 值得关注:未来人工智能研究的认知构架是否会往大数据、小算力、通用小范式方向转变?
图:AI能力的进化路线
1956 1974 1980 1987 1995 2013
时间
AI能力
2020 2021 2022
逻辑
推理
机器
学习
深度
学习
Transfo
rmer
感知
认知
决策
学习
执行
社会
协作
情感
伦理
神经网
2023
2025
GPT3
ChatGPT
计算机视觉
认知科学
机器人学
自然语言理解
机器学习
大数据
+
小算力
+
专用范式逻辑推理为主
大数据
+
大算力
+
通用范式 大数据
+
小算力
+
通用小范式
2.2 AI技术宏观演进趋势:大模型一定越大越好吗?
Yes and NoAI预训练模型规模呈指数级速度增长,未来或将触达规模法则上限
圣塔菲研究所前所长Geoffrey West在科普书《规模
中揭示了规模法则scaling law)。West眼中,有
一种不变的标准可以衡量看似毫无关联的世间万物——
无论是生物体的体重与寿命还是互联网的增长与链接
甚至是企业的生长与衰败都遵循规模法则规模法则
关心复杂系统的特性如何随着系统大小变化而变化。
以规模法则的视角看待ChatGPT背后的大模型一个
然问题是:模型一定是越大越好吗如果数据量足够大
算力足够充沛,是否AI的效果会持续上扬?
面对这个问题,业界多方的答案是Yes and No
- Yes观点人认为,现在的“大”仍不足够大
- No观点人认为大模型虽好但其性能有一个上限
虽然这个上限尚不明确
2018年6月 2018年10月 2019年2月 2019年7月 2020年6月 2021年12月 2023年2月 2025年 2030年 2035年 2040年 2050年 2055年 2060年
GPT-1
1.17亿
图:AI预训练模型的参数规模呈现走势
15万亿?
30万亿?
100万亿?
规模法则:
上限在哪里?
XXX万亿?
新版BERT
4810亿
GPT-3
1750亿
Facebook
94亿
GPT-2
15亿
BERT-Large
3.4亿
阿里新M6
10万亿
规模法则AI预训练模型参数规模呈现指数级速度增长,未来仍面临规模法则
2.2 AI技术宏观演进趋势:通用人工智能
p 通用人工智慧(Artificial General Intelligence)或强人工智慧(Strong AI)是具备与人类同等智慧、或超越人类的人工智慧,能表现正常人类
所具有的所有智能行为。
p 通用人工智能是人工智能的重要目标之一但不一定是AI的终极目标例如某些研究人员认为人工智能的终极目标应该是创造具有意识和主
观体验的人工智能系统,而不仅仅是模拟人类的认知和行为。因此,人工智能的终极目标可能会随着科技和人类认知的发展而不断改变和进化。
七大AI能力的融合正在推动AI逼近人工智能的重要目标之一:通用人工智能
决策式AI是基于规则、知识或经验,通过对输入数据进行分析和
推理,从而做出决策或推荐的人工智能系统。这种AI通常用于专
业领域,例如医学、金融、法律等,其目的是为了支持决策过程
和提高决策效率。
生成式AI是基于机器学习或深度学习等技术,从大量数据中学习
并生成新的数据或内容的人工智能系统。这种AI通常用于自然语
言处理、图像处理、音频处理等领域,其目的是为了生成高质量
的内容和实现自动化创作。
通用型AI是指具有类似人类智能的广泛能力的人工智能系统,可
以像人类一样进行感知、推理、学习、决策、规划等多种任务,
能够在不同的领域和情境中灵活地应对和适应。这种AI是人工智
能的终极目标之一,目前还没有实现。
三种人工智能系统之间存在重叠和互补。例如,在决策过程中,
决策式AI可以提供基于规则和知识的决策支持,生成式AI可以提
供基于数据的决策参考,通用型AI可以综合考虑多种因素做出更
为智能的决策。
AI
时间
感知
侧重决策式AI
认知
决策
学习
执行
社会
协作
图:AI能力进化曲线
情感
伦理
2013
1956
2020
2023
2030
侧重生成式AI
侧重通用型AI
2.2 AI技术宏观演进趋势:通用人工智能
p ChatGPT是一种通用性很强的大型语言模型,它被训练用于多种自然语言处理任务,例如文本生成、文本分类、语言翻译、问答等。
p 虽然ChatGPT在很多自然语言处理任务上表现出了惊人的能力和表现,但严格意义上讲,它并不是一个通用人工智能系统。
p 但由于其效果足够“像人”, ChatGPT成为很多人心中通用人工智能的雏形。
七大AI能力的融合正在推动AI逼近人工智能的重要目标之一:通用人工智能
AI
时间
感知
决策式AI 生成式AI
认知
决策
学习
执行
社会
协作
图:AI能力进化曲线
情感
伦理
2013
1956
2020
通用型AI
2023
2030
ChatGPT属于生成式AI
ChatGPT是一种基于自然语言处理技术的生成式AI模型,能
够生成类似于人类对话的文本输出。它使用了大规模的预训
练语言模型,能够自动地从输入的文本中学习语言模式和上
下文信息,然后基于这些信息生成新的文本。因此,它被广
泛应用于对话系统、聊天机器人、智能客服等领域。
生成式AI又可称为AIGCAI-Generated Content 人工智
能生成内容)。
2.3 AIGC:集合三要素、发展三阶段
AIGC在当下的火热来自三要素逐步走向成熟,推动行业进入应用落地阶段
数据
数据巨量化
AIGC
认知交互力
算法
跨模态融合
算力
内容创造力
数据层面
核心技术突破
多模态认知计算
数字孪生 虚拟现实
全息立体
应用场景
算法层面
感知+交互
大数据语料库
高精度训练集
标注
训练
计算任务
算力层面
硬件算力
智能交互
实时算力
边缘计算
云计算
本地化
AIGC的本质是内容与场景,其发展需要AI与后端
基建,算法、算据和算力三要素耦合共振。
AIGC的三大发展阶段是:
模型赋智阶段(从现实生成数字)AIGC利用AI
技术构建模拟现实世界的数字孪生模型;
认知交互阶段(从数字生成数字):AI能够学习
并创作更丰富的内容;
空间赋能阶段(从数字生成现实):AIGC基于物
联网,多模态技术获取多维信息,实现更加智能
的人与机器互动。
2.4 AIGC技术架构体系
p 在百度李彦宏发布的内部信中提到,人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和
应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。
p 甲子光年智库认为当下的技术全栈仍然不能满足ChatGPT推动下的新一代人工智能浪潮,未来的AI技术全栈将呈现新的技术架构体系。
AIGC技术架构体系的变迁
芯片层
操作系统层
应用层
芯片层
模型层
应用层
框架层
算力层
基础层/模型层
应用层
平台层
中间层
过去AI技术全栈
当下AI技术全栈 未来AI技术全栈
2.4 AIGC技术架构体系
p 未来,基础大模型将会逐步走向统一,形成寡头格局,开发人员将基于这些基础模型研发AI应用。
p 大模型的商业模式是MaaSModel as a Service):某家公司/某主体/某联合体开发出一个大型语言模型,然后开放API供他人使用。
p 甲子光年智库认为,未来在基础模型和具体AI应用研发之间会形成中间层:出现一批专门负责调整大型模型以适应具体应用需求的初创企业。
在大模型与应用层之间需要一个中间层:向下对接大模型能力,向上提供个性化服务
NLP
零售
金融
教育
医疗
应用层
中间层
基础层
大模型:通用模型
大数据:数据规模大,追求广度
大算力:算力需求高
高投入:高成本投入,训练成本高
高能耗:高能源消耗
中小模型:专用模型
小数据:不追求数据规模,而追求数据深度和专业度
中算力:算力需求中等,不依赖超算能力
低投入:训练成本投入较少
低能耗:能源消耗较少
微模型:个性化模型
微数据:追求数据专业度和个性化需求
小算力:算力需求小,边缘算力即可满足
低投入:训练成本投入较少
多样化:满足千行百业需求,多样化、场景化、定制化
NLP CV
多模
CV
医疗
教育
制造
金融
零售
聊天机
器人
场景1
金融
智能
客服
场景2
医疗 诊断
场景2
教育
数字
场景2
XX XXX
场景X
多样化、个性化、场景化的应用落地
向应用层提供专业、垂直的训练模型
向基础层调用大模型能力,并反哺预
训练模型
大基础模型服务
MaaS服务模式
图:AIGC算法层技术架构拆解
2.4 AIGC技术架构体系
p 甲子光年智库认为,AIGC将形成类似云计算的生态结构:只有足够“包罗万象”,才能支撑前端足够的“奇形怪状”。
AIGC技术架构分为算力层、平台层和算法层,算法层又分为基础、中间、应用三层
算力层
算法层
AI芯片及处理器
平台层
AIDC智算中心 AI传感器
模型生产
训练平台 数据平台
数据采集 数据清洗 数据标注 数据合成 数据鉴真
基础层
NLP大模型 CV大模型 多模态大模型 ……
中间层
金融+文本 医疗+图像 航天+3D ……零售+多模态
应用层
智能客服 聊天机器人 元宇宙 搜索引擎
数字人 教育 ……
音/视频大模型
图:AIGC技术架构体系
只有足够“包罗万象”,才能支撑前端足够的“奇形怪状”。
2.5 AIGC驱动力与制动力
三要素外,核心制约来自成本问题、数据质量问题、知识产权问题、能耗问题、安全问题
AIGC发展驱动力与制动力
重要的市场驱动力
政策
资金
人才
算力
数据
算法技术
AI
影响发展的制动力
算力不足
数据质量
投入成本高
知识产权归属
能源消耗大
安全与伦理
2.6 ChatGPTAI技术演进历程中的地位
ChatGPT的出现代表AI技术的第三次范式升级:从大模型走向AGI
GPT3
ChatGPT
基于手写规则
处理少量数据
可找到一些函数与参数
分类数据
像人脑一样学习
根据大量数据分类学习一
个复杂的参数集合
优化人脑学习过程
关注重点而非全部
使用海量学习数据
不需要提前进行标记和分类
人类对结果的反馈成为学习
过程的一部分
能否打破人脑结构限制?
有无可能生成情感?
1950 1980 2006 2017 2020 2022 2023
GPT2GPT1
2018 2019
M2m-100BARTT5
XLMRoBERTaBERT
InstructGPT
BigBird
ALBERT
逻辑推
机器学
神经网
Transform
er
ELECTRA
技术发展阶段
(少量应用)
应用竞争阶段
(全面应用)
科技研究阶段
时间
图:ChatGPT的技术演化路径与历史地位
范式转换2.0:
从深度学习到大模型的转换
范式转换3.0:
从大模型走向AGI
范式转换1.0:
从逻辑推理向概率统计的转换
2.7 ChatGPT vs Bert
p 先发优势意味着数据采集的时间窗口,形成“社会性实验”。
p 先发优势也意味着用户的容错心理——对“第一个吃螃蟹的”有错误层面的包容性,对第二个就不一定了。
胜负未分,但“先发优势”之于AI有着值得注意的重要性
基于Transformer模型的预训练语言模型
ChatGPTBERT
通用的网络文本数据
应用场景
基于单词或字符级别的自回归模型
预测方式
基于句子级别的特征提取
预训练目标
模型大小
训练数据
大型模型标准版(BERT-Large
最大的ChatGPT-3模型
自然语言处理领域的广泛应用
文本分类 命名实体识别 关系抽取
句子相似度计算
生成式任务
对话生成 文本生成 机器翻译
更广泛的文本数据收集
网页 维基百科 新闻
包含3.4亿个参数 包含1750亿个参数
上下文 单词或字符整个句子
固定长度的向量表示
遮盖单词
下一句预测
上下文
信息
文本
表示
上下文
下一个
单词或字符
文本结构、
语言规律
2.8 来龙:ChatGPT如何演化而来?
“暴力美学”:超大规模及足够多样性的数据、超大规模的模型、充分的训练过程
基于规则 机器学习 神经网络 Transformer GPT3 ChatGPT ???
手写规则
处理少量数据
可找到一些函数与
参数分类数据
像人脑一样学习
根据大量数据分类
学习一个复杂的参
数集合
优化人脑学习过程
关注重点而非全部
使用海量学习数据
不需要提前进行标
记和分类
人类对结果的反馈
成为学习过程的一
部分
能否打破人脑结构
限制?
有无可能生成情感?
1950 1980 2006 2017 2020 2022 ……
p ChatGPT背后的GPT系列体现了LLM应该往何处去的发展理念。
p 很多人开始相信,揭开AGI的真正钥匙正在于:超大规模及足够多样性的数据、超大规模的模型、充分的训练过程。这条道路看似朴素,却足以
AI表现出智能“涌现”的能力,未来也许会持续带来意想不到的惊喜和惊吓。这种思想简言之就是将“参数至上和数据至上”的思想发挥到极
致,从细分技术“分而治之”到“大一统、端到端”,从理论洁癖走向暴力美学。
大模型的竞争力:大数据、大算力和强算法。
2.8 来龙:ChatGPT如何演化而来?
p 各算法并非割裂关系,有多条谱系传承甚至跨代遗传。
p 微软阵营体现后发优势。
AI算法演化之路:火爆的算法在经典算法之上优化而来
递归神经网络
RNN
伊辛&楞次&甘利俊一&Juergen
Schmidhube
蒙特卡洛树搜
索(MCTS)
Bruce Abramson
卷积神经网络
CNN
Yan LeCun&福岛邦彦
受限玻尔兹曼
机(RBM
Paul Smolensky
多层感知机
MLP
Hinton & Sejnowski
反向传播(BP
Werbos & Hinton
概率模型
Yoshua Bengio
高维词向量
Hinton
长短期记忆
(LSTM)
Hochreiter & Juergen
Schmidhube
非线性激活
深度玻尔兹曼
(DBM
Hinton
生成对抗网络
GAN
Goodfellow
注意力机制
Attention
Deepmind (GOOG)
RNN改进
AlexNet &
Dropout
Hinton
深度强化学习
DQN
Deepmind (GOOG)
Attention &
Transformer
Google
生成预训练变
压器(GPT
OpenAI
双向编码表示
BERT
OpenAI
GPT3
openAI
残差网络
ResNet)
何信明等
AlphaFold2
何信明等
AlphaFold
Deepmind
chatGPT
(GPT3.5)
openAI
MT-NLG
微软&英伟达
图像生成相关
语言生成相关
代表具有里程碑
的关键创新
代表相关算法开
创者所在公司或
阵营
1900年-1980 1980年-1990
1990年-2000 2000年-2010
2010-2020
2020年-至今
2.8 来龙:ChatGPT如何演化而来?
ChatGPT的训练过程与提升表现
效果远超预期
(深度),基本
达到人类水准
具有通用人工智能
(广度)的雏形
常识知识处理能力,心智达到人类9
岁孩童水平
伦理及避坑,展现
高情商,敢于承认
无知,承认错误
较高的语义理解能
图2:ChatGPT的训练过程分为三个阶段图1:ChatGPT的提升表现
第一阶段
训练监督策略模型
第二阶段
训练奖励模型(RM
第三阶段
强化学习优化模型
数据集中随机抽取问题
使用PPO模型生成回答
RM模型给出质量分数
基于质量分数优化PPO模型参数
循环迭代出新模型
数据集中随机抽取问题
生成多个不同的回答
标注答案排名顺序
排序结果数据来训练奖励模型
RM模型给出高质量回答的分数
数据集中随机抽取问题
生成多个不同的回答
标注高质量答案
用标注好的数据来微调模型
收集演示数据
并训练有监督
策略
收集比较数据并训
练奖励模型
采用PPO强化学习算法针对
奖励模型来优化策略
2.8 来龙:ChatGPT如何演化而来?
初代ChatGPT的训练存在六大方面的局限性
图:ChatGPT训练的局限性
缺乏深层语义理解能力
ChatGPT
训练局限性
需要大算力支持其训练和部署
缺乏深度推理能力
深度领域知识处理有问题
跨模态能力不足
数据的实时性和有效性
ChatGPT缺乏深度推理能力,例如不
能完成高难度数学题。
目前ChatGPT在常识知识方面非常强大,
但对领域内专业知识处理仍存在问题。
因为缺乏和结构化数据的有效对接,所
以目前ChatGPT会出现数据缺失和实
时性错误。
当前ChatGPT主要生成文本,不包括图像
和视频在内的其他模态。
ChatGPT可理解部分浅层语义,但缺乏深
层(如模型论层)语义理解能力。
ChatGPT需要大量语料数据训练模型,在应
用时仍然需要大算力的服务器支持
ChatGPT未来的改进方向:多模态、少人化、小型化、进化力
减少人类反馈 强化深层语义理解能力
多模态模型发展 模型实时持续学习进化能力
ChatGPT的小型化
CAIConstitutional AI)的排序过程使用模型
(而非人类)对所有生成的输出结果提供一个初始
排序结果。
有三类模型压缩(model compression)可以降低模
型的大小和成本。
量化(quantization),即降低单个权重的数值表
示的精度。比如TansformerFP32降到INT8对其
精度影响不大。
剪枝(pruning),即删除网络元素,包括从单个
权重(非结构化剪枝)到更高粒度的组件如权重矩
阵的通道。这种方法在视觉和较小规模的语言模型
中有效。
稀疏化。例如奥地利科学技术研究所 (ISTA)提出的
SparseGPT arxiv.org/pdf/2301.0077)可以将
GPT 系列模型单次剪枝到 50% 的稀疏性,而无需
任何重新训练。对 GPT-175B 模型,只需要使用单
GPU 在几个小时内就能实现这种剪枝。
计算机学家Stephen Wolfram 为这一问题提出了解
决方案。Stephen Wolfram 创造了的 Wolfram
言和计算知识搜索引擎 Wolfram | Alpha,其后台
通过Mathematica实现。
2.9 去脉:ChatGPT将走向何方?
文本到文本的AIGC
文本到图像的AIGC
文本到3DAIGC
图像到图像的AIGC
音频相关的AIGC
Part 01 人工智能的概念与界定
P02
Part 02 人工智能的技术演进与趋势
P06
Part 03 ChatGPT带来的变革趋势
P26
Part 04 AIGC风口下的投资机会
P41
3.1 ChatGPT有多火?“有意瞄准,无意击发”
1130日发布后,ChatGPT仅用2月便积累1亿用户数量
0
10
20
30
40
50
60
70
80
90
100
2022/11/30 2022/12/14 2022/12/28 2023/1/11 2023/1/25
chatgpt搜索人数 7日均线
ChatGPT关键字搜索兴趣变化(单位:百万人)
ChatGPT用户数量增速惊人
消费级应用 1亿用户达成时长(月)
ChatGPT
2
TikTok 9
Instagram 30
Pinterest 41
Spotify 55
Telegram 61
Uber 70
Google Transalte 78
3.2 深远意义:人类文明生产力跃迁
ChatGPT为代表的AIGC工具的出现,标志着人类生产效率出现了第二次脑力效率飞跃
原始
时代
宙线:时间
(人类文明进化历程)
数智
时代
数字
时代
信息
时代
工业
时代
农业
时代
体力
脑力
辅助
生产效率
的提升
石器
农具+牛
机械
PC/软件
云、网、端、
芯、链
AIGC
脑力
创意
体力效率的提升
体力输出者
脑力生产效率的提升
内容生产者
脑力生产效率的二次飞跃
内容再加工者
3.2 深远意义:互联网走出强弩之末
对传统内容生成模式的颠覆与重塑,解放内容生产者,让其有更多精力进行二次深加工
Web1.0 Web2.0 Web3.0
互联网时代
内容消费者
PGC内容生产形式
角色转换 初次内容生产者
UGC
二次内容加工者
AIGC
专业人工
专业设备
平台
用户
专业
内容
生产数量、
质量有限、
无法自动化
模糊推送
主动检索
用户
设备
平台
用户
内容
生产数量多、
质量有限、
无法自动化
精准推送
主动检索
AIGC生产内容
平台
用户
多样化
内容
生产数量多、
质量提升大、
自动化生成
精准推送
核心环节演进
用户/专业人
士二次加工
初次内容
初次内容
3.2 深远意义:人与内容的关系发生根本性变革
AIGC加速元宇宙世界的内容构建,推动人与内容关系发生根本性变革
Web1.0 Web2.0 Web3.0
单向信息输出
个体体验
单向交互
体验水平
交互模式
内容传输
内容消费者
PGC内容生产形式
角色转换
决策式AIAI技术进程
双向信息交互
复合体验
双向交互
初次内容生产者
UGC
决策式AI
信息聚联与价值共享
沉浸体验
沉浸、聚联
二次内容加工者
AIGC
生成式
AI
互联网时代
文字、图片、视频内容载体 文字、图片、视频 元宇宙
3.3 AIGC的应用领域
多模态
多场景,逐渐融入千行百业
AIGC
文本生成
Ø 结构化写作:新闻播报
Ø 非结构化写作:剧情续
Ø 辅助性写作:帮助润色
Ø 闲聊机器人
Ø 文本交互游戏
音频生成
Ø 语音克隆
Ø 文本生成特定语音
Ø 乐曲/歌曲生成
图像生成
Ø 图像编辑工具 :去除水印
Ø 创意图像生成:生成画作
Ø 功能性图像生成:生成海报
视频生成
Ø 视频属性编辑 :删除特定
主体
Ø 视频自动剪辑
Ø 视频部分编辑 :视频换脸
图像、视频、文本间跨模态生成
Ø 文字生成图像
Ø 文字生成演示视频
Ø 文字生成创意视频
Ø 图像/视频到文本:视觉问答系统
Game Al
Ø AI Bot
Ø NPC逻辑及剧情生成
Ø 数字资产生成
策略生成
虚拟人生成
数字内容构建
合成数据助推
自动驾驶场景
Ø 应用于仿真引擎模拟驾驶场
银行和投资场景
Ø 应用于欺诈检测、
交易预测、风险
因素建模
医疗场景
Ø 通过仿真医疗数据训练医疗诊断
模型
Ø 利用合成的基因组数据进行医学
研究
零售场景
Ø 通过3D模拟创建合
成数据集,助力无人
零售
工业场景
Ø 创建了虚拟工厂,在模
拟平台上使用多种工具
进行合作
3.4 AIGC的技术应用趋势
OpenAI的产品矩阵可以洞悉未来一些方向:多模态+安全
产品 产品说明 类型
ChatGPT
对话模式的
AI
交互模型,具备回答一系
列问题、承认错误、质疑不正确的前提
和拒绝不适当的请求等功能。
文本
DALL·E2
是一个新的人工智能系统,可以根据自
然语言的描述创建逼真的图像和艺术。
例如左图通过宇航员、骑马和写实风格
生成的图片
图片
Whisper
是一种自然语言处理的神经网络模型,
是一种自动语音识别系统。并且支持多
种语言的转录及翻译成为英语。
语音
Alignment
该项研究专注于训练
AI
系统,不断提升
实用性、仿真性和安全性,进一步探索
和开发
AI
系统在人类反馈中学习的方法。
安全
领域类型 2020年之前 2020 2022 2023年? 2025年? 2030
文本领域
诈骗垃圾信息
识别
翻译
基础问答回应
基础文案撰写
初稿
更长的文本
二稿
垂直领域的文
撰写实现可精
调(论文等)
终稿,水平高
于人类平均值
终稿,水平高
于专业写手
代码领域
单行代码补足 多行代码生成
更长的代码
更精确的表达
支持更多语种
领域更垂直
根据文本生成
初版应用程序
根据文本生成
终版应用程序,
比全职开发者
水平更高
图像领域
艺术
图标
摄影
模仿(产品设
计、建筑等)
终稿(产品设
计、建筑等)
终稿,水平高
于专职艺术家、
设计师等
视频
/3D/
戏领域
视频和3D文件
的基础版/初稿
二稿
AIRoblox
可依个人梦想
定制的游戏与
电影
OpenAI的产品矩阵
生成式AI技术的成熟应用进程时间表
p OpenAI产品矩阵可以看出其已经布局文本、图片、语音等多模态产品,未来将逐步探索多模态的融合。
p 未来文本、图片、语音、代码等场景将逐步走向成熟,将助推技术向多模态融合发展。
大模型成熟难度: 初级尝试 接近成熟 成熟应用
路径1:文本到文本AIGC
3.4 AIGC的技术应用趋势
AIGC
五大技术应用方向
直走,然后向左转。
我怎么能去超市?
ChatGPT是由OpenAI基于GPT-3.5 开发的
大型语言模型聊天机器人
AIGC
由谷歌推出的Imagen,是一个文本到图像的扩散模型,
具有前所未有的摄影现实感程度和深刻的语言理解水平
请给我画一张显示道
路的地图
AIGC
请给我画一幅f非常愤怒的小鸟
AIGC
Preferred Networks推出的Crypko可以创作上
半身动漫形象。
从草稿中创作图像
修复损坏的图像
AIGC
谷歌推出的
DreamFusion可以
根据给定的文本创
3D模型
请为我生成一个使用笔
记本电脑的3D机器人
Murf AI推出的人类语音
成器可以在几分钟内发
出录音室质量的声音
让这个机器人来模仿我的
语气吧
创作一些音乐
AIGC
AIGC
AIGC
多模态融合的五大方向路径
路径2:文本到图像AIGC
路径3:文本到3DAIGC
路径4:音频相关AIGC
路径5:图像到图像AIGC
3.5 经典场景:数字人与营销数字化
AIGC的内容生成打通了营销数字化的最后一个环节
内容自动化生成
客户需求分析
个性方案设计
未知 接触 了解 购买 复购
识别客户
分析客户
客户互动
个性推荐
成效分析
引流分配
互动营销
运营管理
成效分析
客户
认知购买
过程
厂商产品功能
产品用户使用场景
目标客户定位
全渠道营销推广
销售达成
营销数字化核
心流程
图:营销数字化核心流程
目标客户定位:通过客群分析实现目标客户识别;
客户需求分析:基于客户需求进行市场研判,培育线索智
能分群;
个性方案设计:基于分群进行个性化方案设计,设置自动
化营销流程;
内容自动化生成:基于个性化方案自动生成营销物料内容;
全渠道营销推广:全渠道触达与互动,推送个性化方案和
内容;
销售达成:客户意向预测与销售意向的达成;
营销复盘再推荐:事后的营销全场景可视化报表复盘与再
推荐方案生成。
营销数字化核心流程闭环
营销复盘再推荐
p 在营销数字化核心流程中,内容自动化生成环节在过去是缺失状态,因此无法构成闭环,但随着AIGC的应用,将助推营销数字化实现业务闭环。
过去
缺失环节
Χ
3.5 经典场景:数字人与营销数字化
AIGC与数字人的结合,推动数字人实现文本、语音、动画、音频等多模态交互
3D数字人2D数字人
人物形象
动画生成模块
语言生成模块
交互模块
人物生成
人物表达
合成显示
识别感知
分析决策
人物建模绑定等
语音生成、动画生成(驱动、渲染)等
终端显示技术
语音语义识别、人脸识别、动作识别等
知识库、对话管理等
音视频合成显示模块
人物语音生成
人物动画生成
TTSA人物模型
文本
智能分析与决策
识别感知
p 虚拟人系统框架一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互五个核心模块构成虚拟人构建的“五横体系”。
p 交互模块为可扩展项,依据是否具有交互模块可讲虚拟人分为交互型虚拟人和非交互型虚拟人,其交互型虚拟人依据其驱动方式的不同,又可分
为智能驱动型虚拟人和真人驱动型虚拟人。
p 其中虚拟人制作过程中核心关键技术应关注:建模、驱动、渲染和人工智能。其决定了虚拟人的外在形象的美观度、动作的流畅度以及交互的自
然度及虚拟人的智能程度。
人物语音生成
人物动画生成
数字化人物形象
文本
图2:非交互类虚拟人系统运作流程 图3:智能驱动型虚拟人系统运作流程图1:虚拟人技术框架
大厂拥有创新营销「生态+技术+流量」的完备实力,赋能品牌高效链接用户
3.5 经典场景:数字人与营销数字化
6.28亿
月活用户量
8亿
网盘积累用户
1.1亿
全域DAU
1300亿
日均位置服务请求
8000
全域DAU
百度多端优势产品矩阵,打造10亿+移动用户规模的“超级流量
3000
家庭渗透
AI
AI面部驱动 AI口型驱动 AI变声器
Plato AI实时语言互动
AI任意换妆换装
AI跳舞
AI唱歌
高精度数字人实时直播
数字人
资产
数字资产 空间
虚拟空间
百度数字人:1+2+3+X虚拟数字人生态体系
一站式平台
两大核心资产
三大应用
度晓晓、希加加
合作授权
品牌营销
服务场景
百度智能云曦灵平台—四大AI引擎为依托
唇形驱动
表情驱动
肢体驱动
手势感知
人像驱动引擎
智能对话引擎
语音交互引擎
智能推荐引擎
任务对话
预置技术
智能问答
开放域对话
全双工AST
变声器
个性化TTS
定制唤醒词
内容与产品推荐
素材库
基于百度区块链开发平台打造数字藏品
品牌数字
资产
品牌“虚拟”
用户管理
品牌营销
赋能
自研开放的数字资产可信登记平台
数字艺术品交易平台
星际口袋、D+商城、小度寻宇
国内首款独立元宇宙APP
AI智能
永久复用多端兼容
极限观感
丰富活动场景
会议会展、文博文旅文创、试乘试驾、个人空间
元宇宙基础设施
百度大脑
百度文心大模型
PLATO
3.6 甲子探索场景:AIGC与新一代智库的结合
p 经甲子光年智库测算,借助AIGC相关工具,在研究分析的每一个环节,都可以实现40%以上效率提升。
对研究流程的重塑,实现预研环节内容重构与效率提升
AIGC
研究人员
关键流程
A1
预研工作
A4
问卷调研
角色>
AIGC对研究项目全流程的重塑
采购
A2
项目启动
A3
深度访谈
问卷发布
和回收
A5
数据清洗
A8
报告确认
与优化
A9
研究报告
发布
A10
发布后
再开发
A6
数据分析
A7
报告撰写
合作伙伴
确认是否
需要采购
前期预研,完成资料
收集与结构化文档整
协助分析师收集客户
资料
协助分析师进行访谈
问卷设计
协助分析师进行调研
问卷设计
报告查错
优化改进建议
协助生成发布文
稿,提高文稿撰
写效率
协助开展报告观
点提炼
3.6 甲子探索场景:AIGC与新一代智库的结合
搭建基于AIGC的新一代智库产品架构体系,甲子光年已经具备一定基础
算力层
算法层
公有云基础设施
平台层
AIDC智算中心
模型生产
训练平台 数据平台
数据采集 数据清洗 数据注入 数据存储 数据分析
基础层
NLP大模型 CV大模型 多模态大模型 ……
中间层
……
应用层 ……
前期
预研
调研
执行
统计
分析
报告
撰写
发布
推广
科技行业模型
云计算 人工智能
元宇宙 ……
行业
数据
定义
赛道
指标
体系
产业
图谱
企业 机构
政府 高校
研究
模型
数据
模型
评估
模型
问卷
模型
知识图谱 人脉模型 能力模型
研究项目全流程的重塑
图:基于AIGC的新一代智库产品架构体系
甲子
光年
具备
环节
甲子
光年
待加
强的
环节
3.6 甲子探索场景:AIGC与新一代智库的结合
甲子光年构建的甲子大脑数据平台体系,为打造基于AIGC的新一代智库产品提供基座
图:甲子大脑业务闭环赋能甲子光年各业务开展
政府
协会
科研
官方
智库
公域数据
咨询
公司
数据
公司
调研
机构
三方数据
智库
媒体
FA
峰会
活动
商学院
……
甲子光年
私域数据
行业数据
企业数据
财务数据
产品介绍
专家观点
定义赛道
数据采集、汇总、输入
各业务线数据调取与使用
甲子大脑数据湖
解决方案
核心观点
数据图表
评估体系
研究模型
……
数据库
企业库 机构库
产品库 案例库
知识库
行业
数据
定义
赛道
指标
体系
产业
图谱
人脉库
企业 机构
政府 高校
能力库
研究
模型
数据
模型
评估
模型
问卷
模型
智库
媒体
FA
活动
商学院
……
各业务线实际使用数据过程中又会产生新数据,再次注入甲子大脑
源数据
经过数据分析师对数据进行结构化、标准化处理,再经过战略分析师对观点的
归纳总结,最终形成结构化数据和观点进行输出
输入端 输出端
Part 01 人工智能的概念与界定
P02
Part 02 人工智能的技术演进与趋势
P06
Part 03 ChatGPT带来的变革趋势
P26
Part 04 AIGC风口下的投资机会
P41
4.1 基于技术架构的产业现状分布
p 当下一级市场中AIGC企业按技术架构下的产业链分布来看,84%布局算法层,11%处于算力层,只有5%布局平台层,算法层竞争度高,算力层
竞争度小。算法层中又以基础层和应用层企业居多,中间层企业较少,中间层企业未来机会空间较大。
从技术架构下的产业分布来看,算力层和中间层企业将更有机会
平台层
5%
算法层
84%
算力层
11%
图1:一级市场AIGC企业按产业链分布情况
39%
15%
30%
5%
11%
应用层
中间层
基础层
平台层
算力层
图2:一级市场AIGC企业按细分产业链分布情况
算法层企业较多,算力层企业较少 算法层中的中间层企业较少
算法层竞争度高,
算力层竞争度小。
中间层企业少,未
来机会空间大。
4.1 基于技术架构的产业现状分布
p 从现有中间层的AIGC企业分布情况来看,企业布局主要聚焦智能机器人、计算机视觉应用、智能交互、机器人操作系统、chatBOT等方向,反而
在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局较少,这些中间层领域具有投资价值。
中间层的AIGC在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局少
52%
10%
9%
7%
6%
4%
4%
4%
3%
1% 100%
智能机器人
智能交互
机器人操作系统
chatBOT
机器翻译
知识图谱
机器学习应用
推荐引擎
内容生成
整体
图:一级市场AIGC技术架构中处于中间层的企业分布情况
4.2 基于技术架构的产业链投资价值环节
甲子光年智库认为,算力层和中间层企业具有投资价值
算力层
算法层
AI芯片及处理器
平台层
AIDC智算中心 AI传感器
模型生产
训练平台 数据平台
数据采集 数据清洗 数据标注 数据合成 数据溯源
基础层
NLP大模型 CV大模型 多模态大模型 ……
中间层
应用层
智能客服 聊天机器人 元宇宙 搜索引擎数字人 教育 ……
投资价值环节
投资价值环节
蓝海市场,成长空间大
孵化成本低
进入壁垒:专业性壁垒、深度壁垒
先发优势:先训练、先迭代,具有一定容错
率,发布时会有社会效应
需求持续释放,成长空间大
政策鼓励扶持,具有战略价值
相比于大模型投入成本低
专业性壁垒高
先发优势:先发布属于填补空白,突破卡脖
子,社会效应高
文本+金融 图像+医疗 视频/音频+教育 ……多模态+营销
4.3 基于技术架构的各环节投入回报情况的分析
从投入成本和回报情况来看,中间层和应用层的投入成本低,商业回报较好
投入成本(亿元)
1
AI芯片
28纳米)
1003.50.6
中间层应用层
预训练
大模型
图:“甲子微笑曲线”技术-商业投入回报模型
AIGC不同技术架构下的投资孵化成本投入对比
0.5
平台层:
数据平台
4.4 算力层的投资机会与代表企业
AIGC对算力的需求指数级增长,算力供需已经失衡,需求拉动下算力层将有较大空间
2018年6月 201810 2019年2月 2019年7月 201910 2020年6月
3󲛺 ,4GB
50󲛺 ,16GB
200󲛺 󽧔40GB
3󳊲󽧔160GB
66󳊲󽧔800GB
GPT-3󸦧󵮵
335󳊲󽧔2TB
AI预训练模型规模呈现指数级速度增长
l 数据规模和模型复杂
度增速远超算力增速。
l 没有强大算力,数字
经济将失去核心支撑。
l 新计算产业,成为中
国数字经济发展的必
由之路、重中之重。
0.3
0.8
1.8
4.4
7.9
15.8
31.6
44
06' 08' 10' 12' 14' 16' 18' 20'
计算曲线HPE分析
Data
Compute
供需失衡:10年来,全球算力的增长明显滞后于数据的增长。从
2012年开始,全球人工智能训练所用的计算量呈现指数增长,平均
3.43个月便会翻一倍,计算量扩大了30万倍,远超过算力增长速度。
模型规模指数增长:2019年,OpenAI耗资1200万美金研发GPT-3模型,
建立了2600P的基础算力,相比其20186月推出的GPT模型,数据规模
增长了500倍。如果使用单块NVIDIA V100 GPU则其完成GPT-3当前
能实现的训练规模,需要长达355年之久。
算力增长滞后于数据增速导致算力供需失衡预训练模型数据规模继续呈指数级增长
4.4 算力层的投资机会与代表企业
p 狭义的 AI 芯片指针对人工智能算法做了特殊加速设计的芯片,目前来讲,由于深度学习算法在人工智能领域认可度及应用程度不断上升,AI芯片
一般指针对大量数据进行数据训练(training)与推断(inference)设计的芯片。
p GPUFPGAASIC是目前最常用的三类AI芯片的技术架构。
高效实现机器学习算法的计算硬件
分类 典型特征
GPU
图形处理器(Graphics processing unit),在计算方面具有高效的并行性。用于图像处
理的GPU芯片因海量数据并行运算能力,被最先引入深度学习。功耗比较低。
FPGA
现场可编程门阵列(Field programmable gate array),是一种集成大量基本门电路及
存储器的芯片,最大特点为可编程。具有能耗优势明显、低延时和高吞吐的特性。
ASIC
专用集成电路(Application specific integrated circuit,特定应用集成电路),是专用定
制芯片,为实现特定要求而定制的芯片。除不能扩展应用以外,在功耗、可靠性、体积方
面都有优势。
类脑芯片
“类脑芯片”是指参考人脑神经元结构和人脑感知认知方式来设计的芯片。目前仍然处于探索阶段。
针对机器学习算法
针对类脑人工智能算法
*本次报告不作讨论
4.4 算力层的投资机会与代表企业
p AI芯片根据所在服务器在网络中的位置可以分为云端AI芯片,边缘及终端AI芯片。
p AI芯片根据实践中的目标不同,可大致分为两类:1)训练AI芯片:指用于构建神经网络等模型;2)推理AI芯片:利用模型进行推理预测。
p 边缘层计算能力的提升推动云-边-端的协同,使得更多行业的人工智能应用场景得以实现,推动AI芯片行业的发展。
云端芯片侧重训练,边缘+终端层芯片侧重推理,这两类芯片均具有较高成长空间
终端层
边缘层
云计算层
预测维护
能效优化
质量提升
数据采集与分析
应用部署软硬件环境
分布式智能/推理
……
边缘网关
边缘控制器
边缘传感器
……
EC-SaaS EC-PaaS
EC-IaaS
SaaS
PaaS
IaaS
业务编排 应用开发管理
数据分析/训练
服务协同
智能协同
数据协同
业务管理协同
应用管理协同
资源协同
……
……
云端主要承载云端训练和云端推理的任务
具体涉及智能数据分析、模型训练任务和部分对传
输带宽要求不高的推理任务
边缘和终端主要承担推理的任务
需要独立完成的任务涵盖:数据收集、环境感知、
人机交互以及部分推理决策控制任务
边缘计算可负责范围内的数据计算和存储工作。同
时,负责将连续数据汇总至计算层,最终由云计算
层完成分析挖掘、数据共享工作,下发结果或模型
至边缘和终端层,形成云-边-端协同
图:云-边-端协同示意图
4.4 算力层的投资机会与代表企业
训练AI芯片和推理AI芯片的代表企业图谱
推理AI芯片代表企业训练AI芯片代表企业
10%
14%
18%
46%
11%
4.5 平台层下的数据平台投资机会与代表企业
在数据处理与应用环节更为值得投资机构的关注
图1:AIGC中数据平台的产业链关键环节
源数据
数据采集
数据存储
数据处理
数据应用
IT技术人员重要性调研反馈
产业链
合成数据
数据采集
数据标注
验真溯源
数据存储
数据处理
源数据
数据源头
数据抽取、清洗、
加载
数据存储
数据挖掘、检索、分析
数据标注工作
数据的真伪识别与溯源工作
计算机模拟技术或算法生成
合成数据
产业链 主要职责
战略环节
图2: AIGC中数据平台的产业链关键环节
预测分析、机器学习、人工智能等先
进技术的融合程度
调整大型模型以适应垂直化、专业化的AI应用需求
4.6 算法层下的中间层投资机会与代表企业
p 未来大的基础模型将会逐步走向统一,形成寡头的数个大模型格局,开发人员将基于这些基础模型研发AI应用。目前商业模式依然是某一家公司
开发出一个大型语言模型,然后开放API供他人使用。未来,在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型
以适应具体AI应用需求的初创企业。
中间层将涌现一批专门负责调整大型模型以适应具体AI应用需求的初创企业
算法层
基础层
OpenAI GPT 谷歌GLaM 百度文心大模型 ……
中间层
文本+金融 图像+医疗 视频/音频+教育 ……多模态+营销
应用层
智能客服 聊天机器人 元宇宙
搜索引擎
数字人 教育等垂直场景 ……
投资价值环节
蓝海市场,成长空间大
孵化成本低
进入壁垒:专业性壁垒、深度壁垒
先发优势:先训练、先迭代,具有一定容错
率,发布时会有社会效应
云计算平台,提供算力层和平台层支撑
AWS 阿里云 华为云 百度云 ……
澜舟孟子
图:中间层初创企业的商业模式
提供更精准化、更专业的预训练模型并反哺给大型模型
核心价值是数据飞轮,指使用更多数据可
以训练出更好的模型,吸引更多用户,从
而产生更多用户数据用于训练,形成良性
循环。)初创企业将来不承担模型训练角
色,它们可以在上述的中间层角色中发挥
巨大价值
更多数据
训练模型
模型优化
吸引用户
数据
飞轮
4.7 算法层下的基础层投资机会与代表企业
ChatGPT背后的大模型,是AI的基础设施,将进一步推动AIGC行业发展
“海洋之光”超级计算机(国产超算)
512 GPU
算力
腾讯太极机器学习平台
昇腾 AI 基础软硬件平台
16 GPU
数据量
1.9TB 图像292GB 文本
中文多模态数据集 M6-
Corpus
五大跨模态视频
检索数据集
基于万条小规模数据集
数百 G 级别不同领域的
高质量语料
模型类型
多模态预训练模型
图、文、音三模态
“八卦炉”(脑级AI模型)
M6
大模型
“混元”HunYuan_tvr
紫东太初
孟子
参数
174万亿(与人脑中突
触数量媲美)
10 万亿
万亿
千亿
10亿
商汤AIDC,峰值算力
3740Petaflops3
--
计算机视觉模型
计算机视觉模型
书生(INTERN+)
某世界最大规模计算
器视觉模型
100亿
300亿商汤科技
商汤科技等
2
企业
清华大学等
1
阿里
腾讯
280 GPU
鹏城云脑Ⅱ(2048 CPU
和百度飞桨
4095Pflops-day/2128 GPU
3390 亿条文本数据
纯文本和知识图谱的
4TB 语料库
5000GB 高质量中文数
据集
NLP 大模型
NLP 大模型
NLP 大模型
Megatron-Turing
ERNIW 3.0 Titan
1.0
5300亿
2600 亿
2457 亿
微软和英伟达
百度和鹏程实验室
浪潮信息
鹏城云脑Ⅱ和全场景 AI 计算框架
MindSpore2048 GPU
40TB 训练数据盘古系列大模型 千亿
3640Pflops-day
3
)/上万块V100
GPU 组成 gao 带宽集群算力
超过万亿单词的人类语
言数据集
GPT3.5 1750 亿OpenAI
华为云
中科院自动化所
澜舟
多模态预训练模型结合
人类参与强化学习
复旦大学超算中心 --
对话式大型语言模型
MOSS 百亿复旦大学
4.8 AIGC产业投资地图
p 大厂适合布局的环节应聚焦高投入、大算力需求、大数据量级、通用能力好的环节,因此适合布局在算力层、算法层的基础层和平台层的模型生产
和训练等环节。
p 初创企业适合入局的环节应聚焦在投入少、算力需求不高、中低数据量级、垂直/专业场景等环节,适合布局在中间层、应用层和平台层的数据平台
环节适合。
初创企业适合入局中间层、数据平台和应用层,大厂适合入局算力、平台和基础层
算力层
算法层
AI芯片及处理器
平台层
AIDC智算中心 AI传感器
模型生产
训练平台 数据平台
数据采集 数据清洗 数据标注 数据合成
数据鉴真
数据溯源
基础层
NLP大模型 CV大模型 多模态大模型 ……
中间层
金融+文本 医疗+图像 航天+3D ……零售+多模态
应用层
智能客服 聊天机器人 元宇宙 搜索引擎数字人 教育等垂直场景 ……
音/视频大模型
图:AIGC技术架构体系下的产业投资地图
初创企业适合入局环节
初创企业适合入局环节
大厂适合入局环节
基础层
4.8 AIGC产业投资地图
算力层、数据平台、中间层及应用层具有投资价值的细分方向与初创代表企业
算力层
算法层
训练AI
芯片
平台层
数据
平台
应用层
智能客服 聊天机器人 元宇宙 内容营销数字人 教育 新型智库
推理AI
芯片
数据
处理
数据
标注
数据
溯源
合成
数据
光年之外
中间层
文本 图像 视频/音频 3D 多模态
MiniMax
图灵AIGC
图形起源
特看
科技
诗云
科技
图:AIGC技术架构体系下的初创企业产业投资地图
深氧未来
甲子智库院长
宋涛 微信
stgg_6406
北京甲子光年科技服务有限公司是一家科技智库包含智库媒体社群企业服务版块立足于中国科技创新前沿阵地动态
跟踪头部科技企业发展和传统产业技术升级案例致力于推动人工智能大数据物联网云计算AR/VR交互技术信息安全
金融科技大健康等科技创新在产业之中的应用与落地
扫码联系咨询合作
关注甲子光年公众号
甲子光年创始人
张一甲 微信
JJJessica0114