大模型开启科技追逐战,数据要素价值发挥长期成长

信小创
从科学技术对人类生产力提升的角度来看,我们先后经历了以蒸汽机为代表的第一次工业革命,以电机、内燃机为代表的第二次工业革命,和以计算机为代表的第三次工业革命。

4d2d9464a416b0e266cdeaeefec1b03d (1).jpg

本文来自微信公众号“大信创圈”,作者/信小创。

1

ChatGPT开启科技领域追逐战,

市场格局或迎来

1.1.人工智能有望引领第四次工业革命

从科学技术对人类生产力提升的角度来看,我们先后经历了以蒸汽机为代表的第一次工业革命,以电机、内燃机为代表的第二次工业革命,和以计算机为代表的第三次工业革命。每一次工业革命都会带来人类生产力的跃升和深刻地改变产业及国家的竞争格局。对于第四次工业革命,虽然目前人类还没有达成共识,但是人工智能、新材料、量子信息技术、可控核聚变、生物技术等都被认为是可能的技术突破口。而随着ChatGPT的出现和GPT能力的跃升,我们看到了人工智能在各行业替代人类的可能性,并认为其有望引领第四次工业革命。

1.png

正是看到了人工智能的重要性,我国在人工智能核心技术的研发上也做了非常大的投入。2017年2月,考虑到人工智能迅速发展的态势,科技部在已有的15个科技创新2030项目的基础上新增“人工智能2.0”,“重点围绕新一代人工智能基础理论、面向重大需求的核心关键技术、智能芯片与系统三个方向展开部署”。

国家实验室作为国家最高科研水平的代表,目前科技部披露一共14个(另有6家被降级为国家重点实验室),都是2006年及以前批准筹建的,后续很长时间没有新的增量。近年来,根据地方披露了部分国家实验室建设的信息,我们统计到的12个新建国家实验室中,就有6个聚焦在信息科技领域,其中的2个都是重点聚焦了人工智能领域。

1.png

1.2.英伟达成为算力端最大赢家,国内仍有较大的算力缺口

1.2.1.加速计算成为数据中心主导的算力需求,5年复合增速或将超过50%在人工智能计算需求的推动下,加速计算已经成为了数据中心主导的算力需求。从英特尔、英伟达、AMD三家公司最新的财报数据来看:

在收入规模方面,2023Q1英伟达数据中心业务收入达到了42.84亿美元,首次超过了英特尔相关业务37.18亿美元的收入规模,并且随着后续AI芯片出货量的上涨,有望在Q2超过英特尔和AMD的收入之和。

从收入增速方面,2023Q1英伟达、英特尔、AMD的数据中心业务增速分别为14%、-38%和0%,其中AMD虽然保持了同比增长,但是环比下滑了22%,总体来看除了英伟达需求仍然坚挺以外,英特尔和AMD的数据中心业务景气度下滑趋势都非常明显。

由于英特尔、AMD数据中心业务主要对标了CPU需求,而英伟达数据中心业务主要对标了GPU需求。以上数据可以看出,目前数据中心整体需求不佳,对GPU的需求正处于逆势增长过程中,全球数据中心需求也在从通用计算过渡到加速计算中。

1.png

根据集微网,AMD预计数据中心人工智能加速器(市场)将以超过50%的复合年增长率,从今年的300亿美元左右增长到2027年的1500亿美元以上。

正是看到了这样的市场机会,AMD也将人工智能视为其最大、最具挑战意义的长期增长机会,积极发展GPU芯片业务。6月13日,AMD表示其最先进的人工智能芯片MI300X将于今年晚些时候向部分客户发货,2024年开始大量出货。

1.2.2.GPU供应成为美国禁令的聚焦点,国产芯片应用仍然面临较大阻碍

在通用大模型的训练方面,目前主流需求为英伟达的A100和H100芯片。2022年8月,美国禁止了英伟达A100和即将推出的H100向中国和俄罗斯的所有出口实施一项新的许可要求。为了避开美国的限制,英伟达分别在2022年11月和2023年3月发布了A100、H100的中国特供版本A800和H800。特供版本从性能上面的差距主要体现在通信带宽上,其中A800较A100降低了33%,H800较H100降低了25%。随着国内互联网大厂争先布局AI大模型,国内对于A800和H800的需求呈现爆发式增长,短期仍然面临缺货问题,限制了国内大模型算力的供给。

虽然近年来涌现出多家GPU厂商,但是目前在国内互联网大厂大批量使用的还是英伟达的芯片,国产芯片主要对标推理芯片,性能上多数难以支撑训练需求。英伟达A100和H100分别应用了7nm和4nm制程,这意味着人工智能的算力需求与芯片的先进制程是紧密捆绑的。同时,由于2022年10月,美国对于国内高端芯片和超算的禁令进一步收紧,国产芯片在生产环节也面临较大的发展瓶颈。

1.png

GPU芯片除了关注硬件性能,软件生态也是关键考量因素。以英伟达来说,其所有的硬件和解决方案都拥有统一的底层软件CUDA和运行库CUDA-X。随着GPU计算性能的逐步强大,英伟达在2016年推出了CUDA,让GPU可以用于图像计算以外的目的,也大幅提升了GPU的计算性能。自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具上,累计投入了将近100亿美元,全球主流的深度学习框架都基于CUDA进行加速,生态壁垒强大。对于国产GPU厂商来说,软件生态也成为其产品推广的重要阻碍,要推行国产化客户还需求做很多的调优和适配工作。

1.3.人工智能更加基础设施化,科技企业竞相入局大模型竞赛

1.3.1.过去人工智能依靠专用模型,市场格局分散

过去厂商会根据具体应用场景研发专用人工智能模型,人工智能呈现百花齐放的市场格局,专业人工智能技术厂商需要将产品深入到应用端。

根据IDC数据,2022上半年,人工智能的语音语义子市场中,份额前三的科大讯飞、阿里云、百度智能云三家市场份额总计仅为25.6%;计算机视觉子市场中份额前5的商汤科技、旷视科技、海康威视、创新奇智、云从科技份额总计42.3%;机器学习平台子市场份额相对集中,前5大厂商第四范式、华为云、九章云极、创新奇智、美林数据总计份额64.1%。而相比而言,作为基础设施的公有云市场(PaaS+IaaS)中,位于前3的阿里云、华为云、中国电信总计占比达到了54.3%。

1.png

2017年至今科技部启动3批共计15家企业成为“国家新一代人工智能开放创新平台”。作为了人工智能的国家队,这15家头部企业将在自动驾驶、城市大脑、医疗影像、智能语音、智能视觉、基础软硬件、智能供应链、图像感知、视觉计算等多个领域发挥各自的优势,利用国家政策倾斜优势,形成人工智能技术在各个场景的落地。

1.png

从语音的龙头科大讯飞到视觉领域龙头商汤科技,可以看到其收入主要都是来自于行业应用产品,这其中智慧城市都是各家普遍占比较大的子行业。

1.png

1.3.2.人工智能基础设施化的新趋势下,科技领域巨头竞相入局大模型竞赛

从openAI的GPT的发展史来看,大致呈现了几个特点:

(1)参数量快速增长,导致了大模型对于算力的需求持续增大,提升了竞争对手入局的门槛,也导致了当前ChatGPT的算力缺口。

(2)OpenAI对于GPT技术细节公开的程度持续下降,特别是在微软入主以后,这导致竞争对手对于追赶GPT-3及以上产品的难度大幅提升。

(3)GPT-4的出现,真正颠覆了业界对于科技走向的认知,人工智能引领科技发展的趋势成为了业界的共识。而对于即将出现的GPT-5,机器较人类的优势将进一步显现。

1.png

GPT大模型的出现,使得人工智能呈现基础设施化特征,科技领域头部厂商竞相入局。

ChatGPT作为通用性的人工智能,通过大力出奇迹,实现了人工智能能力的跃升,也意味着未来人工智能将与云计算等领域一样,成为IT底层能力构建的基础设施,在竞争格局上也将发生本质变化,体现出更强的马太效应,成为头部IT企业角逐的战场。正是看到通用人工智能对全行业带来颠覆效应,2023年以来,我们看到各大互联网公司和头部IT企业都有一系列向大模型布局的动作,也有多家公司已经发布了自己的大模型产品。

1.png

未来国产通用大模型的产品能力突破和生态建立仍然值得长期关注。

1.3.3.行业大模型涌现,当前在产业侧应用落地方面更具优势

在厂商争先建设通用大模型的同时,我们看到行业大模型的打造也成为了新趋势。根据中关村在线,2023年6月19日,在腾讯云行业大模型及智能应用技术峰会上,腾讯公布了其行业大模型的进展,并发布了依托腾讯云TI平台打造的行业大模型精算商店,为客户提供MaaS一站式服务,已经面向传媒、文旅、政务、金融等10余个行业提供超过50个大模型行业解决方案。而与此同时,腾讯也在打造自己的通用大模型——混元。

通用大模型目前在B端较专用的行业模型还有较大差距。具体来看问题主要包括:

(1)通用大模型不懂行业的Knowhow,同时企业数据可及性不高,难以作为训练数据对通用大模型进行调优;

(2)通用大模型还是存在胡说八道的情况,由于B端对系统稳定性要求更高,这样的问题是B端难以接受的;

(3)我国私有云比例远高于全球整体水平,企业、政府对数据安全性更加敏感。在应用通用大模型的同时,企业、政府数据的安全性难以得到保障,私有云又无法满足通用大模型的算力要求;

(4)从经济效应来看,由于行业专用模型的参数量远小于通用大模型,在成本上的优势更加明显。

基于以上原因,当前我们看到行业专用模型与通用大模型还将处于长期共存的状态,势必留给B端、G端的下游应用厂商更多的发展的机遇。同时行业大模型和通用大模型同时涌现,会让市场对于大模型的概念更加模糊化。

1.4.AI或带来行业竞争格局重塑中,机会来自结构性增长

1.4.1.互联网大厂的资本开支、研发下滑明显

近4个季度阿里和腾讯两大厂商的资本性开支都在明显下滑的过程中。其中单季度来看,腾讯从峰值的169亿元下滑到了44亿元,阿里从峰值的159亿元下滑到35亿元,大厂的控费步伐明显。

1.png

根据Wind数据,我们看到亚马逊、谷歌、Meta、微软、苹果为代表的全球5大科技厂商的资本开支一直持续增长到2022Q4,但是在2023Q1出现了明显的下滑。说明短期来看经济形势对巨头资本开支的负面影响仍大于人工智能拉动的建设需求。

1.png

2022年互联网行业收入增速下滑1.1%,行业还保持了较为稳定的研发经费增长,全年增长7.7%。而在2023年1-4月随着行业收入和盈利的回暖(分别同比增长3.3%和62.1%),我们却看到行业的研发经费下降了8.5%,说明行业在加大人工智能方向投入的同时,在传统研发方向的研发投入上有了明显缩减的动作,我们认为这一现象的背后表明了互联网企业的投资方向或已随着AI的到来发生了转向。

1.png

6月20日,国内服务器龙头浪潮公告,受通用服务器客户需求节奏变化、全球GPU及相关专用芯片供应紧张等因素的影响,公司半年度经营业绩较上年同期存在下降的风险。可见对于2季度整体需求的恢复情况仍不能过于乐观。

1.4.2.AI的发展或将推动云计算市场格局的重塑

云计算市场格局仍然处于持续变幻的过程中,三大运营商2022年实现翻倍增长。根据IDC数据,2022H2我国IaaS企业中,阿里云、腾讯云的份额还在持续下滑,中国电信和华为的份额还在保持增长势头,AWS在中国市场继续稳居第5,而其他厂商的市场份额还在持续增大。

1.png

而从2022年各公司的财报数据来看,虽然阿里云收入规模仍然领先,但是仅有7%的增长。三大运营商都实现了云业务的翻倍增长,移动、电信、联通的云业务增速分别为108%、108%、121%,向好趋势明显。华为云披露全年收入453亿元,尚不确定与上一年201亿的收入规模上,有怎样的口径变化。独立上市的金山云、优刻得,分别下滑了10%和32%,这也体现出了云计算业务的马太效应。百度云增长23%,较上一年下滑了41个百分点。

1.png

2023年来看,由于AI的出现,行业的变革将进一步加剧:

(1)运营商方面:2023年天翼云营收目标为千亿元,对应约99%的增速,同时移动也表示力争未来3年营收突破1500亿元,对标了3年37%的复合增速水平,都对云业务给予了很高的期待。而2023年前4个月工信部数据显示,通信业云计算收入增速50.7%,较上年全年118.2%的增速下降明显,各家运营商云业务发展情况是否符合预期,仍需要等待财报数据进一步披露。

(2)阿里云方面:根据新浪科技,4月11日,阿里云正式宣布推出大语言模型“通义千问”,同时阿里巴巴所有产品未来将接入“通义千问”大模型。根据财经网,4月26日,阿里云宣布史上最大规模降价——核心产品价格全线下调15%至50%,存储产品最高降幅达50%,展示出了积极的应战姿态,同时京东云、腾讯云、天翼云、移动云、华为云5家厂商也在1个月内跟随降价。根据TechWeb,5月11日,阿里云创始人王坚正式回归。根据每日经济新闻,5月18日,阿里宣布云智能集团将从阿里巴巴集团完全分拆独立上市,与此同时在进行的还有菜鸟、盒马启动上市计划,阿里国际数字商业集团启动外部融资。

根据财经网,阿里云官网显示,将对部分ECS产品进行价格调整,其中最高降幅达32.5%,新的价格将于6月6日开始生效。根据每日经济新闻,6月20日,张勇卸任阿里巴巴集团董事会主席兼CEO职务,专职担任阿里云智能集团董事长兼CEO,专注阿里云的发展。2020年伴随着新基建政策的频繁出台,国内云计算厂商也开启了数据中心建设的大规模建设计划。根据封面新闻,4月20日,阿里云宣布未来3年将再投入2000亿,用于云操作系统、服务器、芯片、网络等重大核心技术研发攻坚和面向未来的数据中心建设。根据DeepTech深科技,5月26日,腾讯云宣布,腾讯未来五年将投入5000亿,用于新基建的进一步布局。

2020年陆家嘴金融会议后,根据证监会发布,11月2日,中国人民银行、中国银保监会、中国证监会、国家外汇管理局对蚂蚁集团实际控制人马云、董事长井贤栋、总裁胡晓明进行了监管约谈,随后对互联网行业反垄断监管开启。与此同时,2020Q4阿里云开始实现盈利(经调整EBITA),但阿里云的增速也持续下滑,既慢于海外头部厂商,也落后于到了2023Q1已经到了收入同比下滑的状态。

1.png

从2022年中央经济工作会议到2023年的政府工作报告,我们都看到关于平台经济的表述上发生了重要的变化,如政府工作报告提出“支持平台经济发展”,而2022年相关政策表示为“加强反垄断和反不正当竞争”,由此我们认为对于互联网企业的政策将更多转向支持为主。

政策转向同时叠加ChatGPT将给行业带来的颠覆效应,此时阿里云进行降价和完全分拆剥离独立上市,可以在保障业务快速增长的同时,减少对阿里巴巴整体盈利情况的拖累,更加积极迎战AI给行业带来的新挑战和新机遇。

1.5.下游爆款应用将成为行情助推器

在微软Copilot的带动下,协同办公领域应用落地即将展开。根据中国基金资讯网,4月18日,金山正式发布了基于大语言模型的生成式人工智能应用“WPS AI”,将最先应用于在线内容协作编辑工具"轻文档",并将陆续嵌入金山办公全线产品。在WPS AI底层混用了包括MiniMax等在内的多个大模型。除此以外,根据红星新闻、界面新闻、金融界、新浪财经,钉钉接入通义千问并在4月18日发布了斜杠,印象笔记在自研的大象GPT的基础上推出了“印象AI”,飞书在4月11日发布了“My AI”,石墨文档宣布接入文心一言。

AI数字人开启影视新空间。5月AI歌手走红全网,数字分身可以将人物形象延续到海量作品中,适应新的场景需求。与此同时,万兴科技旗下万兴播爆上线AI数字人定制服务,无需真人出镜,只需几分钟就可以生成营销带货短视频,极大地节约了跨境卖家的营销成本。根据IDC的预测数据,我们可以看到IDC预测AI数字人市场2023年、2024年还将呈现加速增长趋势,增速接近100%水平。

1.png

教育走在了AI落地的前列。科大讯飞在发布星火认知大模型的同时,还更新了T20 Pro的功能,使之拥有的中英文作文批改功能、口语交互功能、AI学情诊断、AI技术个性化提升等功能,成为了全球首款搭载大模型的AI学习机。

未来人工智能在应用方面的突破,将有望直接推动相关子行业优异的行情表现。目前来看,教育、游戏、影视、协同办公这些偏向C端领域实现了应用先行,而偏向B端、G端的应用,短期仍将以行业大模型为主导。

目前来看,国内大模型产品与ChatGPT的差距还较为明显,由于ChatGPT对中国市场禁用,国内相关产业生态还有待国产大模型能力的提升来提供支撑,而部分布局海外的厂商,通过和ChatGPT等海外平台对接,有望在应用方面占据更多先发优势。

2

数据要素价值发挥和数字中国的建设

助力行业的长期成长

2.1.数据作为新的生产要素,将交易中发掘出新的价值

数据作为新型生产要素,有望成为新的经济拉动因素。从2019年10月中国共产党第十九届中央委员会第四次全体会议第一次将数据列为生产要素,2022年12月《关于构建数据基础制度更好发挥数据要素作用的意见》的颁布,我们看到数据作为五大生产要素之一,其开发和利用的底层制度在持续构建和完善过程中。其中作为数据要素中权威性、通用性、基础性、可控性、公益性较强的数据类型,公共数据的合理有偿使用在制度上实现破冰,再配合国家数据局的成立,有望在数据要素价值释放方面发挥巨大的价值。

1.png

从我们产业IT系统建设来看,我们认为主要经历了几个重要的阶段:

(1)信息化:重心逐步从办公系统、财务软件,转移到各业务的信息化管理,包括政府层面典型的金字工程建设,企业层面OA软件、ERP软件应用。

(2)云化、集中化:信息系统云化、集中化趋势下,跨部门级(如一网通办)、跨区域级(如不动产登记)地进行自上而下的系统建设,打破信息孤岛,实现部门间信息的联动。大型企业通过建设数字中台、技术中台、业务中台,建设微服务架构,加快系统对业务创新的支持响应。

(3)智能化:随着数据的累积,大模型给人工智能领域技术带来的推动作用,两者的结合将在未来产生更加智能的信息系统。

从以上的三个阶段来看,我们产业的信息系统建设正在处在云化、集中化的阶段,随着数据作为重要资源不断积累,并进入交易市场,跨产业的数据结合产生更大的价值,同时也将为未来系统步入智能化阶段做必要的铺垫。

2.2.政策全面聚焦数据要素价值发挥和数字中国的建设

国家从2021年以来也密集发布了大量与数字经济、数字中国、数据要素相关的宏观政策,其中主要包括以下几个方面:

(1)数据基础设施建设方面:规划了“东数西算”的大战略,同时从数据中心耗能等方面加强节能减排等方面的要求。

(2)顶层设计方面:2021年10月中央政治局以“推动我国数字经济健康发展”为主题展开集体学习,2022年1月发布《“十四五”数字经济发展规划》,2023年2月发布《数字中国建设整体布局规划》,提出将数字中国建设工作情况作为对有关党政领导干部考核评价的参考,2023年成立国家数据局。

1.png

(3)数字政府方面:2022年6月发布《国务院关于加强数字政府建设的指导意见》,2022年10月发布《全国一体化政务大数据体系建设指南》,体现出数字建设政府引领的特点。

(4)数字化能力建设方面:2022年中央经济工作会议、2023年政府工作报告聚焦自主可控,2023年2月中央政治局以“加强基础研究”为主题展开集体学习,将信创工作重要性提升到历史新高度;2021年接连出台了《数据安全法》、《关键信息基础设施安全保护条例》、《个人信息保护法》,为我国数据建设提供了法律保障基础,同时在2023年1月出台《关于促进数据安全产业发展的指导意见》,推动数据安全产业的发展。

1.png

2.3.国家数据局的成立,将为数据要素的价值发挥起到积极的推动作用

2023年3月16日,中共中央、国务院印发了《党和国家机构改革方案》,并在国家发展和改革委员会下组建了国家数据局。

2018年机构改革时,省级政府顺应了数字化转型的需要,纷纷建立了大数据局。地方的大数据局整合了原本分散于地方发改、经信等多个部门的相关职能,帮助政府打破了“数据孤岛”的状态,数据管理从单一化的行业管理迈向了整体化的功能管理。根据2023年的政府工作报告的内容,经过持续的数字政府建设,我国现在“90%以上的政务服务实现网上可办,户籍证明、社保转接等200多项群众经常办理事项实现跨省通办”。

之前,地方大数据相关工作同时受到了中央网信办、工信部、发改委等多个部门的管理,在中央层面缺乏统筹机构。在国家大数据成立以后,有利于相关管理职能的集中,统一制定大数据战略和国家数据共享平台等。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论