OpenAI GPT-3.5 于 2022 年 11 月 30 日正式发布,距离现在整2年时间,这2年时间,美国大模型和中国大模型分别都形成了四大巨头格局,美国以xAI、Anthropic、OpenAI、Meta Llama四大巨头为竞争格局,中国以华为、腾讯、阿里、字节四大巨头为竞争格局。今天,和大家一起来聊聊中国大模型生存战,为什么是只有这四大巨头,没有其他群雄。" E2 |, H* q: o
5 b- l$ G$ j9 P) M0 `( X1 }/ ] j4 M
$ T2 x5 t$ v1 B3 R0 b' g# g有朋友就问我,这个B为什么不是百度,我觉得吧百度有这个欲望也有这个能力但没有这个野路子,如果Robin有周鸿祎这样野,百度或许也就成了,因为企业家IP时代,企业一号位应该第一个冲,你看雷军,为啥腾讯马化腾字节张一鸣不出来做企业家IP就行,为什么华为只是余承东出来做IP,因为腾讯有微信,字节就是百度嘴里夺食而长大的有强大产品矩阵,华为国之重器有政府订单,所以百度必须要野起来才行,从Robin开始才行。不废话了,进正题。
1 x0 i1 x5 }5 P* i报道称截至今年 3 月,OpenAI 公司花费近 40 亿美元使用微软服务器为 ChatGPT 运行推理工作负载;此外 OpenAI 今年训练 ChatGPT 以及新 AI 模型的成本预估达到 30 亿美元,因此训练和推理 AI 的成本可能达到 70 亿美元。
& M7 _& p7 Z% whttps://www.toutiao.com/w/1805535074422796/?channel=&in_ogs=&in_tfs=&original_source=&source=input&traffic_source=&utm_medium=wap_search&utm_source=4 J1 @0 w8 E5 C# e) R6 o
预计未来训练模型的最低花费每年在 20 亿 - 30 亿美元之间。: D: b$ X& {2 L. r8 N3 ^
https://www.toutiao.com/article/7442344280678515219/?log_from=6c0caf3b4a1b2_1732864178131. T6 Q' k Z9 O! H" N5 w
大模型的训练成本太高,每年20到30亿美金的成本,这一数额远超 “AI 六小龙” 任何一家的融资总额。与大厂能够从自有利润持续投入相比,烧钱的创业公司不再那么受青睐,已有投资人急于出售股份套现啦。这样看,群雄基本就没戏了。
% E" V8 w) F" h z- c! e' _# f而华为、腾讯、字节、阿里,有人才有资金有场景,一定会是四巨头。
% v. |6 l# E- l* p/ ^$ V* `B 字节:越来越无敌的存在,应该可以坐东方位8 ]/ u( y% d4 @% d5 Y* n0 O/ P
0 _. |) Y5 B$ a3 Y7 F0 R+ g! x* b: n0 C( x b7 V
(一)人才策略
" [& y3 L! t! K
8 u: k( c( T; L/ z" H+ ~5 @1 e3 Y字节跳动在 AI 方向的人才策略积极且多元化。一方面,字节跳动计划在欧洲设立 AI 研发中心,已开始在欧洲积极招募 LLM(大语言模型)和 AI 领域的顶尖技术人才,以加强其在全球第二大经济体中的人工智能研发能力。欧洲拥有丰富的人才储备,得益于其顶尖大学和研究机构在机器学习、数据科学和自然语言处理等 AI 关键领域培养了大量人才。同时,欧洲各国政府推出专项 AI 人才培养计划,吸引和留住顶尖人才,这为字节跳动在欧洲的人才招募提供了良好的环境。
$ }, L; S# ?+ D此外,字节跳动还推出了 “筋斗云人才计划” 和 “Top Seed 人才计划”。“筋斗云人才计划” 是面向全球高校招聘顶尖技术人才的专项计划,涵盖 AI 应用、搜索、推荐、广告、AI for Science、AI Safety、机器人、隐私与安全、硬件、视频架构、工程架构等技术领域。该计划针对 2024 年 9 月 - 2025 年 8 月毕业的博士群体,重点招募有亮眼学术成果、拥有顶级顶刊论文或专利的学术达人;有丰富的大赛经历,在国际知名竞赛中取得优异成绩的竞赛达人;或有极强的实践能力,参与过重大项目,擅长解决难题的实战达人。候选人将有机会与顶尖技术人才共事,参与有挑战性的技术难题,获得充足的资源和成长空间,以及行业 TOP 的薪酬和回报,并配备了顶尖的导师团队。( a- s% r, h6 E3 E; Z
“Top Seed 人才计划” 则是字节跳动豆包大模型团队面向校园优秀人才推出的专项,主要针对机器学习、人工智能、大模型、计算机视觉、音视频生成等领域的顶尖技术人才,特别是应届博士生,提供前沿课题和顶级薪资算力,以及大模型、自然语言处理、计算机视觉、语音、机器学习系统等领域课题。. [( n1 `5 E' I% C, B
去年字节的 CEO 梁茹波曾发内部信反思公司变迟钝了,当时似乎并未预见 ChatGPT 这波技术浪潮。然而,“去年不及格的战略,完全不影响字节今年的满分成绩”。如今,字节旗下的产品在国产 AI 类应用中已断崖式领先所有对手。字节此前差点错过 AI,原因在于押错了技术路线,将资源投入到为科研服务的 AI 产品上,而忽视了以 Transformer 为核心的语言模型。去年第四季度反应过来时,国内同行已在追赶 GPT - 4。不过,字节的战斗力在其开始行动后得以彰显。据《中国企业家》去年报道,张一鸣废寝忘食地读论文,很多 AI 论文的作者都被张一鸣请去一对一交流,甚至连未毕业的博士生也不放过。
6 O8 W. b7 I0 J3 [- X 字节跳动还通过成立新部门 Flow 进一步加强 AI 创新业务。Flow 部门由字节跳动技术副总裁洪定坤担任技术负责人,字节大模型团队的负责人朱文佳担任业务负责人。该部门已经在字节内部发布了招聘信息,同时也在社会招聘渠道寻找人才,目前推出了两款 AI 对话类产品豆包和 Cici,分别面向国内和海外市场,同时还有多个 AI 相关的创新产品在孵化中。
9 v. I6 K! B! g1 d* ]7 S在人才吸引方面,字节跳动不仅通过自身的人才计划和部门建设,还从外部招揽人才。例如,阿里巴巴通义千问大模型的技术负责人加入字节;前面壁智能核心成员和前零一万物核心成员已加入字节的大模型团队,汇报给朱文佳。同时,字节跳动还通过收购方式吸揽人才,目前已有多家知名 AI 创业公司收到字节的收购要约。$ e! Q1 b% I8 V1 P \
(二)产品矩阵
1 R* g; c; X8 A+ e* l- Y2 X: E4 l3 L' F0 h
字节跳动在 AI 方向的产品矩阵丰富多样。其中,字节跳动推出了基于豆包大模型打造的一系列产品,如 AI 聊天机器人构建平台扣子、AI 生图星绘、AI 角色互动平台猫箱等 App,以及豆包 MarsCode 开放平台。同时,抖音、剪映、即梦 AI 等字节系其他产品的部分 AI 服务,也是由豆包大模型提供技术支持。
( ?$ F5 W( F% w" D N( _: U大力教育旗下 AI 教育 App 河马爱学已更名为豆包爱学,成为豆包旗下首个以豆包命名的 App。豆包爱学是基于豆包大模型研发的教育产品,致力于成为学习者的智能伙伴、教育的好帮手。4 j2 g$ e: d' r6 \5 {& @
此外,字节跳动还推出了 AI 耳机 Ola Friend,这是一款开放式耳机,单耳 6.6 克,该款耳机接入字节跳动旗下豆包大模型,并与豆包 APP 结合。
3 l2 U2 P% x& h o7 A' ]剪映作为字节跳动产品矩阵里的重要部分,也融入了 AI 功能。剪映最新上线的 AI 功能包括 AI 克隆音色、图文成片、数字人口播和视频生成等,为用户提供了更便捷的内容创作和分享体验。/ o( X* @6 k& f
这些产品共同构成了字节跳动在 AI 方向的丰富产品矩阵,展示了字节跳动在 AI 领域的强大实力和创新能力。
0 Y0 d1 `' w3 C) QA 阿里:复制微软云模式,因为微软+OpenAI很成功
7 V* _1 P X1 k# _6 L+ Q: S9 f4 @; Y* t) l& H1 W2 F
8 A8 s: _) Q4 k' W7 [9 g f% ^
(一)云 + AI 的探索
2 [$ _& X: r0 `5 j, j2 e9 D0 Z* n9 c2 A
阿里云一直致力于通过云 + AI 的方式实现业务增长,试图在营收方面追赶微软云。阿里云展示了全栈化 AI 能力和通义大模型家族,为各行业提供优质的自然语言处理服务及应对复杂任务挑战。
4 W/ ~ e" J7 C; _# v% f. _通义千问作为通义家族的初始成员,寓意千万次的问答,其在复杂指令理解、文学创作、通用数学等方面能力不断提升。通义千问 2.0 在综合性能上超过了 GPT-3.5,并在加速追赶 GPT-4。通义千问 2.5 更名为 “通义”,致力于成为人们的工作、学习、生活助手。, J3 D$ N9 x( D i- ~; u
通义模型家族不仅包括语言模型,还扩展到多个行业特定的大模型,如通义灵码帮助写代码等、通义智文提供长文本提要等、通义听悟提供音视频转写等功能、通义星尘支持情感陪伴等场景、通义点金解读财报研报等、通义晓蜜提供智能客服方案、通义仁心提供健康助手功能、通义法睿提供法律咨询服务。同时,通义家族积极向开源社区贡献 AI 模型,阿里云推出的 “百炼” 平台支持企业用户快速接入和部署通义千问系列大模型,ModelScope 社区也成为中国最大 AI 模型社区。; _1 @, ^8 X: S/ D
在大模型领域,阿里持续发力,用技术和思路创新走出一条不一样的路。阿里达摩院在国内率先构建 AI 统一底座,实现模态表示、任务表示、模型结构的统一。通义统一底座中的单一 M6-OFA 模型,在不引入任何新增结构的情况下,可同时处理多项单模态和跨模态任务,并达到国际领先水平。近期 M6-OFA 完成升级后可处理超过 30 种跨模态任务。通义统一底座的模块化设计借鉴人脑模块化设计,以场景为导向灵活拆拔功能模块,实现高效率和高性能。) l4 j- b( J5 l, r& s9 V
(二)投资策略8 X; g8 W7 H% k2 u2 j, _
: |) U+ e+ Z# D1 c% j' @
阿里通过云计算入股人工智能初创公司,复制 “微软 - OpenAI” 模式。例如,阿里已对 AI 创企月之暗面投资 8 亿美元,持股 36%。月之暗面作为一家成立于 2023 年 3 月的国内初创企业,专注于通用人工智能领域的研发,其标志性产品 Kimi 智能助手于 2023 年 10 月发布,作为全球首个支持 20 万汉字输入的 C 端智能助手产品,以 “长文本” 汉字输入和无损记忆技术为核心,为用户带来卓越体验。
. K6 H1 B$ |6 T" E此外,全球 AI 独角兽盘点显示,过去一年新增 17 家 AI 独角兽,中国占 5 家,分别是月之暗面、MiniMax、零一万物、百川智能和智谱 AI。这些 AI 初创企业成为独角兽背后,是英伟达、谷歌、微软、阿里巴巴等科技巨头们的竞相押注。所有新成立的中国独角兽企业均获得了阿里巴巴集团的投资。% b4 C# e ~+ _! g5 |
阿里巴巴集团主席蔡崇信和首席执行官吴泳铭在股东信中明确表达了公司对于 AI 的重视和期待,将 AI 视为改变和加速业务增长的最强大变量,并将继续加大对 AI 领域的投入和研发力度。
^1 U1 s% o8 x: T' n, gT 腾讯:依托微信流量复制成功,一直比较克制+ q% K, w2 x/ w' z/ X
( ~8 V. @% ^) P1 i7 R4 Q
: m2 C+ x! F! }$ d. m$ i9 t- |
(一)产品矩阵
9 ?8 e% S/ @9 _$ R& p( n; Z* Y2 d: Z0 k
腾讯在 AI 方向拥有丰富的产品矩阵。其中,腾讯混元大模型具备强大的中文创作、逻辑推理和任务执行能力,其丰富的语义理解能力能够准确把握各种自然语言文本的含义;文本生成能力可用于创作文章、编写故事等;跨模态处理能力支持文字生成图像、视频等多模态数据处理;大规模预训练技术使其在各种下游任务上表现出色;持续优化与更新保证了模型始终处于最佳状态;多场景应用支持涵盖教育、医疗、金融等多个领域,并注重用户数据的安全性和隐私保护。
/ n* Y' N8 @6 [/ w" k/ s. `9 R) p* |腾讯企点公布的智能化产品矩阵也十分强大。在 B2C 私域营销方面,企点营销云融合腾讯大数据和微信生态特色能力,推出营销与分析一体化产品套件,助力企业解决数据接入与管理、敏捷分析与决策、全旅程智能营销三大私域营销难题。企点营销云涵盖了 CDP 客户数据平台,实现全域数据实时融合,通过多渠道接入、OneID 打通、多实体管理、标签生成和分群分层,为企业提供精准的全域人群洞察和数据资产服务。此外,还有融合分析、行为分析、画像分析、会话分析、AB 实验分析等功能,实现全景分析与决策,以及营销自动化、SCRM 社群营销、客户忠诚度管理、智能推荐等全旅程智能营销工具。在 B2B 商机撮合方面,企点商通应用将基础消息、AI 能力与行业业务流程、数据深度结合,实现智能商机识别,提升中小企业交易效率。
2 b2 t4 t1 N" N* v7 g8 \) X+ @/ O腾讯云还拥有丰富的识图、识人、识字工具及全链路 AI 大模型产品矩阵。如腾讯云神图是云端一体化人像智能平台,支持高速人脸搜索、像素级精度人像分割和行人重识别等功能,为智慧零售、文创等领域提供解决方案;腾讯云慧眼是 AI 实名核实身份平台,具备证件 OCR 检测、活体检测、人脸对比等功能,满足远程政务、金融等系统的核实身份需求;腾讯云 OCR 是一站式文字识别智能平台,拥有 50 多项 OCR 能力,为微信 “扫一扫”、顺丰运单识别、泰康人寿智能核保等系统提供支持。此外,还有腾讯云图像分析、智能识图、语音识别、语音合成、机器翻译、自然语言处理等产品。
' X; B! v4 Q2 v4 e S; _2 K' S腾讯云还公布了安全 AI 布局,其 AI 安全能力矩阵以大数据、机器学习、图计算、知识库等核心技术为基础,发展社交图谱分析、图像自动识别、知识表达与推理、自然语言处理四大热门 AI 领域,形成智能身份鉴定、威胁情报分析、异常流量检测等 7 项技术应用。对应的 AI 安全产品矩阵涵盖业务安全、主机安全、数据安全、移动安全、账号安全、网站与流量安全、内容安全、风控安全等 8 项安全解决方案。( E* a" m8 {5 X9 G
腾讯还推出了能克隆的 AI 智能创作助手 “腾讯智影”,推出了智影数字人、文本配音、文章转视频等 AI 创作工具。智影数字人能实现 “形象克隆” 和 “声音克隆”,创作者通过上传少量素材就能得到数字人分身和定制音色,快速生成数字人播报视频。/ x0 w7 C* W. p' ~5 `
腾讯云推出的 2D 真人小样本数智人,用户只需提交少量样本数据,如 3 分钟真人口播视频、100 句语音素材,就能在 24 小时内打造出与真人形象、语音非常逼真的数智分身,支持半身或全身形象展示,可根据内容调整动作、手势、口型、表情等,还能任意更换录制背景。
% f) h1 ]3 i3 A+ ` P, N(二)复制策略' r- P, a. u1 C, ^& l
0 y/ Y5 n; h+ V1 J: |腾讯依托巨大的微信流量,在 AI 领域具有独特的复制策略优势。微信作为拥有庞大用户基础的社交平台,为腾讯提供了海量的数据资源和丰富的应用场景。腾讯可以借助微信的流量优势,快速推广其 AI 产品和服务,降低市场推广成本。
4 K$ R0 M& T( s, l, G$ b当市场上出现优秀的产品时,腾讯凭借其强大的技术实力和资源整合能力,可以迅速对这些产品进行分析和研究,然后在不违背法律法规和道德规范的前提下,进行合理的借鉴和改进。例如,腾讯可以利用微信的社交关系链,将成功的产品模式进行优化和创新,使其更适合微信用户的需求和使用习惯。
6 T/ n% N0 x) g: _7 \/ b6 p腾讯还可以通过微信平台收集用户反馈,不断改进和完善复制的产品。由于微信用户群体广泛,不同用户的需求和意见可以为产品的改进提供丰富的参考。同时,腾讯手握更多社交娱乐类的数据,可以将模型的训练倾向于在这些场景中表现出更精准的回答、更清晰的推理逻辑,进一步提升产品的竞争力。
. I9 n& l6 i( C此外,腾讯的 “一云三平台” 架构也为复制策略提供了有力支持。“一云” 即腾讯云,为腾讯云 AI 提供强大的底层算力资源;算法平台打造数据到算法模型的全流程闭环,将 AI 能力应用到实际业务场景中;AI 服务平台将内部积累的 AI 技术能力以云服务形式提供给行业用户,降低 AI 应用门槛;开放平台连接腾讯 AI 能力与产业,推动 AI 技术和应用不断进步。腾讯还联合超过 1 万家生态合作伙伴,打造新型 AI 生态体,推动各行各业的整体化智能化升级。这种强大的技术和资源整合能力,使得腾讯在复制好产品的过程中能够更加高效地进行创新和优化,实现快速发展。6 g: f" G1 I- C( `
H 华为:国家科技实力代表. Y0 g& G4 O' ^( ?0 d4 Y. B- ?8 e/ Z
: ^; H& j+ F, e4 i& _% [* u8 N9 y
6 w0 v$ ^) p! ~" z/ [+ A+ w1 q, |: a(一)人才与技术布局/ H/ l ?* x( j/ h
7 M8 v( O9 \+ O; t* N9 [% }+ M
华为在 AI 方向的人才和技术布局堪称强大。首先,华为推出了全栈全场景解决方案,涵盖了从芯片到框架的各个层面,为 AI 应用提供了强大的技术支持。在芯片方面,华为拥有昇腾芯片系列,其中昇腾 910 性能卓越,在算力方面完全达到设计规格,且功耗低于设计值。昇腾芯片采用华为自研的达芬奇架构,该架构分为数据计算、存储和控制三个主要组成部分,其中计算单元可执行标量、向量和张量三种基础运算,如张量运算可加速 AI 应用中的矩阵运算。
9 ^0 _( E) h% p% f/ R昇腾系列芯片覆盖了从云端到边缘、终端的全场景,兼顾了不同场景下对性能和功耗的要求。例如,昇腾 910 主要针对云端训练应用,采用 7 纳米工艺制造,FP16 算力高达 256TFLOPS,INT8 算力达 512TOPS,同时支持 128 通道的全高清视频解码;昇腾 310 则针对边缘计算场景,采用 12 纳米工艺制造,最大功耗仅为 8 瓦,FP16 算力为 8TFLOPS,INT8 算力达 16TOPS,还集成了 16 通道的全高清视频解码器。3 z! x8 I! ]. M1 k& S- q
此外,华为还推出了全场景 AI 计算框架 MindSpore。MindSpore 具有显著减少训练时间和成本(开发态)、以较少的资源和最高能效比运行(运行态),同时适应包括端、边缘与云的全场景(部署态)等特性。它采用基于源码转换的通用自动微分技术,兼得 TensorFlow 和 Pytorch 两种主流深度学习框架自动微分技术的优点,支持复杂控制流场景、高阶函数和闭包,同时可在执行前对网络做静态编译优化,提高执行性能。MindSpore 还能自动实现分布式并行训练,通过构建基于数据量、模型参数量、网络集群拓扑带宽等信息的代价模型,自动选择代价最小的模型切分方式,并绑定模型到设备执行,让开发者无需费力设计分布式并行训练配置,只需专注于模型逻辑开发。 m$ } K' [2 F$ }8 d: I( j# y
MindSpore 中的数据处理功能名为 MindData,用于完成训练过程中数据的 pipeline 处理,具备数据加载、数据增强、导入训练等功能,并提供了简单易用的编程接口,以及覆盖 CV/NLP 等全场景的丰富数据处理能力。同时,MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,在保证用户隐私数据保护的前提下跨场景协同,还将模型保护内建于框架中,实现模型的安全可信。通过实现 AI 算法即代码,MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。
5 O) ]4 m6 g( q在人才培养方面,华为云举办 AI 院长峰会,联合国内顶尖高校共同成立华为云 AI 人才培养专家指导委员会,并发布华为云 AI 人才培养五大计划,包括 “AI 十百千”、“AI 产学研”、“AI 俱乐部”、“AI 训练营”、“AI 人才汇”。未来,华为云将邀请学术界专家共同解决十大人工智能产业难题,助力 AI 产业发展;与各高校持续深入合作,践行产教融合;在各高校成立 AI 俱乐部,设立 AI 训练营,为各高校人才培养提供多种资源支持;面向全球招聘天才少年和顶尖学生,培养未来的技术领军人物。6 u* s! e% u) z, P5 ~; @, `, c
(二)政府订单优势. A4 F3 Z2 ]( o
J8 U; ]$ a: X2 d: R3 i( j华为作为国家科技实力的代表,在政府采购中具有显著优势。一方面,华为依托其在 5G、云计算、人工智能等领域的突出表现,成功把握住了新政府采购政策强调的成本效益、技术创新和自主知识产权等机遇。华为每年投入巨资于研发,建立了由顶尖工程师和科学家组成的强大团队,专注于探索和突破前沿技术。在通信基础设施、芯片设计和操作系统等关键领域奠定了坚实的技术基础,使其在技术深度和广度上都保持领先。例如,华为的 5G 技术在速度和稳定性上达到行业领先水平,其基站和网络优化的创新也使其在全球 5G 标准的制定中占据重要位置。在智能手机市场,华为自主开发的海思麒麟芯片系列凸显了其硬件和软件的独立创新能力,提升了产品性能,增强了在供应链控制方面的优势。
! d1 w. p' s! G另一方面,华为的产品在技术先进性、安全性、稳定性及长期服务支持方面均受到认可。在数字政府建设中,华为的全栈全场景解决方案为政务应用提供了高性能的运行底座。例如,在襄阳,华为云与襄阳打造的智慧城市在全国走在前列,95% 以上的市直政务应用部署在襄阳云,覆盖 90 多个局委办的超过 400 个业务系统。4 q, m: N6 W6 |8 c$ Z% p& F7 R
在锦州,华为辽宁大区(锦州)云计算中心的建成,有效提升了辽宁省云产业的基础能力,助推辽宁经济高质量发展迈向新阶段。华为在推动以锦州为轴心的辽宁数字政府、数字经济、数字社会建设上取得了积极成效,从顶层技术、政策推动、数据整合、智慧应用和产业生态激活等方面全面助力锦州数字化转型。同时,华为在新技术融合能力和丰富的数字政府项目运营经验方面表现出色,能够将 5G、AI 和云有机融合,为行业赋能,深入理解政府业务需求,提供深度解决方案。这些优势使得华为在政府大订单的竞争中占据有利地位。
9 k! b2 z# \* F' _% m内容来源:舒卫兵 |