作者stpiknow (H)
看板Tech_Job
标题[新闻] 亚马逊、Alphabet、Meta和微软在AI晶片
时间Mon Apr 29 08:08:28 2024
亚马逊、Alphabet、Meta和微软在AI晶片的布局,长期将带给辉达麻烦
原文网址:
https://bit.ly/3UfIw3P
原文:
亚马逊、Alphabet、Meta和微软是AI云端运算领域的四大参与者。他们也恰好是辉达GPU
的最大买家之一。可是这四家云端巨头的另一个共同点是他们都在制造自己的晶片,寻求
互补辉达无法满足其AI客制化的供应。
其实,辉达的GPU非常昂贵,所以四家云端供应商都希望并且需要控制不断飙升的资本支
出预算。Meta、微软、亚马逊和Alphabet 在AI基础设施上投入了大量资金。根据
FactSet估计,2024财年这四家的资本支出总计预计将达到1,780亿美元,比2023年增加
26%以上。唯有透过设计自己的解决方案来实现,涵盖软体、硬体和晶片的大部分成本。
以亚马逊为例,其於2015年透过收购以色列晶片设计公司Annapurna Labs进军晶片业务。
这笔交易最後产生了三种晶片:一种名为Graviton的CPU,亚马逊称其性价比比同类x86晶
片高出40%;用於训练LLM的Trainium;以及用於AI推理工作负载的Inferentia。
亚马逊也投资OpenAI的敌手Anthropic。如今Anthropic用Trainium来训练其AI模式。
Airbnb、位元组跳动、Snap和德国电信都是 Inferentia 的客户。 亚马逊使用自己的晶
片来运行 Alexa、亚马逊广告及其新的 Rufus 购物机器人。
Alphabet 旗下的谷歌近十年来一直在开发AI晶片,且创建完整系统的优势,不仅是晶片
,还包括相关的软体、网路基础设施和储存。谷歌将其晶片称为TPU(Tensor Process
Unit)。谷歌正在开发第五代TPU,它有两种类型,一种专注於效能,另一种则针对效率
。
谷歌使用TPU建立大型语言模型,包括其广泛部署的Gemini软体。它还依赖TPU来驱动
Google Mail和其他服务。 许多依赖Google TPU的新创公司包括制造个人化聊天机器人的
Character AI和提供文字到图像软体的Midjourney。
Meta则是推出了第二代AI晶片,称为MTIA(Meta Training and Inference Accelerator
)。Facebook和Instagram都正在使用MTIA晶片来支援社群媒体排名和广告模式。Meta表
示,MTIA 是一项长期事业,旨在为 Meta 独特的工作负载提供最高效的架构。
至於微软,其於2023年推出了Azure Maia 100 AI Accelerator,这是一款用於模型训练
和推理的晶片。到目前为止,微软仅限於内部工作负载的使用。未来微软将重新构想从晶
片到伺服器到系统再到数据中心基础设施的每一层,以最大限度地提高效能和效率。
总之,这四家厂商不太可能将其AI晶片贩售给其他业者,并与辉达竞争。但是其生产的AI
晶片,仍会逐渐削弱辉达在AI晶片的占有率,甚至未来的影响力。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1714349311.A.41A.html
1F:→ zzahoward : 长期来说 我们都死惹 04/29 08:40
2F:推 arslanhs : 老黄包围网 04/29 08:41
3F:→ soliboy : 长期来说 这些公司都会倒 04/29 08:46
4F:推 Raikknen : 顶多自用 04/29 08:52
5F:推 robin101246 : 长期来说 地球会毁灭 04/29 09:02
6F:推 abbei : 长期来说 1+1=2 04/29 09:04
7F:推 rogergon : 就想像是系统厂自己设计软硬体不走wintel 04/29 09:08
8F:→ rogergon : 从历史教训看,很难玩得过老黄的业界标准 04/29 09:09
9F:→ rogergon : 除非像linux+arm做出另一个标准 04/29 09:12
10F:推 yytseng : 现在看winqual会不会成功罗 04/29 09:18
11F:推 ru04hj4 : 六大派围攻光明顶 04/29 09:19
12F:→ yytseng : 不过在大模型方面他们这几家都还是买GB200 04/29 09:20
13F:→ tsairay : 只要它们抢不到GG产能就没用吧,三星和intel明显 04/29 10:08
14F:→ tsairay : 落後一段距离 04/29 10:08
15F:→ tsairay : 苹果就死抓着GG产能不放,帮自己未来AI晶片产能卡位 04/29 10:10
16F:推 pponywong : 除非它们在AI占有率可以到跟苹果手机一样 04/29 12:25
17F:→ pponywong : 否则不见得便宜 04/29 12:26
18F:→ tabrisPTT : 这几间做出来的chip…效能应该惨到不行吧 04/29 12:28
19F:推 agbr2 : 自己做chip是趋势,好不好是另一回事 04/29 13:00
20F:→ btpeter : 刚开始 哪有这麽快赶上NV 目前最新的GPU B100/GB200 04/29 13:22
21F:→ btpeter : /B200效能… 需要时间 NV也不是花了多少时间才到这 04/29 13:22
22F:→ btpeter : 样目前位置….但AI solution 绝对不会是只有GPU为主 04/29 13:22
23F:→ btpeter : 流…..ASIC/FPGA/RISC-V 都还是未知数也还在进行中 04/29 13:22
24F:→ btpeter : …. 任何的改变不是一蹴可及…. 04/29 13:22
25F:→ WSY000000000: 目前效能应该差距颇大,效益CP值到的话才有机会。 04/29 14:46
26F:推 PTIMIKE : 还不是要下单GG 04/29 17:28
27F:推 madeinheaven: 三星也要做了 04/29 17:50
28F:→ a27417332 : 什麽业界标准,他们就是想当标准呀 04/29 19:36
29F:→ a27417332 : 云三家打的算盘就是把AI服务拿来卖 04/29 19:37
30F:→ a27417332 : 只要把模型迁移到自家硬体上顺顺跑就好 04/29 19:38
31F:→ a27417332 : 只是顺不顺利就是另一件事了 04/29 19:44
32F:→ a27417332 : 补述一下,第一句前面说的是底层後面说的是AI服务 04/29 19:51
33F:→ cathychg : 尼们忘了 还有雅虎噢。亚美利坚合众合国 04/29 19:58
34F:→ Alwen : 就当初手机晶片潮再走一次而已 04/29 21:00
35F:→ Alwen : 三四年後一堆就说不玩惹 04/29 21:01
36F:→ sachialanlus: 应该会做特质化的处理器 像是 TPU LPU 那种 不然 GP 04/30 02:45
37F:→ sachialanlus: U 短时间内应该是没办法追上 04/30 02:45
38F:→ btpeter : ASIC 自己做作业 …. 04/30 07:50