电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

开云体育app

开云体育APP

开云体育 史上最大AI芯片IPO了!五位芯片老炮用十年赌AI算力爆发

发布日期:2026-05-15 09:12 来源:未知 作者:admin 浏览次数:

开云体育 史上最大AI芯片IPO了!五位芯片老炮用十年赌AI算力爆发

频繁咱们见到的电脑芯片只须指甲盖大小,GPU 也就巴掌大,好意思国加州一家叫 Cerebras 的公司造出的芯片跟一个大号餐盘差未几,直径卓越 200 毫米,面积 46,225 正常毫米,集成了 4 万亿个晶体管。

这家公司于 2026 年 5 月 14 日在纳斯达克上市,刊行价 185 好意思元,开盘价 350 好意思元,首日大涨 89%,市值冲到 750 亿好意思元。五位和洽创举东说念主有四位来自一家被 AMD 收购的办事器公司 SeaMicro,另一位来自 MIT。他们从 2015 岁首始默然干了近十年,如今带着晶圆级芯片站到了 AI 算力竞赛的最前排。

Cerebras 的中枢家具叫晶圆级引擎,现在也曾发展到第三代 WSE-3。传统芯片制造是把一派晶圆切成上百颗小芯片,Cerebras 反治其身,不切割,平直把整片晶圆作念成一颗芯片。这片晶圆上集成了 84 颗杜撰晶粒,每颗晶粒包含约莫 10,700 个中枢,通盘芯片一共有 90 万个磋磨中枢。

这些中枢通过一个 2D 网格状的片上网罗理解,每个中枢配有一个五端口的路由器,相沿四个标的的数据传输和土产货的读写操作。通盘芯片的内存带宽达到每秒 21 拍字节,片上网罗带宽每秒 214 拍字节。

WSE-3 芯片弃取台积电 5 纳米工艺制造,每个磋磨中枢的面积约莫 3.8 万正常微米,其中一半是 48KB 的土产货 SRAM,另一半是逻辑电路。通盘芯片的 SRAM 总量达到 44GB。总共内存皆散布在各中枢附近,数据从内存到磋磨单位的物理距离只须几十微米,不需要像传统 GPU 那样通过外部高带宽内存 HBM 来获取数据。Cerebras 宣称,在同等硅单方面积下,他们的内存带宽是 GPU 的约莫 200 倍。

这种架构荒谬顺应处理神经网罗的非结构化疏淡,传统 GPU 不管权重是否为 0 皆会进行磋磨,Cerebras 的作念法是在发送端就把 0 值过滤掉,只把非 0 数据通过片上网罗传给对应的磋磨中枢。每个数据包包含 16 位数据和 16 位阻抑信息,汲取端收到数据后自动触发乘加运算。这种方式幸免了巨额无效磋磨,在疏淡度较高的模子上不错赢得昭着加快。

该公司的时刻白皮书清晰,关于 BLAS 级别低于通用矩阵乘法的运算,比如矩阵向量乘或向量标量乘,传统芯片受限于内存带宽时时无法满负荷运行,Cerebras 的架构因为内存带宽裕如高,不错保握高运用率。

Cerebras 的另一个中枢时刻叫 Weight Streaming,老师大模子时模子权重不存储在芯片上,而是放在一个叫 MemoryX 的外部竖立里,按需流式传输到 WSE-3 芯片。磋磨每一层网罗时,权重从外部 DRAM 和闪存中读取,通过芯片的输入输出接口送入磋磨中枢。

每个权重到达中枢后,与土产货的激活值批量作念乘加运算,磋磨完成后权重就被丢弃,开云kaiyun体育app登录入口不在芯片上停留。这种方法使得模子大小不受芯片内存容量的限度,不错相沿万亿参数级别的超大模子。

在软件层面,Cerebras 提供了好意思满的编译器用链,不错把 PyTorch 或 TensorFlow 编写的模子自动映射到 90 万个中枢上。关于 Transformer 类模子,激活张量有三个维度,批大小、序列长度和荫藏维度。编译器会把荫藏维度切分到芯片的 X 标的,把批大小和序列长度切分到 Y 标的。

磋磨矩阵乘法时,权重按行播送到对应列的总共中枢,触发乘加运算,然后在列方朝上进行部分和归约,最终后果散布在芯片上准备下一层的磋磨。总共磋磨休养皆是静态设立的,教唆在运行前一次性加载,实际进程中不再编削。

Cerebras 的五位和洽创举东说念主均有较深的芯片和系统布景。

CEO Andrew Feldman 毕业于斯坦福大学,此前创办的微办事器公司 SeaMicro 被 AMD 以 3.57 亿好意思元收购。

CTO Sean Lie 领有麻省理工学院电子工程与磋磨机科学学士和硕士学历,在 SeaMicro 担任 IO 杜撰化架构师,被 AMD 收购后成为 AMD 院士。

系统架构师 Jean-Philippe Fricker 领有洛桑联邦理工学院硕士学历,曾在 DSSD、SeaMicro、阿尔卡特朗讯和 Riverstone Networks 担任硬件架构职务。

先进时刻首席架构师 Michael James 领有加州大学伯克利分校分子神经生物学、数学和磋磨机科学三个学位,在 SeaMicro 细密散布式系统软件。

已荣誉退休的前 CTO Gary Lauterbach 领有 50 多项专利,曾是 Sun Microsystems 的特出工程师,主导了 UltraSPARC III 和 UltraSPARC IV 微处理器的架构想象。

Cerebras 的交易模式以销售好意思满的 CS-3 系统为主,CS-3 是围绕 WSE-3 芯片想象的整机系统,不错部署在数据中心的表率机架上。客户主要来自科研机构和企业,包括阿联酋的东说念主工智能公司 G42 和穆罕默德·本·扎耶德东说念主工智能大学。把柄上市裸露文献,2025 年 Cerebras 营收 5.1 亿好意思元,其中 G42 孝顺了 24%,MBZUAI 孝顺了 62%。公司全年净利润 2.38 亿好意思元,比较前一年的弃世 4.82 亿好意思元完了了扭亏为盈。

开云体育官方网站 - KAIYUN

Cerebras 曾在 2024 年尝试上市,其时营收高度依赖单一客户 G42,后者孝顺了 87% 的收入。由于触及阿联酋布景的往来需要经过好意思外洋国投资委员会的审查,天然最终赢得批准,Cerebras 如故撤离了上市央求。此次再行上市,客户纠合度也曾有所改善,最大客户 MBZUAI 占比降到 62%,不外前两大客户共计仍然孝顺了 86% 的收入,纠合风险依然存在。

Cerebras 的时刻道路在 AI 芯片界限独树一帜。其他挑战者大多在架构上师法 GPU,弃取巨额小中枢相助 HBM 内存,Cerebras 弃取了用一派弘远的晶圆来惩处问题。这种有贪图在疏淡磋磨和大模子推理上有昭着上风,不外制形成本和良率也靠近挑战。

整片晶圆上只须有一个致命劣势就可能影响整颗芯片,Cerebras 通过在想象中加入冗余链路和自动纠错机制来惩处这个问题。晶圆级芯片的功耗和散热亦然工程艰巨,CS-3 系统为此想象了非凡的液冷有贪图。

跟着 OpenAI、Anthropic、SpaceX 等 AI 公司行将陆续上市,AI 芯片赛说念正在成为成本市集的焦点。Cerebras 行动第一家登陆纳斯达克的纯 AI 芯片新股,首日大涨 89% 给了后续企业一个积极的信号。

不外 AI 芯片市集的竞争也在加重,除了英伟达,AMD、英特尔以及多家创业公司皆在推出新家具。Cerebras 的晶圆级有贪图能否在主流 AI 老师市集站稳脚跟,还需要更多客户和更万古候来试验。

参考贵府:

https://www.nytimes.com/2026/05/14/technology/cerebras-ipo-ai.html

https://www.linkedin.com/in/sean-lie-4a80097/

https://www.cerebras.ai/company/news

https://www.cerebras.ai/

排版:胡巍巍