让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

亚马逊创举东说念主投资Jim Keller,剑指英伟达
发布日期:2024-12-03 10:24    点击次数:74

(原标题:亚马逊创举东说念主投资Jim Keller,剑指英伟达)

要是您但愿不错接续碰面,接待标星保藏哦~

近日,由行业闻明东说念主士Jim Keller担任CEO的Tenstorrent文告完成由三星证券和 AFW Partners 领投的 6.93 亿好意思元 D 轮融资。在这轮融资之后,这家 AI 芯片初创公司的估值约为 26 亿好意思元。

Tenstorrent 创举东说念主兼半导体前驱 Jim Keller 在接管采访时示意,该公司但愿开发一款芯片,试图碎裂 Nvidia 对 AI 业务的摆布,该公司在由韩国 AFW Partners 和三星证券领投的一轮融资中筹集了资金。Bezos Expeditions 与 LG Electronics Inc. 和 Fidelity 联手参与了这轮融资,看好 Keller 的实力和东说念主工智能工夫范围的繁盛发展契机。

值得一提的是,Bezos Expeditions的实控东说念主为亚马逊创举东说念主Jeff Bezos。接头到AWS对英伟达芯片的采购量,不错看到这个投资背后的深档次含义。

除了领投方除外,许多闻明投资者也参与了此轮融资,其中包括 XTX Markets、Corner Capital、MESH、加拿大出口发展局、安大略省医疗待业金权谋、LG 电子、当代汽车集团、富达料理与参议公司、Baillie Gifford、Bezos Expeditions 等。

Tenstorrent方面示意,由于投资者需求苍劲,该轮融资取得逾额认购。Jim Keller 在接管采访时更是示意,该公司但愿开发一款芯片,试图碎裂 Nvidia 对 AI 业务的摆布。

Tenstorrent是谁?

对于谁是Jim Keller,媒体还是作念了许多报说念,咱们就不再多言。参考半导体行业不雅察之前发布的著作《Jim Keller的芯片研发封神之路》不错看到其后光的资格。至于Tenstorrent,则是一家由Jim Keller解救并担任CEO的公司。

Tenstorrent 总部位于加利福尼亚州圣克拉拉,主要开发和销售专为 AI 责任负载而联想的研究系统,这些系统均围绕该公司的 Tensix 中枢开发。该公司的愿景是碎裂 Nvidia 在芯片硅片市集的摆布,联想出更实惠的 AI 检会和部署硬件,幸免使用 Nvidia 使用的高带宽内存等崇高组件。

“要是你使用 HBM,你就无法打败 Nvidia,因为 Nvidia 购买的 HBM 最多,况且具有资本上风,”Jim Keller在接管彭博社采访时期说。“但他们耐久无法像 HBM 内置到他们的家具和插槽中那样缩短价钱。”

人所共知,Nvidia 为开发东说念主员提供了全套私有工夫,涵盖从芯片到互连致使数据中心布局的方方面面,并开心总计部件皆能更好地责任,因为它们是协同联想的。而竞争敌手 AMD和 Tenstorrent 等公司则努力于于与其他工夫提供商竣事更大的互操作性,不管是通过分享行业法式如故通达联想供他东说念主使用。

为了勾引更多潜在客户,该公司专注于与其他供应商进行可互操作的硬件联想。它使用通达法式的RISC-V 处理器架构,旨在为工程师和开发东说念主员提供一个更通达的生态系统,以便将其处理器和系统应用于他们的数据中心和办事器竖立。“昔日,我使用私有工夫,这果真很沉重,”Jim Keller 说。“开源不错匡助你构建更大的平台。它勾引了工程师。是的,这是一个充满神色的款式。”

为了竣事这一主义,Tenstorrent将 AI 和 RISC-V 常识产权授权给想步调有和定制专用芯片的客户。RISC-V 是一种开源教导架构,用于基于所谓的“精简教导集”为不同应用开发定制处理器,这使得它杰出易于使用、定制和优化功率、性能和功能。

与 RISC-V 和日本合营伙伴 Rapidus不异,Tenstorrent 仍有许多需要证明的场所。迄今为止,这家新兴公司已与客户缔结了总和近 1.5 亿好意思元的条约,与 Nvidia 每季度数百亿好意思元的数据中心收入比较,这小巫见大巫。

该公司示意,将愚弄新资金构建开源 AI 软件堆栈,并聘任开发东说念主员来扩大全球开发和联想中心。这将使该公司简略构建系统和云,供 AI 开发东说念主员在其系统上使用和测试模子。

Tenstorrent 示意,其首批芯片由 GlobalFoundries制造,下一代芯片改日自台湾半导体制造公司和三星电子公司。该公司还运转为顶端的 2 纳米制造进行联想。台积电和三星将于来岁运转大范围坐蓐,Tenstorrent 正在与他们以及日本的 Rapidus 进行谈判,后者的主义是在 2027 年竣事 2 纳米产量。

XTX Markets 首席工夫官 Joshua Leahy 示意:“咱们发现 Tenstorrent 的开源驱动要道令东说念主焕然如新,尤其是在私有且接续守密的 AI 加快器范围。”

跟着公司运转愚弄新资金扩大范围,它将在 Nvidia 占据上风的市蚁合靠近阻力。联系词,Jim Keller 仍然投诚,通过提供更实惠、不错证实业务需求量身定制的 AI 芯片,并每两年发布一款新处理器,不错匡助该公司在 AI 芯片行业保执生意上可行的家具。

在接管媒体采访的时期,Jim Keller曾回想说:

Tenstorrent 是一家联想公司。咱们联想CPU,咱们联想东说念主工智能引擎,咱们联想东说念主工智能软件堆栈。

因此,不管是软 IP、硬 IP chiplet如故完满芯片,这些皆是竣事。咱们在这方面很机动。举例,在 CPU 上,咱们将在咱们我方的chiplet流片之前对其进行屡次许可。咱们正在与六家想要从事定制内存芯片或 NPU 加快器等业务的公司进行交谈。我以为对于咱们的下一代,不管是 CPU 如故 AI,咱们将构建 CPU 和 AI chiplet。但随后其他东说念主会作念其他的小芯片。然后咱们会将它们整合到系统中。

凭啥挑战英伟达?

从上头的先容中,咱们分享了Tenstorrent的愿景。接下来,咱们了解一下这家公司的家具和蹊径图。

在2023年三月,Tenstorrent 的首席 CPU 架构师 Wei-Han Lien 在接管媒体采访的时期就示意,由于 Tenstorrent 着眼于责罚平常的 AI 应用问题,因此它不仅需要不同的片上系统或系统级封装,还需要多样 CPU 微架构竣事和系统级架构,以竣事不同的功率和性能主义。

Tenstorrent 示意,公司的CPU 团队开发了一种无序 RISC-V 微架构,并以五种不同的方式竣事它,以满足多样应用的需求。

Tenstorrent 当今有五种不同的 RISC-V CPU 中枢 IP,包括双宽、三宽、四宽、六宽和八坦然码,可用于我方的处理器或授权给感兴致的各方。对于那些需要杰出基本的 CPU 的潜在客户,该公司不错提供具有双宽施行材干的小中枢,但对于那些需要更高性能用于边际、客户端 PC 和高性能研究的客户,它有六宽 Alastor 和八宽 Ascalon 中枢。

每个具有八坦然码的无序 Ascalon ( RV64ACDHFMV ) 中枢皆有六个 ALU、两个 FPU 和两个 256 位矢量单位,因此杰出纷乱。接头到当代 x86 联想使用四宽 (Zen 4) 或六宽 (Golden Cove) 解码器,咱们看到的是一个功能杰出纷乱的中枢。

除了多样 RISC-V 通用中枢外,Tenstorrent 还领有专为神经收罗推理和检会量身定制的私有 Tensix 中枢。每个 Tensix 中枢由五个 RISC 中枢、一个用于张量运算的数组数学单位、一个用于矢量运算的 SIMD 单位、1MB 或 2MB 的 SRAM 以及用于加快收罗数据包操作和压缩/解压缩的固定功能硬件构成。Tensix 中枢解救多种数据形式,包括 BF4、BF8、INT8、FP16、BF16 致使 FP64。

截止2023年三月,Tenstorrent 有两种家具:一种名为 Grayskull 的机器学习处理器,提供约 315 INT8 TOPS 的性能,可插入 PCIe Gen4 插槽;另一种是联网的 Wormhole ML 处理器,性能约为 350 INT8 TOPS,使用 GDDR6 内存子系统、PCIe Gen4 x16 接口,并与其他机器开采 400GbE 贯穿。

这两种开采皆需要主机 CPU,可手脚附加板使用,也可内置于预置的 Tenstorrent 办事器中。一台 4U Nebula 办事器包含 32 张 Wormhole ML 卡,可提供约 12 个 INT8 POPS 的性能,功率为 6kW。

在本年八月举办的 Hot Chips 上,Tenstorrent袒露了Blackhole AI 加快器进行。与之前手脚基于 PCIe 的加快器部署的 Greyskull 和 Wormhole 部件不同,Tenstorrent 的 Blackhole旨在手脚寂寥的 AI 研究机运行。

他们宣称,该加快器在原始研究和可彭胀性方面不错胜过 Nvidia A100。据先容,每个 Blackhole 芯片皆领有 745 teraFLOPS 的 FP8 性能(FP16 为 372 teraFLOPS)、32GB 的 GDDR6 内存和基于以太网的互连,简略在其 10 个 400Gbps 链路上竣事 1TBps 的总带宽。

Tenstorrent 展示了其最新芯片如安在性能上比 Nvidia A100 GPU 略有上风,尽管在内存容量和带宽方面皆逾期。联系词,就像 A100 不异,Tenstorrent 的 Blackhole 旨在手脚横向彭胀系统的一部分进行部署。这家 AI 芯片初创公司权谋将 32 个 Blackhole 加快器以 4x8 网格的样式贯穿起来,塞进一个节点,并将其称为 Blackhole Galaxy。

总体而言,单个 Blackhole Galaxy 开心 FP8 的 23.8 petaFLOPS 或 FP16 的 11.9 petaFLOPS,以及简略提供 16 TBps 原始带宽的 1TB 内存。此外,Tenstorrent 示意,该芯片的中枢密集型架构(咱们稍后会真切探讨)意味着这些系统中的每一个皆不错用作研究或内存节点,或用作高带宽 11.2TBps 的 AI 交换机。

Tenstorrent 东说念主工智能软件和架构高档参议员 Davor Capalija 示意:“你不错用它手脚乐高积木来搭建整个检会集群。”

值得一提的是。Tenstorrent 使用板载以太网,这意味着它幸免了在芯片到芯片和节点到节点收罗中处理多种互连工夫所带来的挑战,而 Nvidia 则必须使用 NVLink 和 InfiniBand/以太网。在这方面,Tenstorrent 的横向彭胀计谋与英特尔的Gaudi 平台杰出相似,后者也使用以太网手脚其主要互连。接头到 Tenstorrent 权谋在一个盒子里塞入几许个 Blackhole 加快器,更无须说一个检会集群,望望它们奈那儿理硬件故障将会很意旨。

Tenstorrent 示意,Blackhole之是以能手脚寂寥的 AI 研究机运行,主要归功于 16 个“Big RISC-V”64 位、双放射、有序 CPU 中枢,这些中枢成列在四个集群中。至关迫切的是,这些中枢饱胀纷乱,不错手脚运行 Linux 的开采主机。这些 CPU 中枢与 752 个“Baby RISC-V”中枢配对,后者厚爱内存料理、片外通讯和数据处理。

联系词,现实研究是由 Tenstorrent 的 140 个 Tensix 中枢处理的,每个中枢由五个“Baby RISC-V”中枢、一双路由器、一个研究空洞体和一些 L1 缓存构成。

研究空洞体由一个用于加快矩阵责任负载的图块数学引擎和一个矢量数学引擎构成。前者将解救 Int8、TF32、BF/FP16、FP8 以及 2 到 8 位的块浮点数据类型,而矢量引擎则以 FP32、Int16 和 Int32 为主义。

据他们所说,这种建树意味着该芯片不错解救 AI 和 HPC 应用中的多样常见数据模式,包括矩阵乘法、卷积和分片数据布局。

总体而言,Blackhole 的 Tensix 中枢占了 752 个所谓的板载 RISC-V 中枢中的 700 个。其余中枢厚爱内存料理(“D”代表 DRAM)、片外通讯(“E”代表以太网)、系统料理(“A”)和 PCIe(“P”)。

除了新芯片除外,Tenstorrent 还公开了其加快器的 TT-Metalium 初级编程模子。

练习 Nvidia CUDA 平台的东说念主皆知说念,软件不错成就或消灭性能最高的硬件。事实上,TT-Metalium 有点让东说念主空预见 CUDA 或 OpenCL 等 GPU 编程模子,因为它是异构的,但不同之处在于它是从“AI 和横向彭胀”研究运转构建的,Capalija 解释说念。

其中一个辞别是内核自己是带有 API 的纯 C++。“咱们以为不需要零散的内核话语,”他解释说念。

鸠合 TT-NN、TT-MLIR 和 TT-Forge 等其他软件库,Tenstorrent 旨在解救使用 PyTorch、ONNX、JAX、TensorFlow 和 vLLM 等常用运行时在其加快器上运行任何 AI 模子。

替代英伟达是许多东说念主的认识,但替代英伟达似乎是任何一个东说念主皆很难达成的主义。举例,世界皆知说念,英伟达能稳坐垂钓台,除了收货于其跳动的硬件外,包括CUDA在内的软件实力,是他们能摆布于今的根底。

但Jim Keller曾示意:“CUDA并不是护城河,而是池沼。”他同期以为,GPU并不是运行东说念主工智能的通盘。

“我但愿不错匡助客户构建我方的家具,这是一件很酷的事情,您不错领有并戒指它,而无须向其他东说念主支付 60% 或 80% 的毛利率。因此,当东说念主们告诉咱们 Nvidia 还是赢了,并问为什么 Tenstorrent 会参与竞争时,那是因为唯有存在利润率极高的摆布,就会创造商机。”Jim Keller说。

在笔者看来,亚马逊后续会奈何与英伟达battle,也会是一个专诚念念的话题。

https://www.bloomberg.com/news/articles/2024-12-02/jeff-bezos-is-betting-on-ai-chip-startup-tenstorrent-to-take-on-nvidia-nvda

https://siliconangle.com/2024/12/02/ai-chip-startup-tenstorrent-raises-693m-deepening-rivalry-nvidia/

https://www.tomshardware.com/news/tenstorrent-shares-roadmap-of-ultra-high-performance-risc-v-cpus-and-ai-accelerators

https://www.theregister.com/2024/08/27/tenstorrent_ai_blackhole/

半导体宏构公众号推选

专注半导体范围更多原创内容

暖和全球半导体产业动向与趋势

*免责声明:本文由作家原创。著作内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或解救,要是有任何异议,接待有关半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第3965期内容,接待暖和。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的内容就点“在看”分享给小伙伴哦