而在2026年的CES上,英伟达直接自己做了一套面向KV Cache的存储层。由于英伟达的KV Cache存储层明确采用了SSD,而当前SSD市场正受供应紧张和价格上涨的影响,本就紧俏的市场再次被推向高潮。
Gartner 将生成式 AI 列为 2022 年五大影响力技术之一,MIT 科技评论也将 AI 合成数据列为 2022 年十大突破性技术之一,甚至将 Generative AI 称为是 AI 领域过去十年最具前景的进展。未来,兼具大模型和多模态模型的 AIGC 模型有望成为新的技术平台。 近来,腾讯发布的 ...
国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍,英伟达,gpu,黄仁勋 ...
作者:NCL编辑:Feihong,SiqiSemiAnalysis 最近对 Google TPU v7/v8 的深度拆解,可能是目前公开信息里少数能同时讲清硬件规格、互联拓扑与 TCO(Total Cost of ...
快科技7月31日消息,据媒体报道,2025(第二届)产融合作大会在北京召开。会上,浪潮存储重磅发布了推理加速存储产品AS3000G7,旨在解决大模型推理中因KV Cache重复计算导致的算力浪费和时延问题,为金融、科研等领域的模型规模化落地提供关键支撑。 当前 ...
今年的Intel Architecture Day上,更多有关Intel GPU的产品信息揭开面纱。这次Intel主要谈到了面向游戏玩家的Xe-HPG架构Alchemist GPU;以及面向数据中心的Xe-HPC架构GPU芯片Ponte Vecchio。后者被Intel形容为技术难度“堪比登月”的芯片,这也是我们第一次见到MCM(Multi-chip Module ...
根据测试结果表明,AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点 AMD目前已经在其EPYC服务器处理器和部分消费级处理器产品线上采用了3D V-Cache技术。但根据来自海外工程师的最新测试结果发现,AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点,这 ...
上期我们讲了现代计算机体系结构通过处理器(CPU/GPU)和内存的交互来执行计算程序,处理输入数据,并输出结果。实际上 ...
目前,不同大模型厂商发布的大语言模型在处理超长上下文方面已经有显著突破,最高的已能支持数百万 Token 的输入,例如 MiniMax-M1、Qwen2.5-1M 系列模型,均支持百万Token(1M)级别的超长上下文处理能力。 但是这场有关提升大模型上下文长度的“军备赛”依然不 ...
2025年9月22日,联发科发布天玑9500旗舰5G智能体AI芯片,其GPU在性能与能效方面双领跑,被众多媒体称为“最强GPU”。这也意味着天玑9500达到了当下手机移动处理器的顶尖水平,备受手游玩家关注的移动光追技术更是引发了科技媒体的诸多讨论。 其实相比CPU,更 ...
IT之家 1 月 6 日消息,在今日的 CES 2026 主题演讲中,AMD 展示了其下一代及首款 2nm EPYC Venice Zen6 CPU 和 Instinct MI455X GPU,专为 Helios AI Racks 设计。 Helios AI 机架最早在 2025 年 AMD 财务分析师日上亮相,该公司承诺将带来“领先的性能数据”,以及在 ...