CUDA Tile和cuTile Python打通了这个瓶颈。英伟达在开发者博客中提到,一个15行的Python内核性能可以媲美200行手动优化的CUDA C++代码。
经过近20年的发展,英伟达已经在全球拥有500多万的CUDA生态开发者,该公司创始人兼CEO黄仁勋多次强调CUDA开发者是英伟达最重要的资产和竞争优势。“护城河不是芯片,是数百万开发者写下的代码惯性。”黄仁勋在2025年GTC大会演讲中提到。
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
开发者必须手工管理成千上万条线程的索引、内存布局和同步,仿佛一个交响乐指挥需要亲自调试每一件乐器的音准。这种复杂性将大多数开发者挡在门外,只有少数高性能计算专家才能驾驭。
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
【TechWeb】NVIDIA日前正式推出CUDA 13.1版本,官方称其为自2006年平台诞生以来最大、最全面的升级。此次更新的核心在于引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈向一个更高抽象层级的新阶段。
编译 | 核子可乐、Tina 今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达 ...
IT之家 12 月 7 日消息,英伟达本周四发布了全新的 CUDA 13.1,这是自 2006 年 CUDA 平台问世以来规模最大的一次功能扩展更新。 英伟达介绍称,本次更新的重点在于引入了一种名为 CUDA Tile 的全新 GPU 编程方式,旨在让更广泛的开发者群体能够更轻松地运用强大的 AI 与加速计算能力。
在科技快速发展的今天,英伟达再次引领潮流。12月7日,英伟达发布了全新的CUDA 13.1,这是自2006年CUDA平台问世以来最大的一次功能扩展更新。这次更新不仅仅是对旧版本的简单升级,而是引入了一种名为CUDATile的全新GPU编程方式,旨在让更广泛的开发者群体能够轻松地运用强大的AI与加速计算能力。
NVIDIA近日正式推出CUDA Toolkit 13.1版本,官方宣称这是该平台自2006年问世以来最具颠覆性的重大更新。此次升级引入基于分块(Tile)的编程模型、Green ...
NVIDIA近日宣布推出CUDA 13.1版本,这一更新被官方誉为自2006年CUDA平台问世以来最具突破性的升级。其核心亮点在于引入了名为CUDA Tile的全新编程模型,将GPU编程的抽象层级提升至全新高度,为开发者开辟了更高效的并行计算路径。