资源与支持

SiFive 博客

来自 RISC-V 专家的最新洞察与深度技术解析

March 10, 2025

SiFive 如何推动 AI 和数据中心创新

生成式 AI 的兴起使数据中心设计和优化成为行业关注的焦点。数据中心芯片需具备高性能和低延迟,以支持最新的 AI 计算任务。同时,可持续性也已成为数据中心的重要考量,因此数据中心芯片必须具备极高的效能。此外,芯片设计还得要具有灵活性,以便企业能够根据需求扩展 Cluster 数量。

Datacenter

过去几个月里,行业内一项极具潜力并可能带来变动的就是 Deepseek 的发布。Deepseek 称其模型相比竞品可显著减少计算资源的消耗,从而降低能源使用成本。直到 2024 年底,SiFive 与客户的交流仍主要集中在如何加快部署速度,而效能和成本相对而言并未成为首要考量。然而,2024 年年中时,SiFive 首席架构师提出了一个重要观点:行业即将进入更加重视可持续性的阶段。无论 Deepseek 最终是否能取得领先地位,关键在于,当技术专家聚焦于不同的衡量指标时,将会创造出全新的可能性。这一趋势将成为一个拐点,促使企业在大规模部署时重新评估其系统架构。

为了应对性能和能效挑战,越来越多的企业正转向 RISC-V 生态系统。RISC-V 之所以广受欢迎,在于其卓越的灵活性。若从零开始构建系统,选择一个带有历史包袱的现有指令集架构(ISA)可能并不明智,因为这可能会导致设备或数据中心内部需要兼容多种不同的软件架构。而 RISC-V 采用模块化、可扩展的设计,提供灵活且高效的全新选择。

SiFive Performance P870-D 充分利用 RISC-V 的灵活性,为数据中心、汽车和嵌入式系统带来高计算密度和出色的可扩展性。更高的计算密度可提高每瓦性能(performance-per-watt),从而降低总拥有成本(TCO)。

而当 P870-D 与 SiFive Intelligence 产品系列相结合时,数据中心架构师可以打造高性能且极具效能的 AI 计算子系统。SiFive 的 Intelligence XM 系列在 AI 计算领域表现卓越,具备超强的可扩展性和高效能计算引擎。XM 系列通过将标量(scalar)、向量(vector)和矩阵(matrix)计算引擎相结合,实现更高效的内存带宽,同时提供极高的每瓦性能(performance-per-watt)。除了数据中心应用,XM 系列还非常适合用于边缘 AI 物联网设备、消费电子设备、下一代电动汽车和自动驾驶汽车等领域。

为了帮助企业加速开发,SiFive 正致力于开源 SiFive Kernel Library(SKL)的参考实现。SKL 是一个经过全面优化的 C/C++ 库,包含一系列针对 SiFive 处理器精调的计算例程,可以最大化算法吞吐量。此外,SiFive 还提供大量资源来帮助优化大型语言模型 (LLM)。

凭借 RISC-V 解决方案,SiFive 正助力 AI 和数据中心迈向更高效、可持续的未来。

Read more Insights from the RISC-V Experts

Investing In Our Next Chapter of Growth
Blog Post
Investing In Our Next Chapter of Growth
Today, we are proud to announce one of the most significant milestones in our journey: a $400M funding round led by Atreides Management with other A-list investors, valuing the company at $3.65 billion and will accelerate SiFive’s RISC-V CPU and AI IP solutions into the heart of the data center and AI infrastructure markets.
RISC-V 代码模型(2026 版)
Blog Post
RISC-V 代码模型(2026 版)
RISC-V 指令集架构 (ISA) 在设计上兼顾简洁与模块化。为了实现上述设计目标,RISC-V 有意识地减少了寻址方式的种类,从而降低了实现复杂 ISA 时的一项重大成本。寻址方式成本高昂:在小型设计中,会增加解码开销;在大型设计中,则会引入隐式依赖成本。
模块化是 AI 的未来:为何 SiFive-NVIDIA 的里程碑意义重大
Blog Post
模块化是 AI 的未来:为何 SiFive-NVIDIA 的里程碑意义重大
AI 的巨大潜力目前正受限于一个主要瓶颈:数据传输。在当今系统中,GPU 的处理速度往往受到互联技术以及 CPU、加速器与系统其余部分间数据流动效率的限制。