资源与支持

SiFive 博客

来自 RISC-V 专家的最新洞察与深度技术解析

September 19, 2025

在智能加速器上构建 AI 的未来 

使用 SiFive X100 系列作为加速器控制单元(ACU)

在之前的《本地 AI 的完美解决方案》文章中,我们介绍了 SiFive Intelligence X100 产品系列的部分高层设计理念,并展示了与其他成熟厂商的性能对比。我们还讨论了 AI 市场的快速创新,以及这如何使设计“完美”的硬件加速器变得极具挑战性。而从客户那里可以看到的是,他们希望在加速器之外配备一个可编程的前端,我们称之为加速器控制单元(ACU)。这使得客户能将更多精力(和研发支出)集中在加速器的数据处理能力上,而控制和管理功能则交由 SiFive 基于 RISC-V 的方法来实现。

本文将探讨如何高效地将 X100 系列处理器与硬件加速器耦合。下图展示客户如何使用 X 系列产品作为加速器控制单元(ACU)。

Accelerator Control Unit diagram

X160 和 X180 处理器中集成的向量引擎提供了互补的计算能力,也可以协助加速器完成多种任务,包括数据的前/后格式化处理,以及处理边界情况。基于完全兼容 RISC-V 指令集架构的产品,使客户能够从广泛且快速扩展的应用软件、操作系统和开发工具选项中进行选择。

利用 X100,可以为两种不同类型的 SiFive 专有直连核心加速器接口提供标准化的软件开发模式,从而降低延迟并提升整体性能。

  • SiFive 标量协处理器接口(SSCI): 这是第二代 Intelligence 的新特性。该接口允许通过 RISC-V 自定义指令直接访问 X100 处理器内的寄存器来驱动加速器。我们的客户正使用它来控制和配置 LGTM。

  • 向量协处理器接口(VCIX): 这是一个高带宽接口,用于支持数据向矩阵协处理器的传输。使用 VCIX 可以实现对 CPU 向量寄存器的高带宽访问,降低延迟,并通过向量类指令格式向客户的矩阵引擎提供大规模数据集。这不仅适用于边缘/物联网应用,大型数据中心客户也正以这种方式使用 VCIX。

此外,还有核心本地端口(CLP),它允许 CPU 快速访问加速器的 SRAM,以便进行配套计算。

这在实践中是如何运作的呢?如果我们假设使用 SSCI 类型的接口,自定义功能可能包括执行三角函数、特定算法的位操作或数学函数(如平方根计算)。

Diagram

自定义逻辑只需要解码操作码中的少数几位,并执行具体的实现运算。而 X100 中现有的 CPU 逻辑则负责完成指令的完整解码、选择源寄存器、从目标寄存器读写、执行数据转发,以及管理流水线暂停和刷新等功能。

您是否正为下一代平台的最佳系统架构而苦恼?是否正负责将 AI 引入物联网工作负载的任务?SiFive Intelligence 家族是专为 AI 设计的,已经成为越来越多应用的热门解决方案,也许它正是您的理想选择。SiFive 可以提供建模工具和免费的系统架构评估,帮助您降低风险并加速项目进展。

请查看以下应用案例,了解我们的客户如何使用这些新产品:美国一线半导体公司授权采用 SiFive X160,用于工业 MCU 应用。

Read more Insights from the RISC-V Experts

X100 系统安全防护:RISC-V 边缘端的 AI
Blog Post
X100 系统安全防护:RISC-V 边缘端的 AI
边缘 AI 是多种技术的融合,包括人工智能、物联网、边缘计算和嵌入式系统。它们共同发挥关键作用,使智能处理和决策能够在网络边缘实现。边缘 AI 利用嵌入式算法监控远程系统的活动,并处理由传感器及其他数据采集装置收集的非结构化数据,如温度、语言、脸部、运动、图像、距离及其他模拟输入信号。
赋能远端边缘的 AI 创新
Blog Post
赋能远端边缘的 AI 创新
当前行业的焦点,更多投向那些能够将数据中心 AI 性能推向更高峰的硬件技术上。在 HotChips 2025 大会期间,对超大规模计算性能提升的需求占据绝大多数议程,而功能强大的大型芯片则成为了焦点。
本地 AI 的完美解决方案
Blog Post
本地 AI 的完美解决方案
近年来,AI 一直是科技行业的焦点。随着 RISC-V 的快速发展,SiFive 通过我们的 Intelligence IP 家族取得了领先地位,提供了一个基于单一 ISA 的可扩展计算平台,并具备根据特定 AI 工作负载进行定制的能力。