13. 术语定义

术语

缩写

定义

通用计算单元 (General Compute Unit)

GCU

燧原科技的芯片名称

可扩展智能处理器 (Scalable Intelligent Processor)

SIP

SIP是GCU芯片中的基础计算单元,是进行硬件架构扩展的最基本单元

数据变换引擎 (Data Transformation Engine)

DTE

数据变换引擎可以在各级内存之间搬运数据,并且可以在搬运的同时对张量进行形状变换

计算单元集群

N/A

若干个SIP会组成一个计算单元集群

末级缓存 (Last Level Cache)

LLC

最后一级缓存通常是针对L3内存的缓存,缓存所有对设备内存的读写访问

内存控制器 (Memory Controller)

MC

负责处理芯片和设备内存之间的数据传输

TopsRider®

TOPS

针对 GCU 芯片设计的加速计算平台,其中包含了编译器、链接器、运行时库、调试器、性能分析工具等一系列编程工具链

TopsCC

N/A

TopsCC 是一个编译器驱动程序,它简化了编译 TOPS C++ 代码的编译过程。它提供了更为简单和开发者熟悉的命令行选项,并通过调用不同编译阶段的工具具集合来执行它们

主机端程序 (Host Program)

N/A

运行在主机端平台 (Host Platform)上的程序

核函数 (Kernel Function)

N/A

核函数是在计算设备上进行并行计算的计算函数

执行流 (Execution Stream)

N/A

执行流是一段指令包(command packet)的序列,会由计算设备按照顺序执行

事件 (Event)

N/A

在不同执行流之间使用事件 (event) 机制建立依赖

线程 (Thread)

N/A

在TOPS编程模型中,计算资源的最小颗粒是一个线程(Thread)

线程网格 (Thread Grid)

N/A

线程网格表示启动一次核函数产生的所有线程

线程块 (Thread Block)

N/A

启动一次核函数会产生多个线程,这些线程会被划分为多个线程块,用来表征一个较小的线程同步范围

本地内存 (Local Memory)

N/A

本地内存属于单个线程所有,无法在多个线程间共享数据

共享内存 (Shared Memory)

N/A

共享内存由单个线程块中的所有线程共享,可以在这些线程之间共享数据

TODO: james, P0, 刷新术语表