13. 术语定义

术语

缩写

定义

通用计算单元 (General Compute Unit)

GCU

燧原科技的芯片名称

可扩展智能处理器 (Scalable Intelligent Processor)

SIP

SIP是GCU芯片中的基础计算单元,是进行硬件架构扩展的最基本单元

计算单元集群 (Scalable Intelligent Cluster)

SIC

若干个SIP会组成一个SIC

数据变换引擎 (Data Transformation Engine)

DTE

数据变换引擎可以在各级内存之间搬运数据,并且可以在搬运的同时对张量进行形状变换

末级缓存 (Last Level Cache)

LLC

最后一级缓存通常是针对L3内存的缓存,缓存所有对设备内存的读写访问

内存控制器 (Memory Controller)

MC

负责处理芯片和设备内存之间的数据传输

TopsRider®

TOPS

针对 GCU 芯片设计的加速计算平台,其中包含了编译器、链接器、运行时库、调试器、性能分析工具等一系列编程工具链

TopsCC

N/A

TopsCC是一个编译器驱动程序,它简化了编译TOPS C++代码的编译过程。它提供了更为简单和开发者熟悉的命令行选项,并通过调用不同编译阶段的工具具集合来执行它们

主机端程序 (Host Program)

N/A

运行在主机端平台上的程序

执行流 (Execution Stream)

N/A

执行流是一段指令包(command packet)的序列,会由计算设备按照顺序执行

事件 (Event)

N/A

事件表示执行流中的指令包执行到某个特定位置,在不同执行流之间可以使用事件机制建立依赖

核函数 (Kernel Function)

N/A

核函数是在计算设备上进行并行计算的计算函数

线程 (Thread)

N/A

在TOPS编程模型中,计算资源的最小颗粒是一个线程

线程块 (Thread Block)

N/A

启动一次核函数会产生多个线程,这些线程会被划分为多个线程块,用来表征一个较小的线程同步范围

线程网格 (Thread Grid)

N/A

线程网格表示启动一次核函数产生的所有线程

本地内存 (Local Memory)

N/A

本地内存属于单个线程所有,无法在多个线程间共享数据,只可以从设备端运行的核函数中访问

共享内存 (Shared Memory)

N/A

共享内存由单个线程块中的所有线程共享,可以在这些线程之间共享数据,只可以从设备端运行的核函数中访问

全局内存 (Global Memory)

N/A

全局内存可以由设备端的任何线程网格中的任何线程访问,也可以由主机端访问;全局内存既可以是设备内存,也可以使主机内存