15. 术语定义

术语

缩写

定义

Triton

N/A

一种开源的面向并行编程的语言和编译器

TritonGCU

N/A

面向燧原科技芯片的定制化Triton后端

通用计算单元 (General Compute Unit)

GCU

燧原科技的芯片名称

可扩展智能处理器 (Scalable Intelligent Processor)

SIP

SIP是GCU芯片中的基础计算单元,是进行硬件架构扩展的最基本单元

计算单元集群 (Scalable Intelligent Cluster)

SIC

若干个SIP会组成一个SIC

数据变换引擎 (Data Transformation Engine)

DTE

数据变换引擎可以在各级内存之间搬运数据,并且可以在搬运的同时对张量进行形状变换

内存控制器 (Memory Controller)

MC

负责处理芯片和设备内存之间的数据传输

TopsCC

N/A

TopsCC是一个编译器驱动程序,它简化了编译TOPS C++代码的编译过程。它提供了更为简单和开发者熟悉的命令行选项,并通过调用不同编译阶段的工具集合来执行它们

核函数 (Kernel Function)

N/A

核函数是在计算设备上进行并行计算的计算函数

线程 (Thread)

N/A

在TOPS编程模型中,计算资源的最小颗粒是一个线程,对应在GPU侧的描述是一个warp

线程块 (Thread Block)

Block

启动一次核函数会产生多个线程,这些线程会被划分为多个线程块,用来表征一个较小的线程同步范围

线程块维度 (Thread Block Dim)

BlockDim

每个线程块内的线程会被按照x,y,z 3个维度划分,在Triton内不再区分x,y,z 3个维度,统一被描述为num_warps

线程网格 (Thread Grid)

Grid

线程网格表示启动一次核函数产生的所有线程

线程网格维度 (Thread Grid Dim)

GridDim

线程网格内的所有线程会被按照x,y,z 3个维度划分成多个线程块,被称为线程网格维度