13. 术语定义¶
术语 |
缩写 |
定义 |
---|---|---|
通用计算单元 (General Compute Unit) |
GCU |
燧原科技的芯片名称 |
可扩展智能处理器 (Scalable Intelligent Processor) |
SIP |
SIP是GCU芯片中的基础计算单元,是进行硬件架构扩展的最基本单元 |
数据变换引擎 (Data Transformation Engine) |
DTE |
数据变换引擎可以在各级内存之间搬运数据,并且可以在搬运的同时对张量进行形状变换 |
计算单元集群 |
N/A |
若干个SIP会组成一个计算单元集群 |
末级缓存 (Last Level Cache) |
LLC |
最后一级缓存通常是针对L3内存的缓存,缓存所有对设备内存的读写访问 |
内存控制器 (Memory Controller) |
MC |
负责处理芯片和设备内存之间的数据传输 |
TopsRider® |
TOPS |
针对 GCU 芯片设计的加速计算平台,其中包含了编译器、链接器、运行时库、调试器、性能分析工具等一系列编程工具链 |
TopsCC |
N/A |
TopsCC 是一个编译器驱动程序,它简化了编译 TOPS C++ 代码的编译过程。它提供了更为简单和开发者熟悉的命令行选项,并通过调用不同编译阶段的工具具集合来执行它们 |
主机端程序 (Host Program) |
N/A |
运行在主机端平台 (Host Platform)上的程序 |
核函数 (Kernel Function) |
N/A |
核函数是在计算设备上进行并行计算的计算函数 |
执行流 (Execution Stream) |
N/A |
执行流是一段指令包(command packet)的序列,会由计算设备按照顺序执行 |
事件 (Event) |
N/A |
在不同执行流之间使用事件 (event) 机制建立依赖 |
线程 (Thread) |
N/A |
在TOPS编程模型中,计算资源的最小颗粒是一个线程(Thread) |
线程网格 (Thread Grid) |
N/A |
线程网格表示启动一次核函数产生的所有线程 |
线程块 (Thread Block) |
N/A |
启动一次核函数会产生多个线程,这些线程会被划分为多个线程块,用来表征一个较小的线程同步范围 |
本地内存 (Local Memory) |
N/A |
本地内存属于单个线程所有,无法在多个线程间共享数据 |
共享内存 (Shared Memory) |
N/A |
共享内存由单个线程块中的所有线程共享,可以在这些线程之间共享数据 |
TODO: james, P0, 刷新术语表