3. 简介

TritonGCU 基于Triton-lang的定义和约束,在满足用户编写跨GPU-GCU平台的计算kernel的同时,致力于尽可能的掩盖GPU和GCU本身的硬件架构差异对Triton编写更好性能kernel带来的影响。 本文档主要描述了以下几个部分:

  • GCU编程模型介绍该部分与GPU(CUDA)编程模型存在细微差异。

  • 编程接口部分定义并描述了GCU上支持的Triton接口,部分接口因为GCU硬件特性,在不同的GCU硬件代际之间,对Triton 接口的使用存在一些隐式约束。

  • 调试部分介绍了一些错误处理方式和调试方式。

  • 性能优化章节介绍区别于GPU场景,在不同GCU硬件代际,编写更好性能的kernel的技巧。