TritonGCU编程指南¶
目录
- 1. 版权声明
- 2. 变更历史
- 3. 简介
- 4. 硬件架构
- 5. 执行模型
- 6. 线程模型
- 7. 内存模型
- 8. 类型支持
- 9. 编程接口
- 10. 调试
- 11. 性能优化
- 12. 环境变量
- 12.1. MLIR_ENABLE_DUMP
- 12.2. TRITON_ALWAYS_COMPILE
- 12.3. TRITON_DISABLE_LINE_INFO
- 12.4. TRITON_INTERPRET
- 12.5. TRITON_PRINT_AUTOTUNING
- 12.6. TRITON_KERNEL_DUMP
- 12.7. TRITON_KERNEL_OVERRIDE
- 12.8. TRITON_REPRODUCER_PATH
- 12.9. LLVM_IR_ENABLE_DUMP
- 12.10. TRITON_ENABLE_LLVM_DEBUG
- 12.11. TRITON_LLVM_DEBUG_ONLY
- 12.12. DISABLE_LLVM_OPT
- 12.13. LLVM_ENABLE_TIMING
- 12.14. TRITON_F32_DEFAULT
- 13. 限制
- 14. 移植开源Triton算子到TritonGCU
- 15. 术语定义
- 16. 附录