1. 简介
TopsRider v2.1 发布说明,2.1.47 版本适用于 T20、T21设备。
2. 功能和优化
2.1 TopsRider 软件包结构更新
此次将 sample 独立打包与 TopsRider 软件包分离。TopsRider 软件包分成主体包和 Sample 包,请
先安装软件主体包再安装 Sample 包。
2.2 文档包结构更新
文档包重新编排目录组合,方便用户查阅。
2.3 T20/T21 模型
2.3.1 新增 PaddlePaddle 框架和模型支持
2.3.2 TensorFlow 模型支持
2.3.3 PyTorch 模型支持
2.3.4 ARM – 模型支持
2.4 API
Runtime API 更新,详见《Runtime API 参考》
2.5 TopsProf & VisualProfiler
2.5.1 TopsProf
- memory profiler 新增显示 total usage
- console 中支持展示 Runtime API 统计结果
2.5.2 VisualProfiler
- 不同的 GCU 利用率展示在同一个图表中
- 增加导入配置选项
- 在 TimelineFilter 中,增加按时间过滤功能(ns),启示时间是 0 (相对时间)
2.6 通信库 ECCL
- ECCL 性能优化
- ECCL TCP 传输改为多线程模式,并支持用户指定线程个数
- send/recv 支持大数据量
- send/recv 支持 dataslice
- eccl-tests 支持 send/recv 测试
- eccl-tests 支持 all-to-all 测试
- eccl-tests 支持 allgather 性能测试
- eccl-tests 支持 reduce 测试
- eccl-tests 支持 scatter 性能测试
3. 使用限制
- PaddlePaddle 框架下 Bert Large 需要使用 Python 3.8 及以上。
- T20/T21 不支持多进程,不支持多人同时使用同一张卡。
4. GCU 设备 SSM 版本、EFSMI 版本
4.1 GCU 设备 SSM 版本
4.2 EFSMI 版本
1.13.0
5. 操作系统和 Python 支持
5.1 适配说明
- Host 环境:仅 Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
- Docker 环境:软件栈功能已做适配测试,需使用相同 OS 的 Host
5.2 操作系统支持列表
5.3 Python 支持
Python 3.6,Python 3.8