标签: #Ascend

Ascend C入坑笔记

本文记录了AscendC学习笔记,涵盖从基础概念到算子开发的完整流程。核心内容包括:AI Core的达芬奇架构(物理结构含Cube/Vector/Scalar单元,逻辑结构为SIMD);AscendC编程对象GlobalTensor(外部存储)与LocalTensor(内部存储),以及Queue队列通信机制;Vector算子开发遵循分析、核函数定义、三阶段任务(CopyIn/Compute/CopyOut)的范式;Host侧实现涉及Tiling数据切分、Shape推导及算子注册。通过Add算子实例,展示了静态形状下多核并行(SPMD)与单核流水(Stage)的开发实践。