Programa del Curso

Introducción al Desarrollo de Operadores Personalizados

  • ¿Por qué construir operadores personalizados? Casos de uso y restricciones
  • [Estructura del tiempo de ejecución 832] y puntos de integración de operadores
  • Resumen de TBE, TIK y TVM en el ecosistema AI de Huawei

Usando TIK para Operadores de Nivel Bajo Programming

  • Comprendiendo el modelo de programación TIK y las API compatibles
  • Administración de memoria y estrategia de tiling en TIK
  • Creando, compilando y registrando un operador personalizado con CANN

Pruebas y Validación de Operadores Personalizados

  • Pruebas unitarias e integración de operadores en el grafo
  • Depuración de problemas de rendimiento a nivel de núcleo
  • Visualización de la ejecución del operador y el comportamiento del búfer

Programación y Optimización Basada en TVM

  • Resumen de TVM como compilador para operaciones tensoriales
  • Escribir un planificador para un operador personalizado en TVM
  • Afinado, medición de rendimiento y generación de código para Ascend utilizando TVM

Integración con Frameworks y Modelos

  • Registro de operadores personalizados para MindSpore y ONNX
  • Verificación de la integridad del modelo y el comportamiento de retroceso
  • Soporte a grafos multi-operador con precisión mixta

Estudios de Caso y Optimizaciones Especializadas

  • Estudio de caso: convolución de alta eficiencia para formas de entrada pequeñas
  • Estudio de caso: optimización del operador de atención consciente de la memoria
  • Prácticas recomendadas en el despliegue de operadores personalizados a través de dispositivos

Resumen y Próximos Pasos

Requerimientos

  • Conocimiento sólido de los componentes internos de modelos AI y la computación a nivel de operadores
  • Experiencia con entornos de desarrollo Python y Linux
  • Familiaridad con compiladores de redes neuronales o optimizadores a nivel de gráficos

Publico Objetivo

  • Ingenieros de compilación trabajando en cadenas de herramientas AI
  • Desarrolladores de sistemas enfocados en la optimización de bajo nivel para AI
  • Desarrolladores construyendo operaciones personalizadas o dirigidas a cargas de trabajo AI innovadoras
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas