Inicio
Computación Gráfica Capacitación
GPU Capacitación
Curso de GPU Programming with OpenACC

Curso de GPU Programming with OpenACC

OpenACC es un estándar abierto para programación heterogénea que permite que un código se ejecute en diferentes plataformas y dispositivos, como CPU multinúcleo, GPUs, FPGAs y otros.

Esta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a desarrolladores de nivel principiante a intermedio que desean usar OpenACC para programar dispositivos heterogéneos y explotar su paralelismo.

Al final de esta formación, los participantes serán capaces de:

Configure un entorno de desarrollo OpenACC.
Escribir y ejecutar un programa básico de OpenACC.
Anote el código con directivas y cláusulas OpenACC.
Utilice la API y las bibliotecas de OpenACC.
Perfile, depure y optimice los programas OpenACC.

Formato del curso

Charla y discusión interactiva.
Muchos ejercicios y práctica.
Implementación práctica en un entorno de laboratorio en vivo.

Opciones de personalización del curso

Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertarlo.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Programa del Curso

Introducción

¿Qué es OpenACC?
OpenACC vs OpenCL vs CUDA vs SYCL
Descripción general de las características y la arquitectura de OpenACC
Configuración del entorno de desarrollo

Empezar

Creación de un proyecto OpenACC en código Visual Studio
Exploración de la estructura y los archivos del proyecto
Compilar y ejecutar el programa
Visualización de la salida con printf y fprintf

Directivas y cláusulas de OpenACC

Descripción de las directivas y cláusulas de OpenACC
Uso de directivas paralelas para crear regiones paralelas
Uso de directivas kernels para el paralelismo administrado por el compilador
Uso de directivas de bucle para paralelizar bucles
Gestión del movimiento de datos con directivas de datos
Sincronización de datos con directivas de actualización
Mejora de la reutilización de datos con directivas de caché
Creación de funciones de dispositivo con directivas de rutina
Sincronización de eventos con directivas wait

OpenACC API

Comprender el papel de la API de OpenACC
Consulta de información y capacidades del dispositivo
Configuración del número y tipo de dispositivo
Control de errores y excepciones
Creación y sincronización de eventos

Bibliotecas OpenACC e interoperabilidad

Descripción de las bibliotecas OpenACC y la interoperabilidad
Uso de bibliotecas matemáticas, aleatorias y complejas
Integración con otros modelos (CUDA, OpenMP, MPI)
Integración con GPU bibliotecas (cuBLAS, cuFFT)

Herramientas OpenACC

Descripción de las herramientas OpenACC en desarrollo
Generación de perfiles y depuración de programas OpenACC
Análisis de rendimiento con PGI Compiler, NVIDIA Nsight Systems, Allinea Forge

Optimización

Factores que afectan el rendimiento del programa OpenACC
Optimización de la localidad de los datos y reducción de las transferencias
Optimización del paralelismo y la fusión de bucles
Optimización del paralelismo y la fusión del kernel
Optimización de la vectorización y el ajuste automático

Resumen y próximos pasos

Requerimientos

Comprensión del lenguaje C/C++ o Fortran y conceptos de programación paralela
Conocimientos básicos de arquitectura de computadores y jerarquía de memoria
Experiencia con herramientas de línea de comandos y editores de código

Audiencia

Desarrolladores que deseen aprender a usar OpenACC para programar dispositivos heterogéneos y explotar su paralelismo
Desarrolladores que desean escribir código portátil y escalable que pueda ejecutarse en diferentes plataformas y dispositivos
Programadores que desean explorar los aspectos de alto nivel de la programación heterogénea y optimizar la productividad de su código

28 Horas

Número de participantes

En línea

Aula

Seleccione el lugar

Seleccione un lugar

Precio por Participante

Los cursos de formación abiertos requieren más de 5 participantes.

Curso de GPU Programming with OpenACC - Booking

Nombre Completo *

Correo electrónico *

Teléfono *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Ciudad *

Estado / Provincia

País *

Código Postal *

Fecha de Inicio

Identificación Fiscal

Las fechas están sujetas a disponibilidad y tendrán lugar entre 09:30 y 16:30.

Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Comentarios

Permitir Certificado de Publicación

Si marca esta casilla, los participantes recibirán la opción de publicar su certificado de curso en el Catálogo de profesionales certificados de NobleProg.

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Curso de GPU Programming with OpenACC - Enquiry

Nombre Completo *

Correo electrónico *

Teléfono *

Número de participantes

Nombre de la Empresa

Dirección de la Compañía

¿Cómo quiere hacer el curso?

Instalaciones del Cliente

en línea

Nuestras oficinas

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

GPU Programming with OpenACC - Consulta de consultoría

Consulta de consultoría

Nombre Completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

Duración de la Consulta

Cantidad de Consultores

Fecha Adecuada

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Próximos cursos

GPU Programming with OpenACC

2025-09-22 09:30

28 Horas

Cali - San Vicente

7487 USD (en línea)

8287 USD (Nuestras oficinas)

GPU Programming with OpenACC

2025-10-06 09:30

28 Horas

Bogotá - Urban Plaza Chico

7487 USD (en línea)

8327 USD (Nuestras oficinas)

GPU Programming with OpenACC

2025-10-20 09:30

28 Horas

Bogotá - Colina Campestre

7487 USD (en línea)

8127 USD (Nuestras oficinas)

Cursos Relacionados

Developing AI Applications with Huawei Ascend and CANN

21 Horas

Huawei Ascend es una familia de procesadores de IA diseñados para inferencia y entrenamiento de alto rendimiento.

Este curso dirigido por un instructor (en línea o presencial) está destinado a ingenieros de AI intermedios y científicos de datos que desean desarrollar y optimizar modelos de redes neuronales utilizando la plataforma Ascend de Huawei y el kit de herramientas CANN.

Al final de este entrenamiento, los participantes podrán:

Configurar y configurar el entorno de desarrollo CANN.
Desarrollar aplicaciones AI usando MindSpore y flujos de trabajo CloudMatrix.
Optimizar el rendimiento en Ascend NPUs utilizando operadores personalizados y tiling.
Implementar modelos en entornos edge o cloud.

Formato del Curso

Conferencia interactiva y discusión.
Uso práctico de Huawei Ascend y el kit de herramientas CANN en aplicaciones de muestra.
Ejercicios guiados enfocados en la construcción, entrenamiento e implementación del modelo.

Opciones de Personalización del Curso

Para solicitar un entrenamiento personalizado para este curso basado en su infraestructura o conjuntos de datos, contáctenos para organizarlo.

Deploying AI Models with CANN and Ascend AI Processors

14 Horas

CANN (Compute Architecture for Neural Networks) is Huawei’s AI compute stack for deploying and optimizing AI models on Ascend AI processors.

This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and engineers who wish to deploy trained AI models efficiently to Huawei Ascend hardware using the CANN toolkit and tools such as MindSpore, TensorFlow, or PyTorch.

By the end of this training, participants will be able to:

Understand the CANN architecture and its role in the AI deployment pipeline.
Convert and adapt models from popular frameworks to Ascend-compatible formats.
Use tools like ATC, OM model conversion, and MindSpore for edge and cloud inference.
Diagnose deployment issues and optimize performance on Ascend hardware.

Format of the Course

Interactive lecture and demonstration.
Hands-on lab work using CANN tools and Ascend simulators or devices.
Practical deployment scenarios based on real-world AI models.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

GPU Programming on Biren AI Accelerators

21 Horas

Los aceleradores AI de Biren son GPU de alto rendimiento diseñados para cargas de trabajo de IA y HPC, con soporte para entrenamiento y inferencia a gran escala.

Esta formación en vivo dirigida por un instructor (en línea o presencial) está destinada a desarrolladores de nivel intermedio a avanzado que desean programar y optimizar aplicaciones utilizando la pila propietaria GPU de Biren, con comparaciones prácticas con entornos basados en CUDA.

Al final de esta formación, los participantes podrán:

Comprender la arquitectura y jerarquía de memoria de Biren GPU.
Configurar el entorno de desarrollo e implementar el modelo de programación de Biren.
Traducir y optimizar código estilo CUDA para plataformas Biren.
Aplicar técnicas de ajuste de rendimiento y depuración.

Formato del Curso

Conferencia interactiva y discusión.
Uso práctico del SDK Biren en cargas de trabajo de muestra GPU.
Ejercicios guiados enfocados en el porting y ajuste de rendimiento.

Opciones de Personalización del Curso

Para solicitar una formación personalizada para este curso basada en su pila de aplicaciones o necesidades de integración, por favor contáctenos para organizarlo.

Cambricon MLU Development with BANGPy and Neuware

21 Horas

Las unidades MLU de Cambricon (Machine Learning) son chips especializados en IA optimizados para inferencia y entrenamiento en escenarios de borde y centros de datos.

Esta formación en vivo dirigida por un instructor (en línea o presencial) está destinada a desarrolladores intermedios que desean construir y desplegar modelos de IA utilizando el marco BANGPy y el SDK Neuware en hardware MLU de Cambricon.

Al finalizar esta formación, los participantes podrán:

Configurar y configurar los entornos de desarrollo de BANGPy y Neuware.
Desarrollar y optimizar modelos basados en Python y C++ para las unidades MLU de Cambricon.
Desplegar modelos a dispositivos de borde y centros de datos que ejecutan el tiempo de ejecución Neuware.
Integrar flujos de trabajo de IA con características de aceleración específicas de MLU.

Formato del Curso

Conferencia interactiva y discusión.
Uso práctico de BANGPy y Neuware para desarrollo y despliegue.
Ejercicios guiados enfocados en optimización, integración y pruebas.

Opciones de Personalización del Curso

Para solicitar una formación personalizada basada en el modelo de dispositivo Cambricon o caso de uso específico, contáctenos para organizarlo.

Introduction to CANN for AI Framework Developers

7 Horas

CANN (Compute Architecture for Neural Networks) is Huawei’s AI computing toolkit used to compile, optimize, and deploy AI models on Ascend AI processors.

This instructor-led, live training (online or onsite) is aimed at beginner-level AI developers who wish to understand how CANN fits into the model lifecycle from training to deployment, and how it works with frameworks like MindSpore, TensorFlow, and PyTorch.

By the end of this training, participants will be able to:

Understand the purpose and architecture of the CANN toolkit.
Set up a development environment with CANN and MindSpore.
Convert and deploy a simple AI model to Ascend hardware.
Gain foundational knowledge for future CANN optimization or integration projects.

Format of the Course

Interactive lecture and discussion.
Hands-on labs with simple model deployment.
Step-by-step walkthrough of the CANN toolchain and integration points.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

CANN for Edge AI Deployment

14 Horas

Huawei's Ascend CANN toolkit enables powerful AI inference on edge devices such as the Ascend 310. CANN provides essential tools for compiling, optimizing, and deploying models where compute and memory are constrained.

This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and integrators who wish to deploy and optimize models on Ascend edge devices using the CANN toolchain.

By the end of this training, participants will be able to:

Prepare and convert AI models for Ascend 310 using CANN tools.
Build lightweight inference pipelines using MindSpore Lite and AscendCL.
Optimize model performance for limited compute and memory environments.
Deploy and monitor AI applications in real-world edge use cases.

Format of the Course

Interactive lecture and demonstration.
Hands-on lab work with edge-specific models and scenarios.
Live deployment examples on virtual or physical edge hardware.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

Understanding Huawei’s AI Compute Stack: From CANN to MindSpore

14 Horas

Huawei’s AI stack — from the low-level CANN SDK to the high-level MindSpore framework — offers a tightly integrated AI development and deployment environment optimized for Ascend hardware.

This instructor-led, live training (online or onsite) is aimed at beginner-level to intermediate-level technical professionals who wish to understand how the CANN and MindSpore components work together to support AI lifecycle management and infrastructure decisions.

By the end of this training, participants will be able to:

Understand the layered architecture of Huawei’s AI compute stack.
Identify how CANN supports model optimization and hardware-level deployment.
Evaluate the MindSpore framework and toolchain in relation to industry alternatives.
Position Huawei's AI stack within enterprise or cloud/on-prem environments.

Format of the Course

Interactive lecture and discussion.
Live system demos and case-based walkthroughs.
Optional guided labs on model flow from MindSpore to CANN.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

Optimizing Neural Network Performance with CANN SDK

14 Horas

CANN SDK (Compute Architecture for Neural Networks) is Huawei’s AI compute foundation that allows developers to fine-tune and optimize the performance of deployed neural networks on Ascend AI processors.

This instructor-led, live training (online or onsite) is aimed at advanced-level AI developers and system engineers who wish to optimize inference performance using CANN’s advanced toolset, including the Graph Engine, TIK, and custom operator development.

By the end of this training, participants will be able to:

Understand CANN's runtime architecture and performance lifecycle.
Use profiling tools and Graph Engine for performance analysis and optimization.
Create and optimize custom operators using TIK and TVM.
Resolve memory bottlenecks and improve model throughput.

Format of the Course

Interactive lecture and discussion.
Hands-on labs with real-time profiling and operator tuning.
Optimization exercises using edge-case deployment examples.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

CANN SDK for Computer Vision and NLP Pipelines

14 Horas

The CANN SDK (Compute Architecture for Neural Networks) provides powerful deployment and optimization tools for real-time AI applications in computer vision and NLP, especially on Huawei Ascend hardware.

This instructor-led, live training (online or onsite) is aimed at intermediate-level AI practitioners who wish to build, deploy, and optimize vision and language models using the CANN SDK for production use cases.

By the end of this training, participants will be able to:

Deploy and optimize CV and NLP models using CANN and AscendCL.
Use CANN tools to convert models and integrate them into live pipelines.
Optimize inference performance for tasks like detection, classification, and sentiment analysis.
Build real-time CV/NLP pipelines for edge or cloud-based deployment scenarios.

Format of the Course

Interactive lecture and demonstration.
Hands-on lab with model deployment and performance profiling.
Live pipeline design using real CV and NLP use cases.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

Building Custom AI Operators with CANN TIK and TVM

14 Horas

CANN TIK (Tensor Instruction Kernel) and Apache TVM enable advanced optimization and customization of AI model operators for Huawei Ascend hardware.

This instructor-led, live training (online or onsite) is aimed at advanced-level system developers who wish to build, deploy, and tune custom operators for AI models using CANN’s TIK programming model and TVM compiler integration.

By the end of this training, participants will be able to:

Write and test custom AI operators using the TIK DSL for Ascend processors.
Integrate custom ops into the CANN runtime and execution graph.
Use TVM for operator scheduling, auto-tuning, and benchmarking.
Debug and optimize instruction-level performance for custom computation patterns.

Format of the Course

Interactive lecture and demonstration.
Hands-on coding of operators using TIK and TVM pipelines.
Testing and tuning on Ascend hardware or simulators.

Course Customization Options

To request a customized training for this course, please contact us to arrange.

Migrating CUDA Applications to Chinese GPU Architectures

21 Horas

Las arquitecturas GPU chinas, como Huawei Ascend, Biren y Cambricon MLUs, ofrecen alternativas a CUDA adaptadas para los mercados de IA y HPC locales.

Este entrenamiento en vivo (en línea u onsite) dirigido por un instructor está destinado a programadores avanzados de GPU y especialistas en infraestructura que desean migrar y optimizar aplicaciones existentes de CUDA para su implementación en plataformas de hardware chinas.

Al finalizar este entrenamiento, los participantes podrán:

Evaluando la compatibilidad de las cargas de trabajo existentes de CUDA con alternativas de chips chinos.
Migrar bases de código de CUDA a entornos Huawei CANN, Biren SDK y Cambricon BANGPy.
Comparar el rendimiento e identificar puntos de optimización en distintas plataformas.
Abordar desafíos prácticos en el soporte y la implementación entre arquitecturas.

Formato del Curso

Charlas interactivas y discusiones.
Laboratorios de traducción de código y comparaciones de rendimiento prácticos.
Ejercicios guiados enfocados en estrategias de adaptación multi-GPU.

Opciones para la Personalización del Curso

Para solicitar una capacitación personalizada basada en su plataforma o proyecto CUDA, contáctenos para organizarlo.

Performance Optimization on Ascend, Biren, and Cambricon

21 Horas

Ascend, Biren y Cambricon son plataformas de hardware de IA líderes en China, cada una ofrece herramientas únicas de aceleración y perfilado para cargas de trabajo de IA a escala de producción.

Esta formación dirigida por instructores (en línea o presencial) está orientada a ingenieros avanzados de infraestructura e IA y rendimiento que desean optimizar flujos de trabajo de inferencia y entrenamiento de modelos en múltiples plataformas de chips AI chinos.

Al final de esta formación, los participantes podrán:

Benchmarkear modelos en las plataformas Ascend, Biren y Cambricon.
Identificar cuellos de botella del sistema e ineficiencias de memoria/cómputo.
Aplicar optimizaciones a nivel de gráficos, núcleos y operadores.
Ajustar pipelines de despliegue para mejorar el rendimiento y la latencia.

Formato del Curso

Conferencias interactivas y discusiones.
Uso práctico de herramientas de perfilado y optimización en cada plataforma.
Ejercicios guiados enfocados en escenarios de ajuste prácticos.

Opciones de Personalización del Curso

Para solicitar una formación personalizada para este curso basada en su entorno de rendimiento o tipo de modelo, por favor contáctenos para organizarlo.

Categorías Relacionadas

Curso de GPU Programming with OpenACC

Programa del Curso

Requerimientos

Próximos cursos

GPU Programming with OpenACC

GPU Programming with OpenACC

GPU Programming with OpenACC

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites