Resumen del rol

Senior Deep Learning Engineer

Requisitos y responsabilidades

Contenido del rol extraído en secciones para revisar más rápido.

What you'll be doing:

  • Improve inference speed for Cosmos WFMs on GPU platforms.
  • Effectively carry out the production deployment of Cosmos WFMs.
  • Profile and analyze deep learning workloads to identify and remove bottlenecks.

What we need to see:

  • 5+ years of experience.
  • MSc or PhD in CS, EE, or CSEE or equivalent experience.
  • Strong background in Deep Learning.
  • Strong programming skills in Python and PyTorch.
  • Experience with inference optimization techniques (such as quantization) and inference optimization frameworks, one of: TensorRT, TensorRT-LLM, vLLM, SGLang.

Ways to stand out from the crowd:

  • Familiarity with deploying Deep Learning models in production settings (e.g., Docker, Triton Inference Server).
  • CUDA programming experience.
  • Familiarity with diffusion models.
  • Proven experience in analyzing, modeling, and tuning the performance of GPU workloads, both inference and training.
Roles similares

Mantén una lista de respaldo.

Ver stack
FocoDeep LearningÁrea del rol
Señal de senioritySeniorNivel del candidato
StackDocker, LLM, PythonSkills principales
Ubicación1 país aceptadoElegibilidad

Stack

Usa estas tags para comparar roles remotos similares.

Elegibilidad de ubicación

Candidatos deberían aplicar solo cuando el país del perfil aparece aquí.

Tu perfilPaís no definidoInicia sesión para comparar tu país con este rol.

Flujo de contratación

WithMira muestra el rol y luego envía candidatos a la aplicación de la empresa.

1Revisa fit del rol, stack y elegibilidad de ubicación en WithMira.
2Abre la página de aplicación de la empresa desde el link rastreado.
3Guarda el rol o suscríbete a oportunidades similares antes de salir.
Aplicar en el sitio de la empresaSitio de la empresaAbrir link