GCP AI Platform MLOps Engineer

🇲🇽 Mexico - Remote
🔧 DevOps🔵 Mid-level

Job description

¡Trabaja en DaCodes!

Somos una firma de expertos en software y transformación digital de alto impacto.

Durante 10 años hemos creado soluciones enfocadas en la tecnología e innovación gracias a nuestro equipo de +220 talentosos #DaCoders, incluyendo desarrolladores, arquitectos, diseñadores UX/UI, PMs, QA testers y más. Nuestro equipo colabora en proyectos con clientes en LATAM y Estados Unidos, logrando resultados sobresalientes.

En DaCodes, tendrás la oportunidad de impulsar tu desarrollo profesional, trabajar en diversos proyectos dentro de distintas industrias, y contribuir al diseño, implementación y optimización de infraestructuras en la nube.

Nuestros DaCoders tienen un gran impacto en el éxito de nuestro negocio y el de nuestros clientes.

¿Te interesa?

Este puesto corresponde a un Machine Learning Operations Engineer, pero con un enfoque distinto al MLOps tradicional. En lugar de centrarse en entrenamiento de modelos o experimentación, este rol está orientado a la operación, despliegue y mantenimiento de plataformas de IA en producción dentro de GCP.

El perfil ideal combina:

Competencias de DevOps / Cloud Engineering

  • CI/CD con GitLab
  • IaC (Terraform)
  • Orquestación con Kubernetes/GKE
  • Gestión de IAM, VPCs, redes y seguridad
  • Automatización y operación de servicios cloud de alta concurrencia

Competencias de MLOps orientadas a IA aplicada

  • Frameworks multiagente (LlamaIndex Workflows, LangGraph, ADK)
  • Vertex AI y MLflow para trazabilidad y operación
  • Manejo de estados, sesiones y eventos
  • Monitoreo y control de costos por tokenización en LLMs

El rol se centra en construir, automatizar y operar la infraestructura necesaria para sistemas basados en IA y agentes, asegurando escalabilidad, eficiencia y trazabilidad dentro del ecosistema Google Cloud Platform.

REQUERIMIENTOS

Skills Deseables

  • Experiencia en la construcción de pipelines CI/CD con GitLab, incluyendo integración con GCP , MLflow , Vertex AI, Artifact Registry.
  • Experiencia en el proceso de deployment de workflows multiagente, orientados a frameworks de alta concurrencia como LlamaIndex Workflows, LangGraph, ADK, con manejo de sesiones, estados, eventos e ingeniería de contexto.
  • Experiencia programación e implementación de Infraestructura como Código (IaC) utilizando Terraform.
  • Experiencia en configuración y orquestación de Kubernetes o Google Kubernetes Engine (GKE), incluyendo esquemas de CPU y GPU compartidas.
  • Dominio de servicios como Google Cloud Run, Google Compute Engine, Cloud Functions, Pub/Sub, administración de IAM Roles, Elastic Load Balancers, Identity-Aware Proxy (IAP), Secret Manager, Cloud SQL y Dataflow, Networks, VPCs , Reglas de comunicacion en general GCP. (Si está certificado mejor)
  • Implementación de sistemas de trazabilidad y monitorización con MLflow, Grafana, Datadog y Looker Studio.
  • Conocimientos de dimensionamiento de capacidades computacionales para cargas de alta demanda y concurrencia, así como técnicas de aceleración por GPU.

Nice to Have

  • Ciencia de datos
  • Conocimientos en técnicas avanzadas de procesamiento de lenguaje natural (NLP)

Principales Responsabilidades

  • Implementar los ambientes requeridos por el squad de IA.
  • Asegurar las buenas prácticas de deployment, incluyendo branching, naming y versioning.
  • Implementar diferentes estrategias de branching, incluyendo CI/CD, GitFlow, entre otras.
  • Ser owner de los deployments y coordinar los esfuerzos relacionados con dicho proceso.
  • Apoyar al equipo con autenticaciones, permisos, roles, accesos, etc.
  • Dimensionar los costos de infraestructura previo a la implementación de sistemas orientados a IA y arquitecturas basadas en agentes.
  • Monitorizar costos de infraestructura y costos asociados a la tokenización de entrada y salida de los LLM utilizados por los workflows agenticios.

🚀 Integración a marcas globales y startups disruptivas.

🏡 Trabajo remoto/Home office.

📍 En caso de requerir modalidad híbrida o presencial, serás informado desde la primera sesión.

⏳ Horario ajustado a la célula de trabajo/proyecto asignado.

📅 Trabajo de lunes a viernes.

🎉 Día off en tu cumpleaños.

🏥 Seguro de gastos médicos mayores (aplica para México).

🛡️ Seguro de vida (aplica para México).

🌎 Equipos de trabajo multiculturales.

🎓 Acceso a cursos y certificaciones.

📢 Meetups con invitados especiales del área de IT.

📡 Eventos virtuales de integración y grupos de interés.

📢 Clases de inglés.

🏆 Oportunidades dentro de nuestras diferentes líneas de negocio.

🏅 Orgullosamente certificados como Great Place to Work.

Share this job:
Please let DaCodes know you found this job on Remote First Jobs 🙏

Similar Remote Jobs

Benefits of using Remote First Jobs

Discover Hidden Jobs

Unique jobs you won't find on other job boards.

Advanced Filters

Filter by category, benefits, seniority, and more.

Priority Job Alerts

Get timely alerts for new job openings every day.

Manage Your Job Hunt

Save jobs you like and keep a simple list of your applications.

Search remote, work from home, 100% online jobs

We help you connect with top remote-first companies.

Search jobs

Hiring remote talent? Post a job

Apply