InicioRoadmap de habilidades › ML Engineer

Roadmap de habilidades de ML engineer para 2026

La ingeniería de ML en 2026 está dividida entre el ML clásico (modelos tabulares, ranking, fraude, forecasting) y la ingeniería de LLM (RAG, fine-tuning, evals, agentes). La mayoría de los nuevos contratados tocan ambos. Este roadmap cubre el stack, las soft skills y el plan de 12 meses para convertirse en un ML engineer contratable.

El rol ha cambiado más rápido que cualquier otra especialidad de ingeniería en los últimos dos años. Antes de 2023, los ML engineers eran sobre todo entrenadores de modelos. En 2026 la mayoría de los ML engineers son ingenieros de sistemas que casualmente despliegan modelos — construyen evals, pipelines, sistemas de retrieval y servicios de inferencia más de lo que entrenan modelos base. La implicación: si solo sabe entrenar, está poco preparado para la contratación de 2026.

Convierta este roadmap en un curso gamificado Quest2Offer genera una ruta de quests de ML: fundamentos de PyTorch, proyecto de RAG, evals, deployment y proyectos de portafolio.
Empezar el curso

Quién es un ML engineer en 2026

El rol abarca varios sabores. La mayoría de las ofertas piden uno o dos de:

ML engineer junior: entrena un modelo, lo entrega detrás de un endpoint con supervisión ligera. Nivel mid: es dueño de un modelo de principio a fin, incluidos sus evals y modos de degradación. Senior: toma la decisión de build-vs-buy, diseña el eval harness, lidera la respuesta a incidentes cuando el modelo se degrada en producción.

Stack base — qué aprender de verdad

Matemáticas y fundamentos de ML

Álgebra lineal (lo justo para leer papers), probabilidad, intuición del descenso de gradiente, sesgo/varianza, regularización, métricas de evaluación (precision/recall, AUC, calibración). No necesita derivar backprop a mano en 2026, pero sí entenderlo conceptualmente.

Python a nivel de producción

typing/Pydantic, pytest, FastAPI para serving, NumPy, pandas, Polars. Fundamentos de async para serving. El ML engineer de solo notebooks es un arquetipo de 2018.

ML clásico

scikit-learn, XGBoost/LightGBM/CatBoost, feature engineering, cross-validation, evitar leakage, trabajar con datos desbalanceados.

Deep learning

PyTorch (por defecto), Lightning si quiere andamiaje de entrenamiento, Hugging Face Transformers, aceleradores (fundamentos de CUDA, mixed precision).

LLMs en producción (esenciales de 2026)

Llamar a las APIs de OpenAI/Anthropic/Google con streaming, salidas estructuradas, function/tool calling, arquitecturas RAG, retrieval híbrido (BM25 + vector), reranking, frameworks de evaluación (Ragas, evals personalizados).

Fine-tuning e inferencia

LoRA/QLoRA para fine-tuning de adaptadores, vLLM o sGLang para inferencia, cuantización (fp8, int4), batching, modelo mental del KV cache. Saber cuándo NO hacer fine-tuning (prompt + RAG suele ser suficiente).

Bases de datos vectoriales y retrieval

pgvector, Qdrant, Weaviate, modelos de embeddings (OpenAI, Cohere, BGE), estrategias de chunking, recall vs precision en el retrieval, eval queries.

MLOps

Experiment tracking (Weights & Biases o MLflow), model registry, feature stores en empresas más grandes (Feast), serving de inferencia (Triton, KServe, BentoML), monitorización de drift y calidad.

Disciplina de evaluación

Construir datasets de eval, LLM-as-judge con sus salvedades, golden tests, tests de regresión en CI, métricas online vs offline, A/B testing para modelos.

Frontera de 2026

Workflows agénticos, MCP, uso de herramientas multi-paso, generación estructurada (Outlines, Instructor), modelos pequeños (Phi, Qwen) para tareas optimizadas en coste, inferencia on-device.

Soft skills y pensamiento de sistemas

Plan sugerido de 3 / 6 / 12 meses

Meses 1–3: fundamentos

Meses 4–6: un proyecto de LLM

Meses 7–12: profundidad y entrevistas

Practique entrevistas de ML ML system design, escenarios de LLM, comportamiento y rondas de coding afinadas al trabajo de ingeniería de ML.
Probar una mock interview de ML

Proyectos personales para construir

Construir evals — el verdadero superpoder del ML engineer senior

La mayoría de las demos de ML están a un eval de distancia de ser funcionalidades de producción. El eval es el activo que hace mejorable un modelo.

En entrevistas, «construimos un set de eval de 200 ejemplos con tres métricas y lo ejecutamos en cada PR, lo que detectó una regresión de 7 puntos cuando intentamos cambiar de modelo» es el tipo de respuesta que señala senior. «El nuevo modelo se sentía mejor en spot checks» es la respuesta que no lo hace.

Cómo conseguir el puesto de ML

FAQ

¿Necesito un doctorado para ser ML engineer en 2026?

No. El doctorado se exige sobre todo para puestos de research-engineer en labs de frontera. La mayoría de las contrataciones de ingeniería de ML de producto no lo tienen. Un portafolio aplicado fuerte supera a un título en la mayoría de las empresas.

¿Debería aprender LLMs o ML clásico primero?

ML clásico primero. Tres meses con datos tabulares y scikit-learn le enseñan disciplina de datos, evaluación y pensamiento en features que el trabajo con LLM da por supuestos. Luego pase a los LLMs.

¿Necesito hacer fine-tuning de modelos para el empleo?

Con menos frecuencia de la que cree. La mayoría de las funcionalidades de LLM en producción funcionan con prompts + RAG + un set de eval fuerte. El fine-tuning aparece en empresas con tareas específicas de dominio o restricciones de coste.

¿Qué importancia tienen los fundamentos de matemáticas?

Lo justo para leer papers y entender lo que usa. No necesita derivar transformers. La intuición de álgebra lineal, probabilidad y descenso de gradiente a nivel conceptual cubre la mayoría de las preguntas de entrevista.

¿Y los agentes y MCP?

En rápido ascenso y empezando a aparecer en las entrevistas de 2026. Construya un proyecto de agente para ir sobre seguro. Entienda el tool calling, las salidas estructuradas y la diferencia entre «agente que funciona en demos» y «agente que funciona en producción con evals».