¿Qué es Machine Learning (ML) en palabras simples?
Machine Learning es una forma de hacer que un sistema “aprenda” a tomar decisiones a partir de ejemplos (datos), en lugar de decirle exactamente qué hacer con una lista fija de reglas. En la práctica, ML encuentra patrones en datos pasados para producir una respuesta útil en casos nuevos.
Ejemplo cotidiano: filtrar spam
Si quisieras bloquear correos no deseados con reglas programadas, podrías escribir cosas como: “si el asunto contiene ‘gana dinero’ entonces es spam”. El problema es que los spammers cambian el texto, usan sinónimos, imágenes o trucos. Con ML, el sistema mira miles de correos marcados como “spam” y “no spam” y aprende combinaciones de señales (palabras, remitentes, formatos) que suelen indicar spam, incluso cuando el texto cambia.
Ejemplo cotidiano: predecir cuánto tardará un envío
En vez de una regla como “todas las entregas tardan 48 horas”, ML puede aprender de datos reales: ciudad de origen, destino, día de la semana, clima, saturación del almacén, etc. Con eso estima un tiempo más realista para cada pedido.
Reglas programadas vs. aprendizaje desde datos
| Enfoque | Cómo funciona | Cuándo encaja mejor | Limitación típica |
|---|---|---|---|
| Reglas programadas | Una persona define condiciones explícitas: “si pasa A, haz B”. | Procesos estables, claros y con pocas excepciones (por ejemplo, validar que un campo no esté vacío). | Se rompe cuando aparecen casos nuevos o demasiadas excepciones; mantener reglas se vuelve costoso. |
| Machine Learning | El sistema aprende patrones a partir de ejemplos (datos) y generaliza a casos nuevos. | Problemas con variabilidad, señales múltiples y patrones difíciles de escribir como reglas (por ejemplo, detectar fraude). | Necesita datos representativos; puede fallar si cambian las condiciones o si los datos están sesgados. |
Analogía rápida
- Reglas programadas: una receta exacta que siempre sigues igual.
- Machine Learning: aprender a cocinar probando muchos platos y ajustando según lo que funciona.
Qué problemas encajan bien con Machine Learning
ML suele ser útil cuando quieres que el sistema produzca una respuesta basada en patrones de datos. Estos son cuatro tipos muy comunes:
1) Predicción (estimar un número)
Objetivo: estimar “cuánto” o “cuándo”.
- Escuche el audio con la pantalla apagada.
- Obtenga un certificado al finalizar.
- ¡Más de 5000 cursos para que explores!
Descargar la aplicación
- Ejemplos: predecir demanda de un producto, estimar tiempo de entrega, pronosticar consumo eléctrico.
- Señal de que encaja: tienes historial y el resultado es un valor numérico.
2) Clasificación (elegir una categoría)
Objetivo: decidir entre etiquetas.
- Ejemplos: spam/no spam, aprobar/rechazar una solicitud, detectar si una foto contiene un objeto específico.
- Señal de que encaja: puedes definir categorías claras y tienes ejemplos etiquetados (aunque no sean perfectos).
3) Recomendación (ordenar opciones)
Objetivo: sugerir lo más relevante para cada persona.
- Ejemplos: recomendar películas, productos, cursos o noticias según comportamiento previo.
- Señal de que encaja: hay muchas opciones y quieres personalizar; tienes registros de interacciones (clics, compras, reproducciones).
4) Detección (encontrar algo raro o importante)
Objetivo: identificar eventos inusuales o casos que requieren atención.
- Ejemplos: detectar fraude en pagos, anomalías en sensores industriales, intentos de acceso sospechosos.
- Señal de que encaja: lo “normal” es frecuente y lo “raro” importa mucho, aunque sea poco común.
Qué problemas NO encajan (o no son la primera opción)
Cuando una regla simple resuelve el 95%
Si el problema es estable y se describe con pocas reglas claras, ML suele ser innecesario.
- Ejemplos: “si el usuario no aceptó términos, no puede continuar”, “si el DNI no tiene 8 dígitos, mostrar error”.
Cuando no hay datos (o son irrelevantes)
Sin ejemplos suficientes o sin relación con lo que quieres predecir, ML no tiene de dónde aprender.
- Ejemplos: intentar predecir ventas sin historial ni variables útiles; detectar fraude sin registros de transacciones.
Cuando necesitas explicaciones legales o trazabilidad total
En algunos contextos, necesitas justificar cada decisión con reglas explícitas y auditables. ML puede ayudar, pero quizá no sea la herramienta principal si la explicación debe ser exacta y determinista.
Cuando el objetivo es “crear” una estrategia desde cero
ML no es magia: aprende de patrones pasados. Si el entorno cambia radicalmente o no hay precedentes, puede fallar.
La idea clave: Entradas → Proceso → Salida
Puedes entender cualquier proyecto de ML con este esquema:
1) Entradas (datos): lo que el sistema observa
Son señales que describen cada caso. Piensa en ellas como “pistas”.
- Ejemplo spam: palabras del asunto, dominio del remitente, si hay enlaces, frecuencia de envío.
- Ejemplo entregas: origen, destino, hora de despacho, tipo de envío, historial de retrasos.
- Ejemplo recomendación: historial de clics, tiempo de visualización, compras, valoraciones.
2) Proceso (entrenamiento): aprender a partir de ejemplos
El entrenamiento es como practicar con ejercicios resueltos. El sistema ve muchos casos donde ya se conoce el “resultado correcto” (o una señal aproximada) y ajusta su forma de decidir para acertar cada vez más.
- Analogía: un entrenador muestra jugadas pasadas y el equipo aprende patrones para responder mejor en el próximo partido.
- Qué se busca: que el sistema funcione bien no solo en ejemplos vistos, sino en casos nuevos.
3) Salida (predicciones): la respuesta para casos nuevos
La salida puede ser un número, una etiqueta, una lista ordenada o una alerta.
- Predicción: “llegará en 2.3 días”.
- Clasificación: “esto es spam”.
- Recomendación: “top 10 productos para ti”.
- Detección: “transacción sospechosa: revisar”.
Guía práctica: cómo decidir si usar Machine Learning
Paso 1: define la decisión que quieres automatizar
Escribe la pregunta en una frase clara.
- “¿Este correo es spam?”
- “¿Qué producto es más probable que compre este usuario?”
- “¿Cuántas unidades venderemos mañana?”
Paso 2: identifica la salida (qué tipo de respuesta necesitas)
- Número → predicción.
- Categoría → clasificación.
- Ranking → recomendación.
- Alerta → detección.
Paso 3: lista las entradas disponibles (las “pistas”)
Haz un inventario de datos que ya tienes o puedes obtener de forma responsable.
- ¿Están completos?
- ¿Se actualizan?
- ¿Representan la realidad que quieres predecir?
Paso 4: comprueba si existen ejemplos del pasado
Para entrenar, normalmente necesitas casos anteriores con resultado conocido o una señal equivalente.
- Spam: correos ya marcados por usuarios.
- Fraude: transacciones confirmadas como fraude/no fraude.
- Recomendación: clics, compras, reproducciones.
Paso 5: evalúa si una regla simple sería suficiente
Antes de ML, intenta describir 3–5 reglas. Si con eso cubres casi todo y las excepciones son pocas, quizá no necesitas ML.
Ejemplo de regla simple (no ML): si el usuario no verificó email, bloquear acceso.Paso 6: define cómo medir “funciona bien”
Necesitas un criterio práctico de éxito.
- Spam: reducir spam sin bloquear correos importantes.
- Entrega: que el tiempo estimado se acerque al real.
- Fraude: detectar casos reales sin molestar a clientes legítimos.
Paso 7: decide el uso inicial (pequeño y controlado)
Empieza con un caso de uso acotado donde el impacto sea manejable.
- Primero “sugerir” en vez de “decidir automáticamente”.
- Primero “alertar” para revisión humana en vez de bloquear.