Tipos de Modelos de IA
¿Qué son los Modelos de IA?
Los modelos de inteligencia artificial son algoritmos entrenados para reconocer patrones en imágenes y realizar predicciones automáticas. Rosepetal soporta diferentes tipos de modelos según las necesidades específicas de inspección visual.
Tipos de Modelos Disponibles
🏷️ Clasificación (MULTICLASS)
¿Qué hace?
Categoriza imágenes completas en diferentes clases o categorías predefinidas.
Casos de Uso
- Control de calidad: "Bueno" vs "Defectuoso"
- Categorización de productos: Tipo A, B, C
- Clasificación de defectos: Rayadura, abolladura, mancha
- Verificación de conformidad: Pasa/No pasa
Características
- Una etiqueta por imagen: Cada imagen pertenece a una sola clase
- Salida con confianza: Porcentaje de certeza para cada predicción
- Múltiples clases: Puede manejar 2 a N categorías diferentes
- Rápido y eficiente: Ideal para decisiones binarias o múltiples
Ejemplo Práctico
Imagen de tornillo → Modelo → "Bueno" (95% confianza)
Imagen de pieza → Modelo → "Defectuosa" (87% confianza)
🚨 Detección de Anomalías (ANOMALY)
¿Qué hace?
Identifica elementos anómalos o fuera de lo normal comparando con patrones aprendidos de muestras "correctas".
Casos de Uso
- Detección de defectos desconocidos: Sin ejemplos previos del defecto
- Inspección de superficies: Grietas, rayones, deformaciones
- Control de uniformidad: Variaciones en textura o forma
- Detección de contaminación: Partículas o manchas inesperadas
Características
- Aprendizaje no supervisado: Solo necesita ejemplos "normales"
- Detección de novedades: Encuentra patrones no vistos antes
- Puntuación de anomalía: Grado de "rareza" de cada imagen
- Sensibilidad configurable: Ajustar nivel de detección
Ejemplo Práctico
Entrena con: 1000 imágenes de piezas perfectas
Predice: Nueva imagen → "Anomalía detectada" (zona marcada)
🎯 Detección de Objetos (imageObjectDetection)
¿Qué hace?
Localiza y clasifica múltiples objetos dentro de una misma imagen, dibujando cajas delimitadoras alrededor de cada uno.
Casos de Uso
- Conteo automático: Número de piezas en una bandeja
- Localización de componentes: Encontrar tornillos, chips, conectores
- Inspección de ensamblaje: Verificar presencia y posición de partes
- Análisis de layout: Distribución de elementos en superficies
Características
- Múltiples detecciones: Varios objetos por imagen
- Localización precisa: Coordenadas x,y,ancho,alto de cada objeto
- Clasificación simultánea: Tipo y ubicación en una sola predicción
- Confianza por objeto: Certeza individual para cada detección
Ejemplo Práctico
Imagen de circuito → Modelo → [
"Resistor" (x:100, y:50, confianza: 92%),
"Capacitor" (x:200, y:80, confianza: 88%),
"Chip" (x:150, y:120, confianza: 95%)
]
🎨 Segmentación (MULTILABEL)
¿Qué hace?
Delimita áreas precisas pixel a pixel de diferentes elementos o regiones de interés en la imagen.
Casos de Uso
- Medición de áreas: Tamaño exacto de defectos o componentes
- Análisis morfológico: Forma, perímetro, área de objetos
- Separación de materiales: Diferentes tipos de superficie
- Mapeo de regiones: Áreas específicas para análisis detallado
Características
- Precisión pixel: Delimitación exacta de bordes
- Múltiples regiones: Diferentes áreas en la misma imagen
- Análisis cuantitativo: Mediciones de área, forma, distancia
- Máscaras de color: Visualización por colores de cada región
Ejemplo Práctico
Imagen de soldadura → Modelo → Máscara que marca:
- Área verde: Soldadura correcta (1,234 pixels)
- Área roja: Defecto por porosidad (89 pixels)
- Área azul: Metal base (5,678 pixels)
Arquitecturas de Modelos
🎓 Supervisados
Requieren datos etiquetados para entrenamiento
- Clasificación: Imágenes con etiquetas de clase
- Detección: Imágenes con cajas delimitadoras
- Segmentación: Imágenes con máscaras pixel a pixel
🔍 No Supervisados
Aprenden patrones sin etiquetas explícitas
- Detección de anomalías: Solo ejemplos "normales"
- Clustering: Agrupación automática por similitud
- Autoencoders: Reconstrucción de imágenes
🎯 Semi-supervisados
Combinan datos etiquetados y no etiquetados
- Pocos ejemplos: Cuando hay pocas imágenes etiquetadas
- Aprendizaje activo: El modelo sugiere qué etiquetar
- Transfer learning: Aprovecha modelos preentrenados
Selección del Modelo Apropiado
🎯 Según el Objetivo
Para Decisiones Binarias
- Recomendado: Clasificación MULTICLASS
- Alternativa: Detección de anomalías (si solo hay ejemplos "buenos")
Para Localizar Elementos
- Recomendado: Detección de objetos
- Cuándo: Necesitas saber DÓNDE está el objeto/defecto
Para Mediciones Precisas
- Recomendado: Segmentación MULTILABEL
- Cuándo: Necesitas área exacta, forma o perímetro
Para Defectos Desconocidos
- Recomendado: Detección de anomalías
- Cuándo: No tienes ejemplos de todos los posibles defectos
📊 Según los Datos Disponibles
Con Muchas Imágenes Etiquetadas
- Clasificación o Detección de objetos
- Mínimo recomendado: 100-500 imágenes por clase
Con Pocas Imágenes Etiquetadas
- Transfer learning con modelos preentrenados
- Semi-supervisado combinando con imágenes sin etiquetar
Solo Imágenes "Normales"
- Detección de anomalías
- Ideal cuando es difícil obtener ejemplos de defectos
⚡ Según Requisitos de Velocidad
Tiempo Real (< 100ms)
- Clasificación: Más rápida
- Detección simple: Con pocos objetos
Procesamiento en Lote
- Segmentación: Análisis detallado
- Detección compleja: Con muchos objetos
Métricas de Evaluación
🏷️ Para Clasificación
- Precisión (Accuracy): Porcentaje de aciertos totales
- Precisión por clase: Aciertos para cada categoría
- Recall: Capacidad de encontrar casos positivos
- F1-Score: Balance entre precisión y recall
🎯 Para Detección de Objetos
- mAP (mean Average Precision): Precisión promedio por clase
- IoU (Intersection over Union): Solapamiento de cajas
- Precisión de localización: Exactitud de las coordenadas
- Tasa de detección: Porcentaje de objetos encontrados
🚨 Para Detección de Anomalías
- AUC-ROC: Área bajo la curva ROC
- Tasa de falsos positivos: Normales clasificados como anómalos
- Tasa de falsos negativos: Anomalías no detectadas
- Umbral óptimo: Punto de equilibrio entre tipos de error
🎨 Para Segmentación
- IoU de píxeles: Solapamiento pixel a pixel
- Dice Coefficient: Similitud entre máscaras
- Precisión de borde: Exactitud en los contornos
- Completitud de región: Porcentaje de área correctamente segmentada
Consideraciones de Implementación
💻 Recursos Computacionales
- GPU recomendada: Para entrenamientos complejos
- Memoria RAM: Varía según el tamaño de imagen y modelo
- Almacenamiento: Para datasets grandes e histórico de modelos
🔄 Actualización de Modelos
- Reentrenamiento periódico: Con nuevos datos
- Versionado: Mantener diferentes versiones
- A/B Testing: Comparar rendimiento entre versiones
- Rollback: Capacidad de volver a versión anterior