Método REDIBAGG (REduced DImension BAGGing Ensemble)

Actualizada 14/11/2025

Publicada 14/11/2025

DESCRIPCIÓN

La adopción de algoritmos de Machine Learning ha experimentado un crecimiento exponencial en los últimos años. Sin embargo, a pesar de su alto rendimiento, el entrenamiento de estos algoritmos está limitado por su velocidad, especialmente cuando se manejan grandes volúmenes de datos. Para superar esta limitación en el desarrollo de modelos, se presenta el método REDIBAGG.

El propósito central de esta técnica no es el entrenamiento directo del modelo, sino que se enfoca en la preparación y selección de la información inicial para generar un subconjunto de entrenamiento más reducido.

De este modo, al reducir la cantidad de datos que el algoritmo debe procesar, se disminuyen drásticamente los recursos computacionales necesarios, lo cual se traduce en una disminución directa del tiempo de entrenamiento y del espacio de almacenamiento requerido durante esta fase.

ESTADO DE DESARROLLO

El método REDIBAGG desarrollado ha sido probado con distintos algoritmos de aprendizaje automático en conjuntos de datos reales de diversas industrias, tales, como ciberseguridad, finanzas, PYMES, entre otras. Los resultados han demostrado su eficiencia en la fase de entrenamiento de modelos basados en aprendizaje automático.

AUTORES

Esther-Lydia Silva-Ramírez; Juan-Francisco Cabrera-Sánchez; Manuel López-Coello.

PALABRAS CLAVE

Software, Inteligencia Artificial, Algoritmos de aprendizaje automático, Bagging ensemble, Bootstrap, Eficiencia, Procesamiento de datos.

USOS Y APLICACIONES

En el ámbito empresarial, la implementación de soluciones basadas en algoritmos de Machine Learning presenta problemas relacionados con el elevado costo computacional y el tiempo prolongado de la fase de entrenamiento. REDIBAGG resuelve directamente este desafío al permitir que los científicos de datos entrenen modelos con una fracción de la información original.

La técnica se distingue por ofrecer un equilibrio entre velocidad y precisión, una ventaja que otras técnicas de optimización no logran mantener. Su eficacia radica en su capacidad para reducir, en promedio, el tamaño del conjunto de entrenamiento en un 25%, mientras garantiza un alto nivel de precisión predictiva, con resultados similares a los obtenidos mediante la técnica de Bagging original.

La técnica puede aplicarse a conjuntos de datos tabulares de distintos ámbitos: servicios financieros, salud y bioseguridad, tecnología de la información, tec. Un ejemplo de aplicación puede apreciarse en el sector de la ciberseguridad, donde se puede acelerar el entrenamiento de modelos de detección de anomalías para identificar amenazas de manera más rápida.

VENTAJAS

Reducción de recursos de cómputo: Al reducir el tamaño del conjunto de datos, se minimiza la carga computacional necesaria durante la fase de entrenamiento, mejorando el rendimiento computacional.
Mayor eficiencia en tiempo: La optimización del proceso de entrenamiento permite reducir significativamente el tiempo de ejecución, potenciando la productividad.
Aseguramiento de calidad: El método empleado para este algoritmo asegura que no se comprometa el rendimiento o la precisión del modelo final.

Política de Cookies

Personalización de Cookies

UniversidaddeCádiz

UniversidaddeCádiz

Método REDIBAGG (REduced DImension BAGGing Ensemble)