Método REDIBAGG (REduced DImension BAGGing Ensemble)

![]()
| DESCRIPCIÓN
La adopción de algoritmos de Machine Learning ha experimentado un crecimiento exponencial en los últimos años. Sin embargo, a pesar de su alto rendimiento, el entrenamiento de estos algoritmos está limitado por su velocidad, especialmente cuando se manejan grandes volúmenes de datos. Para superar esta limitación en el desarrollo de modelos, se presenta el método REDIBAGG. El propósito central de esta técnica no es el entrenamiento directo del modelo, sino que se enfoca en la preparación y selección de la información inicial para generar un subconjunto de entrenamiento más reducido. De este modo, al reducir la cantidad de datos que el algoritmo debe procesar, se disminuyen drásticamente los recursos computacionales necesarios, lo cual se traduce en una disminución directa del tiempo de entrenamiento y del espacio de almacenamiento requerido durante esta fase.
ESTADO DE DESARROLLO El método REDIBAGG desarrollado ha sido probado con distintos algoritmos de aprendizaje automático en conjuntos de datos reales de diversas industrias, tales, como ciberseguridad, finanzas, PYMES, entre otras. Los resultados han demostrado su eficiencia en la fase de entrenamiento de modelos basados en aprendizaje automático.
AUTORES Esther-Lydia Silva-Ramírez; Juan-Francisco Cabrera-Sánchez; Manuel López-Coello.
PALABRAS CLAVE Software, Inteligencia Artificial, Algoritmos de aprendizaje automático, Bagging ensemble, Bootstrap, Eficiencia, Procesamiento de datos.
|
USOS Y APLICACIONES
En el ámbito empresarial, la implementación de soluciones basadas en algoritmos de Machine Learning presenta problemas relacionados con el elevado costo computacional y el tiempo prolongado de la fase de entrenamiento. REDIBAGG resuelve directamente este desafío al permitir que los científicos de datos entrenen modelos con una fracción de la información original. La técnica se distingue por ofrecer un equilibrio entre velocidad y precisión, una ventaja que otras técnicas de optimización no logran mantener. Su eficacia radica en su capacidad para reducir, en promedio, el tamaño del conjunto de entrenamiento en un 25%, mientras garantiza un alto nivel de precisión predictiva, con resultados similares a los obtenidos mediante la técnica de Bagging original. La técnica puede aplicarse a conjuntos de datos tabulares de distintos ámbitos: servicios financieros, salud y bioseguridad, tecnología de la información, tec. Un ejemplo de aplicación puede apreciarse en el sector de la ciberseguridad, donde se puede acelerar el entrenamiento de modelos de detección de anomalías para identificar amenazas de manera más rápida.
VENTAJAS
|
