Política de Cookies

El sitio web de la Universidad de Cádiz utiliza cookies propias y de terceros para realizar análisis de uso y medición del tráfico, así como permitir el correcto funcionamiento en redes sociales, y de este modo poder mejorar su experiencia de navegación.

Si desea configurar las cookies, pulse el botón Personalizar Cookies. También puede acceder a la configuración de cookies en cualquier momento desde el enlace correspondiente en el pie de página.

Para obtener más información sobre las cookies puede consultar la Política de cookies del sitio web de la Universidad de Cádiz.

Personalización de Cookies

El sitio web de la Universidad de Cádiz utiliza cookies propias y de terceros para realizar análisis de uso y medición del tráfico, así como permitir el correcto funcionamiento en redes sociales, y de este modo poder mejorar su experiencia de navegación.

Para obtener más información sobre las cookies puede consultar la Política de cookies del sitio web de la Universidad de Cádiz. También puede acceder a la configuración de cookies en cualquier momento desde el enlace correspondiente en el pie de página.

A continuación podrá configurar las cookies del sitio web según su finalidad:

  • Análisis estadístico

    En este sitio se utilizan cookies de terceros (Google Analytics) que permiten cuantificar el número de usuarios de forma anónima (nunca se obtendrán datos personales que permitan identificar al usuario) y así poder analizar la utilización que hacen los usuarios del nuestro servicio, a fin de mejorar la experiencia de navegación y ofrecer nuestros contenidos de manera óptima.

  • Redes sociales

    En este sitio web se utilizan cookies de terceros que permiten el correcto funcionamiento de algunas redes sociales (principalmente Youtube y Twitter) sin utilizar ningún dato personal del usuario.

UniversidaddeCádiz
Vicerrectorado de Investigación y Transferencia

Método REDIBAGG (REduced DImension BAGGing Ensemble)

DESCRIPCIÓN

La adopción de algoritmos de Machine Learning ha experimentado un crecimiento exponencial en los últimos años. Sin embargo, a pesar de su alto rendimiento, el entrenamiento de estos algoritmos está limitado por su velocidad, especialmente cuando se manejan grandes volúmenes de datos. Para superar esta limitación en el desarrollo de modelos, se presenta el método REDIBAGG.

El propósito central de esta técnica no es el entrenamiento directo del modelo, sino que se enfoca en la preparación y selección de la información inicial para generar un subconjunto de entrenamiento más reducido.

De este modo, al reducir la cantidad de datos que el algoritmo debe procesar, se disminuyen drásticamente los recursos computacionales necesarios, lo cual se traduce en una disminución directa del tiempo de entrenamiento y del espacio de almacenamiento requerido durante esta fase.

 

ESTADO DE DESARROLLO

El método REDIBAGG desarrollado ha sido probado con distintos algoritmos de aprendizaje automático en conjuntos de datos reales de diversas industrias, tales, como ciberseguridad, finanzas, PYMES, entre otras. Los resultados han demostrado su eficiencia en la fase de entrenamiento de modelos basados en aprendizaje automático.

 

AUTORES

Esther-Lydia Silva-Ramírez; Juan-Francisco Cabrera-Sánchez; Manuel López-Coello.

 

PALABRAS CLAVE

Software, Inteligencia Artificial, Algoritmos de aprendizaje automático, Bagging ensemble, Bootstrap, Eficiencia, Procesamiento de datos.

 

 

USOS Y APLICACIONES

En el ámbito empresarial, la implementación de soluciones basadas en algoritmos de Machine Learning presenta problemas relacionados con el elevado costo computacional y el tiempo prolongado de la fase de entrenamiento. REDIBAGG resuelve directamente este desafío al permitir que los científicos de datos entrenen modelos con una fracción de la información original.

La técnica se distingue por ofrecer un equilibrio entre velocidad y precisión, una ventaja que otras técnicas de optimización no logran mantener. Su eficacia radica en su capacidad para reducir, en promedio, el tamaño del conjunto de entrenamiento en un 25%, mientras garantiza un alto nivel de precisión predictiva, con resultados similares a los obtenidos mediante la técnica de Bagging original.

La técnica puede aplicarse a conjuntos de datos tabulares de distintos ámbitos: servicios financieros, salud y bioseguridad, tecnología de la información, tec. Un ejemplo de aplicación puede apreciarse en el sector de la ciberseguridad, donde se puede acelerar el entrenamiento de modelos de detección de anomalías para identificar amenazas de manera más rápida. 

 

VENTAJAS

  • Reducción de recursos de cómputo: Al reducir el tamaño del conjunto de datos, se minimiza la carga computacional necesaria durante la fase de entrenamiento, mejorando el rendimiento computacional.
  • Mayor eficiencia en tiempo: La optimización del proceso de entrenamiento permite reducir significativamente el tiempo de ejecución, potenciando la productividad.
  • Aseguramiento de calidad: El método empleado para este algoritmo asegura que no se comprometa el rendimiento o la precisión del modelo final.