Optimización de Vulnerabilidades con IA y el Agente de Seguridad de GitHub

Elena Digital López

El GitHub Security Lab ha dado un paso significativo en la gestión de alertas de seguridad al implementar modelos de lenguaje de gran tamaño (LLMs), mejorando notablemente el proceso de triage, que a menudo resulta tedioso y propenso a errores. Este avance se ha logrado gracias a la creación del GitHub Security Lab Taskflow Agent, un innovador marco de trabajo de inteligencia artificial que ha demostrado ser sumamente efectivo para detectar patrones que suelen pasar desapercibidos para las herramientas de análisis de código convencionales.

Desde agosto, los expertos del laboratorio han estado experimentando con taskflows, archivos YAML diseñados para organizar tareas y facilitar el uso de LLMs en el triage de alertas de escaneo de código. Durante este período, han clasificado un gran número de alertas, identificando cerca de 30 vulnerabilidades reales, muchas de las cuales ya se han corregido y publicado. Los LLMs participaron en tareas simples como la búsqueda de archivos y la recolección de datos, logrando resultados significativos sin depender de herramientas de análisis de código estático o dinámico, más allá de las alertas generadas con CodeQL.

Este marco de trabajo permite a los investigadores automatizar flujos de trabajo utilizando inteligencia artificial para abordar áreas donde la intervención humana es más eficaz en la detección de problemas. Las alertas se triagan según criterios bien definidos, mejorando la identificación de falsos positivos. Las tareas se dividen en etapas que incluyen la recopilación de datos y la auditoría de la información recopilada, culminando en un informe que resume los hallazgos.

Los resultados han permitido una mejor identificación de falsos positivos en alertas generales provenientes de GitHub Actions y otros contextos, donde las medidas de seguridad en los flujos de trabajo mitigan riesgos potenciales. Este sistema no solo mejora la precisión en la detección de vulnerabilidades, sino que también se beneficia de la retroalimentación obtenida durante la auditoría, lo que optimiza futuros análisis.

El laboratorio ha liberado el código de los taskflows para que otros investigadores puedan desarrollar y utilizar estos flujos de trabajo, fomentando una colaboración más eficaz en la identificación y mitigación de vulnerabilidades en proyectos de código abierto.

Scroll al inicio