HPTSA sfrutta vulnerabilità con efficienza aumentata del 550%
Un team di ricerca ha utilizzato GPT-4 per sfruttare l'87% delle vulnerabilità appena scoperte per cui non era ancora stata rilasciata una patch. Questa settimana, lo stesso team ha ottenuto risultati ancora migliori impiegando agenti autonomi, auto-propaganti, attraverso un metodo di Pianificazione Gerarchica con Agenti Specifici per Compiti (HPTSA). Invece di assegnare un singolo agente di LLM per risolvere molti compiti complessi, HPTSA utilizza un agente di pianificazione che sovrintende all’intero processo e lancia molteplici subagenti specifici per i compiti. Quando testato su 15 vulnerabilità reali orientate al web, HPTSA ha dimostrato di essere il 550% più efficiente di un singolo LLM nello sfruttare le vulnerabilità ed è riuscito a hackerare 8 delle 15 vulnerabilità zero-day., mentre il solo sforzo dell’LLM è riuscito solo in 3 dei 15 casi.