Demostren com utilitzar ChatGPT-40 per fer estafes financeres basades en veu
28/11/2024

La darrera versió del LLM permetria a través d’agents d’IA introduir dades i administrar codis d’autenticació de dos factors.
ChatGPT-40 és el darrer model d’intel·ligència artificial i xatbot avançat de LLM (model de llenguatge extens, en anglès) introduït per OpenAI que aporta noves millores, com ara la integració d’entrades i sortides de text, veu i visió.
Gràcies a aquestes propietats OpenAI ha integrat diverses salvaguardes per detectar i bloquejar continguts perjudicials, com ara replicar veus no autoritzades.
Tot i això, dos investigadors de la UIUC han demostrat que és possible abusar de l’API (interfície de programació d’aplicacions) de veu en temps real d’OpenAI per a ChatGPT-40 per dur a terme estafes financeres. Malgrat això, aquestes solen tenir taxes d’èxit baixes a moderades.
Els autors de la investigació, Richard Fang, Dylan Bowman i Daniel Kang, han descobert que aquestes noves eines que estan disponibles sense restriccions no compten amb prou salvaguardes per protegir-se contra possibles abusos per parts d’estafadors i ciberdelinqüents.
L’article cita diverses estafes, com ara transferències bancàries, exfiltració de targetes regal, transferències de criptomonedes i robatori de credencials per a comptes de Gmail o xarxes socials.
Els Agents d’IA que s’encarreguen de fer les estafes se serveixen d’eines d’automatització de LLM per navegar per les webs, introduir dades i administrar codis d’autenticació de dos factors i instruccions específiques relacionades amb les estafes.
«Despleguem els nostres agents en un subconjunt d’estafes comunes. Simulem estafes interactuant manualment amb l’agent de veu, exercint el paper d’una víctima crèdula», va explicar Kang en una publicació de bloc sobre la investigació.
«Per determinar l’èxit, confirmem manualment si l’estat final es va assolir en aplicacions/llocs web reals. Per exemple, fem servir Bank of America per a estafes de transferències bancàries i confirmem que els diners realment es van transferir. No obstant això, no mesurem la capacitat de persuasió d’aquests agents», van afegir. Els investigadors van efectuar diverses tècniques simples de desbloqueig de superusuari (jailbreak) ràpid per eludir les proteccions.
Les taxes d’èxit van oscil·lar entre el 20 % i el 60 % i cada intent va requerir fins a 26 accions del navegador i va durar fins a 3 minuts als escenaris més complexos.
L’acció que va aconseguir resultats més bons va ser el robatori de credencials de Gmail, que va funcionar en el 60 % dels casos. Per altra banda, les transferències de criptomonedes i el robatori de credencials d’Instagram només van tenir èxit el 40 % de les vegades.
El més preocupant de tot seria el ‘preu’ tan barat que tindrien aquestes estafes, ja que cada cas reeixit sortiria per només 0,75 dòlars.