La filtració de Google revela milers d’incidents de privadesa
04/06/2024

Google ha recollit accidentalment dades de veu d’infants, ha filtrat els viatges i les adreces dels domicilis dels usuaris de cotxes compartits i ha fet recomanacions de YouTube basades en l’historial de visualitzacions suprimides pels usuaris, entre milers d’altres incidents de privadesa que han estat revelats pels empleats; tot això segons un informe sobre una base de dades de Google que fa un seguiment de possibles problemes de privadesa i seguretat durant sis anys i de la qual 404 Media n’ha obtingut una còpia.
Individualment, els incidents, la majoria dels quals prèviament no s’han informat públicament, només poden afectar a un nombre relativament reduït de persones o s’han solucionat ràpidament.
En conjunt, però, la base de dades interna mostra com una de les empreses més poderoses i importants del món gestiona, i sovint gestiona malament, una quantitat impressionant de dades personals i sensibles sobre la vida de les persones.
Les dades obtingudes per 404 Media inclouen problemes de privadesa i seguretat que els mateixos empleats de Google van informar internament.
Entre ells hi ha problemes amb els productes propis de Google o les pràctiques de recollida de dades; vulnerabilitats en proveïdors tercers de Google; o errors comesos pel personal, els contractistes o altres persones de Google que han afectat els sistemes o les dades de Google.
Els incidents inclouen de tot, des d’un únic correu electrònic errant que conté alguna informació personalitzada, o filtracions substancials de dades, fins a incursions imminents a les oficines de Google.
Quan informen d’un incident, els empleats li donen una puntuació de prioritat, P0 és la més alta, P1 és un nivell per sota.
La base de dades conté milers d’informes al llarg de sis anys, del 2013 al 2018.
En un cas del 2016, un empleat de Google va informar que els sistemes de Google Street View estaven transcrivint i emmagatzemant números de matrícules obtinguts de les fotografies.
Van explicar que Google utilitza un algorisme per detectar text a les imatges de Street View.
«Malauradament, el contingut de les matrícules també és text i sembla que en molts casos s’han transcrit», va escriure l’empleat.
«A conseqüència d’això, la nostra base de dades d’objectes detectats a Street View ara conté, sense voler, una base de dades de números de matrícules i fragments de matrícules geolocalitzades.»
«Vull destacar que va ser un accident. El sistema que transcriu aquests fragments de text hauria d’haver evitat les imatges identificades pels nostres detectors de matrícules, però, per raons encara desconegudes, no ho va fer», van afegir. L’informe diu que les dades s’han depurat.
Un altre incident va implicar l’exposició pública de més d’un milió d’adreces de correu electrònic d’usuaris de Socratic.org, una empresa adquirida per Google. L’informe diu que les dades es poden veure a la font de la pàgina del lloc web de l’empresa. També se sospitava que la informació de geolocalització i les adreces IP dels usuaris estaven disponibles. Entre els afectats hi havia infants.
L’informe també diu: «Aquesta exposició s’ha abordat com a part de les condicions definitives d’aquesta adquisició. No obstant això, les dades es van exposar durant més d’1 any i segurament han estat recollides».
En un tercer incident, un servei de parla de Google va registrar tot l’àudio, incloses unes 1.000 dades de parla infantil, durant aproximadament una hora. «Es van recollir aproximadament 1.000 expressions de parla infantil. L’equip va suprimir totes les dades de parla registrades del període de temps afectat», explica l’informe.
En un altre incident, a un client de producte al núvol de Google, que és per a clients governamentals que necessiten protegir dades delicades, el van passar inadvertidament a un producte de consum. L’informe constata que «A conseqüència d’una migració accidental de SKU a G Suite for Business, aquest client ja no té garantida la ubicació de les dades dels EUA».
En alguns casos, els mateixos informes diuen que el problema s’ha solucionat.
Quan 404 Media va compartir amb Google els codis d’identificació d’uns 30 incidents, l’empresa va dir que els havia resolt al moment.
Altres incidents marcats amb alta prioritat o destacats a la base de dades inclouen:
- No s’ha aplicat correctament un filtre que havia d’impedir que es recollissin les veus dels infants;
- una persona va modificar els comptes dels clients a AdWords, com es deia la plataforma publicitària de Google en aquell moment, per manipular els codis de seguiment dels afiliats als anuncis;
- l’equip de seguretat global va advertir que esperava una incursió a una oficina de Google a Jakarta l’abril de 2017 (un incident similar va passar el setembre de 2016);
- la funció de compartició de vehicle de Waze va filtrar els viatges i les adreces dels domicilis d’altres usuaris;
- un empleat de Google va accedir a vídeos privats al compte de YouTube de Nintendo i va filtrar informació abans que la comuniquessin els anuncis previstos de Ninendo, segons l’informe una entrevista interna va concloure que l’activitat va ser «no intencionada»;
- Sabre, una agència de viatges que utilitza la mateixa Google, es va veure compromesa i la informació de pagament dels empleats de Google va quedar exposada;
- una peculiaritat del teclat d’Android va comportar que els infants, en realitat, estaven prement el botó del micròfon, la qual cosa va fer que Google enregistrés àudio dels infants com a part del llançament de l’aplicació YouTube Kids;
- YouTube va fer recomanacions basades en vídeos que els usuaris havien suprimit del seu historial de visualitzacions, la qual cosa va en contra de la política de YouTube;
- una funció de desenfocament de YouTube exposava versions sense censura de les imatges;
- quan els usuaris d’iOS de Google Drive o Docs establien els controls d’accés a un fitxer com a “Qualsevol persona amb l’enllaç”, Google el tractava com a enllaç “públic”;
- els vídeos de YouTube penjats com a privats o ocults poden aparèixer disponibles públicament durant un curt període de temps.
Google va dir a 404 Media en un comunicat: «Els empleats de Google poden marcar ràpidament problemes potencials del producte perquè els revisin els equips corresponents. Quan un empleat marca un incident, suggereix el nivell de prioritat al revisor. Els informes obtinguts per 404 són de fa més de sis anys i són exemples d’aquestes marques, cadascuna es va revisar i resoldre en aquell moment. En alguns casos, aquestes marques d’empleats no eren problemes en absolut o eren problemes que els empleats van trobar en serveis de tercers».
404 Media va obtenir el gran conjunt de dades d’un informador anònim que no va proporcionar el seu nom o identitat real.
Després, 404 Media va verificar la veracitat del conjunt de dades; Google també va confirmar aspectes del seu contingut.