“Big Data”, el nuevo riesgo a la privacidad

CIUDAD DE MÉXICO (apro).- El acaparamiento masivo de datos o “big data” se convierte en una de las mayores amenazas a la privacidad al propiciar la exposición de datos personales.

Ese es el fenómeno observado en recientes quebrantos de la privacidad de la información (data breaches, en inglés), que han exhibido perfiles de millones de usuarios.

En uno de los casos más sonados en este año, la empresa estadunidense de reportes crediticios Equifax, la cuarta más grande de ese país, reconoció el jueves 7 la filtración de direcciones de correo electrónico, fechas de nacimiento, números de licencia de conducir, seguridad social y de tarjetas de crédito. La compañía se tardó en aceptar la vulneración a pesar de que lo descubrió desde el pasado 29 de julio.

Equifax maneja información de 143 millones de consumidores de Estados Unidos y más de 820 millones en el mundo, así como 91 millones de empresas.

También te recomendamos

Para Nicholas Srnicek, profesor de Economía Digital en King’s College de la Universidad de Londres, Big Data se ha convertido en el lubricante del capitalismo digital desarrollado en las últimas dos décadas.

“Desde el colapso del boom del dot-com (las empresas de internet) de los noventa, las firmas tecnológicas han visto crecientemente los datos como un recurso a usar para generar ganancias, mejorar servicios y dominar a los competidores. Big data es hoy el recurso clave en la competencia capitalista. Con su surgimiento en años recientes, estos procesos se han acelerado”, analiza para Apro.

El académico publicó en 2016 el libro Capitalismo de plataformas, en el cual expone cómo las corporaciones tecnológicas evolucionaron para encabezar la economía digital, a partir de amasar datos y erigir monopolios.

Para Facebook y Google, los datos se sitúan en “el centro de su negocio publicitario”, mientras que para Amazon alimentan “sus recomendaciones de servicios y productos, sus algoritmos de precios, sus redes de logística y mucho más”.

A su juicio, Big Data se está volviendo más importante con el surgimiento del aprendizaje automático o de máquinas, el esquema de inteligencia artificial que depende de grandes cantidades de datos para preparar algoritmos.

En su libro, Srnicek argumenta que la eliminación de la privacidad está en el centro del modelo de negocios, tendencia que involucra constantemente presión sobre los límites de lo que es social y legalmente aceptable en términos de recolección de datos.

Los derrames digitales, equiparables a los vertidos de los oleoductos, se han vuelto un fenómeno común de la economía. El estadunidense Centro de Recursos sobre Robo de Identidad (ITRC, por sus siglas en inglés), cuantifica 7 mil 873 data breaches en Estados Unidos que han expuesto 907 millones 293 mil 703 registros entre el 1 de enero de 2005 y el 5 de septiembre pasado. A la fecha, registra al menos 975 vulneraciones de 19 millones 367 mil 773 registros.

El sector financiero, bancario y crediticio de Estados Unidos reportó 61 quebrantos, con 2.78 millones de registros. Las empresas sufrieron 513 violaciones que abarcaron 11 millones de registros, en tanto que las instituciones educativas padecieron 97 vulneraciones, con 1.11 millones de juegos de datos. El gobierno y el ejército estadunidenses reportaron 48 data breaches que expusieron 267 mil récords. Finalmente, el sector salud cuantificó 256 vulneraciones sobre 4.17 millones de registros.

El hackeo, que incluye suplantación de identidad (phishing), programas maliciosos, secuestro de información a cambio de un rescate (ranwomware) y clonación de tarjetas de crédito, es la principal causa de las violaciones a la privacidad.

En su reporte semestral de julio último, ITRC anticipa que el número de vulneraciones de datos podría alcanzar mil 500 este año, para un incremento de 37% en comparación con 2016 -mil 93-.

Por su parte, el Índice de Nivel de Quebranto, elaborado por la empresa de ciberseguridad holandesa Gemalto, enlista a nivel mundial 9 mil 40 millones 592 mil 509 registros robados o perdidos desde 2013. Cada segundo, 61 registros son expuestos, lo cual totaliza 5 millones 277 mil 637 diario.

Esas estadísticas, en las que habría un subregistro porque no todos los data breaches se reportan ni se incluyen todos los juegos de datos, dan cuenta de las fugas que propicia el actual modelo económico digital.

Los servicios móviles, el cómputo en grandes servidores (la nube), Big Data e “internet de las cosas” (IoT, por sus siglas en inglés) —aparatos eléctricos y/o electrodomésticos conectados a Internet y que generan grandes cantidades de datos– desafían la protección de la privacidad. Los datos masivos implican riesgos sobre información personalmente identificable, datos clínicos, financieros y conductuales.

Sólo 6% de la información se almacena en formato físico, mientras que el 94% restante se guarda en versión digital, según la consultora estadunidense CloudTweaks. Allí radica el aliciente para los delincuentes electrónicos que ven un filón jugoso en esas bases.

En un recorrido por sitios alojados en la red profunda (deep web), que alberga más de 90% del contenido electrónico, Apro comprobó que una cuenta que no ha sido explotada puede costar 50 dólares, mientras que datos que ya han sido utilizados por el cribercrimen se venden entre 5 y 10 dólares. Esas bases incluyen correos, cuentas bancarias, tarjetas de crédito y números de seguro social.

Dentro de una investigación en marcha, la gubernamental Comisión Federal de Comercio de Estados Unidos creó una base falsa de clientes con unos 100 individuos y la filtró a un sitio electrónico visitado por ladrones de identidad. Los datos incluían nombres, direcciones, números de teléfono, e-mails, contraseñas e información de pago, como tarjetas de crédito o cuentas en línea.

Los usurpadores tardaron nueve minutos en intentar usar los datos, al tratar de ingresar en los correos y las cuentas de pago de los 100 consumidores falsos más de mil 200 veces y de cargar unos 13 mil dólares en cargos no autorizados.

Juego de máquinas

El advenimiento del aprendizaje por parte de las máquinas potencia la aglomeración de datos y su consecuente riesgo de filtración. Así como las empresas pueden recurrir a la inteligencia artificial para acrecentar sus actividades, también los ladrones digitales pueden emplear esas herramientas.

Una encuesta de la consultora estadunidense 451 Research, levantada entre mil empresas de Estados Unidos, halló que 71% está amasando datos provenientes del “internet de las cosas” y casi la mitad de la información generada se almacena.

“Efectivamente, los datos son el combustible que permite operar a la inteligencia artificial. En la medida en que la inteligencia artificial se expande por la economía, son ese puñado de empresas con acceso a cantidades masivas de datos las que serán capaces de enriquecerse. El resultado predecible de estas tendencias es que cada gran empresa de tecnología está invirtiendo ahora en la extracción de datos e inteligencia artificial”, subraya Srnicek.

La proliferación de dispositivos generadores de datos crea un gran repositorio nuevo de información, que requiere crecientemente de almacenamiento mayor y más sofisticado, así como de herramientas de análisis.

En su libro, el académico inglés resalta que, en vez de depender de la compra de datos de los anunciantes, las plataformas de la nube construyen la infraestructura básica de la economía digital de forma que pueda ser rentada lucrativamente a otros, mientras reúnen datos para su propio uso.

En la medida en que la generación de información crece, Big Data se extiende a sectores diferentes a los buscadores, redes sociales o la banca. El segmento industrial también incursiona en el nuevo ruedo digital.

La alemana Siemens ha invertido más de cuatro mil millones de dólares en el desarrollo de capacidades de manufactura inteligente y construcción de su plataforma industrial MindSphere, mientras que la estadunidense General Electric también monta su plataforma Predix. Ambas ofrecen servicios en la nube, desarrollo de herramientas y aplicaciones para la gestión de internet industrial.

De hecho, el negocio de gas natural líquido de GE recaba tantos datos como lo hace Facebook, por lo cual requiere de herramientas adecuadas para su análisis, cotejo y uso.

Para 2020, habrá 20 mil 800 millones de dispositivos conectados a internet, de acuerdo con la consultora estadunidense Gartner.

Primeras soluciones

El modelo de recolección de datos provoca la indefensión de los usuarios debido a la falta de regulaciones estrictas y a términos y condiciones de servicios digitales extensos, burocráticos y a menudo indescifrables

El Congreso de Estados Unidos se negó a aprobar en 2015 una propuesta de ley promovida por el entonces presidente Barack Obama que requería el aviso público de Data Breaches en un lapso de 30 días y que incluía penalizaciones si eran ocultados.

No obstante, al menos 48 estados estadunidenses cuentan con leyes de aviso obligatorio de violaciones a la seguridad de los datos.

En Europa se levantan vientos de cambio. En mayo de 2018 entrará en vigor en la Unión Europea la Regulación General de Protección de Datos, que impone multas de hasta 2% de las ganancias globales anuales si una empresa no informa de una vulneración en 72 horas.

Para Srnicek, el primer paso es dar a la gente control significativo de sus datos. “Necesitamos nuevos derechos para ser capaces de tener control sobre los datos que generamos”, aunque advierte que la nueva regulación no resolverá todos los problemas.

Luego, “podemos imaginar formas no capitalistas de plataformas que podrían ser propiedad de la gente –a nivel local, regional o transnacionalmente– y proveer esos servicios para el bien común. Podemos prestar atención a las primeras visiones utópicas de cómputo en la nube para cada uno o reconocer que las redes sociales son la esfera pública del siglo XXI y deben operar como tales”, plantea.

Srnicek propone la nacionalización de empresas como Google o Facebook, en un intento por controlar su poder global, y apoyar proyectos como los esfuerzos para que los usuarios compren y operen Twitter o tener “una forma descentralizada de propiedad sobre las plataformas”, como Soundcloud, servicio alemán de distribución de audios que permite a sus usuarios cargar, promover y compartir sus propias pistas.

“Hay muchos experimentos e ideas para aprender, para poner a las plataformas bajo control democrático y público, al tiempo que se respeta simultáneamente la privacidad y la seguridad de los individuos”, resume.

Equifax ya enfrenta al menos 25 demandas en Estados Unidos, lo que augura un largo y costoso proceso judicial que puede suponer un fustazo para los amasadores de datos masivos.

Comentarios