19 de abril de 2018

¿El blockchain como solución para la conservación de archivos?

La conservación de archivos en formato digital enfrenta dos grandes problemas. el asegurar que los documentos no son manipulados y enfrentar los cambios tecnológicos producto de los cuales los formatos digitales cambian con el tiempo: se crean otros nuevos, se retiran los antiguos, y es posible que el nuevo software ya no los soporte. "Los archivos modernos tienen la tarea de almacenar los documentos de hoy para que puedan ser utilizados por las generaciones futuras para comprender la sociedad contemporánea." (Open Data Institute)

Hoy, numerosas organismos y empresas se enfrentan a la necesidad de traspasar archivos físicos a formatos digitales, para luego proseguir solamente con lo digital, lo cual plantea muchos desafíos para la práctica archivística moderna. 

Pero se cuenta hoy con la tecnología blockchain para garantizar la integridad de los objetos digitales de tal modo que permanezcan inalterados mientras están en el archivo. Un sistema basado en blockchain podría usarse como un mecanismo para verificar que los documentos no hayan sido alterados mientras estén almacenados. Por cierto, no se pueden conservar íntegramente en las cadenas de bloques: se debe aplicar un algoritmo al objeto para crear un hash del documento (una huella digital inalterable) que luego puede almacenarse en un libro mayor distribuido. El hash no revelará el contenido del documento, pero permitirá que cualquiera que tenga acceso al objeto original verifique que contenga el mismo contenido que cuando se creó el hash.

El segundo problema es más complejo. ¿Cómo hacer para asegurar la fiabilidad y falta de alteración del contenido en los casos en que este es traspasado a un nuevo formato? Es necesario asegurar que los algoritmos de hash que se utilicen consideren el contenido fuera del formato. Este problema ha sido abordado por el proyecto ARCHANGEL del Open Data Institute. Este proyecto se propone explorar y prototipar la creación de hashes usando métodos de aprendizaje automático (inteligencia artificial), particularmente para contenidos de imágenes y video, en lugar de hashes ‘tradicionales’ de nivel de bytes. Los avances y técnicas serán difundidos en Open Source, para que todos puedan beneficiarse de ellos.(

5 de abril de 2018

Manipulación de contenidos

Hace unos días hizo noticia Cambridge Analytica por su captura de datos de 50 millones de cuentas de Facebook, lo cual provocó una fuerte caída de valor de las acciones de la red social et una campaña para su abandono (#deletefacebook). Quienes conocemos la red social y cómo opera no nos extrañamos de lo hecho por Cambridge Analytica, cuyas operaciones conocemos al menos desde los tiempos de la campaña electoral de Estados Unidos (2016). Esta empresa no es la única que rastrea, captura, analiza y vende datos personales. Se conocen varias, como Experian, Hacking Team, Crystal y Reverb Insights (ABC.es, 7/07/2014, TechCrunch, 24/02/2015, Xataka, 24/02/2015).

Se puede reprobar este tipo de práctica pero, en este caso, se debería reprobar el propio modelo de negocio de Facebook. Acumula y analiza, con el apoyo de un importante departamento y software de inteligencia artificial, los datos de sus miles de millones de usuarios, clasificándolos y caracterizándolos, con el fin de vender la información a los anunciantes. Está previsto en sus "términos de uso", que cada cual debería haber leído al crear una cuenta. Rechazar el envío de esta información a terceros es posible, pero descubrir la página donde es posible hacerlo no es fácil (Es https://www.facebook.com/ads/preferences/). Según The Economist, Facebook podría perder el 80% de sus ingresos. Lo mismo podría ocurrir con las otras empresas antes señaladas.

El siguiente cuadro reseña qué datos recogen cuatro de las principales empresas de la web, los métodos utilizados y algunos usos. (Fuente: Baynote, junio 2013)


Debemos también recordar que todas las empresas pueden rastrear, analizar y usar múltiples datos personales que obtienen si nos registramos en sus sitios web o, incluso, sin que lo hagamos, con solo entrar en su sitio web. Los mismos navegadores ganan millones de dólares gracias al análisis que realizan de las costumbres de navegación de los usuarios. Todas las apps que descarguemos a nuestros móviles piden distintos permisos para utilizar determinados recursos del sistema “para funcionar correctamente”, pidiendo muchas veces leer y modificar listas de contactos, leer el registro de llamados, tomar fotos, etc. (Xataka, 3/04/2014).  ¡En internet, todo es público, a menos que usemos una red privada virtual (VPN) o la "red oscura"! Con lo ocurrido, quizás se logre que los usuarios se den cuenta del valor de sus datos personales y se preocupen más de protegerlos. Podría ser el fin de un modelo de negocio... y también de muchos servicios "gratuitos".

El mismo Tim Berners-Lee denunció estos procedimientos: «La publicidad dirigida permite que una campaña comunique cosas completamente diferentes, posiblemente contradictorias, a diferentes grupos. ¿Es eso democrático?». Y Eli Pariser dedicó su libro "El filtro burbuja" a denunciar que las pantallas ya no son un artefacto para facilitar nuestras comodidades, sino "un instrumento para dirigir nuestra vida hacia donde quieran los algoritmos de esas compañías. Ellos deciden lo que somos, lo que nos debe gustar, lo que leemos, lo que vemos, lo que compramos y lo que pensamos." (El Mundo, 5/6/2017).

Y no son los únicos "manipuladores". Los propios usuarios pueden transformarse en fuentes de noticias falsas y de trolls. Tanto las redes sociales como los medios de comunicación que tienen abiertos espacios para comentarios están viendo que es cada vez más habitual insultar y enviar mala onda a través de ellos. Existe un grupo importante de personas que, amparadas en el anonimato, sólo entran a la red para mostrar resentimiento y rabia. "Cuando estas personas exponen su odio en la red (ya sea contra personas, estados o corporaciones) y reciben el apoyo de sus pares mediante retuits, mensajes de apoyo o replicaciones virales se produce químicamente una sensación de logro y satisfacción muy intensa, pero al no ser tangible en la vida real, se vuelve algo frustrante y deprimente." (Art Markman, Universidad de Austin, Texas).

Por otra parte, las personas tienen tendencia a decir lo que piensan que queremos escuchar, y nos dirán cosas -para nosotros- más reconfortantes que la verdad. "El suero de verdad digital, en promedio, nos mostrará que el mundo es peor de lo que pensamos." (Seth Stephens-Davidowitz, en "Everybody Lies: What the Internet Can Tell Us About Who We Really Are"). También tenemos tendencia a buscar a quienes comparten nuestras propias opiniones y a descartar mensajes que discrepan. Las percepciones incorrectas preexistentes están relativamente blindadas a la información que las contradice. Así, nos alejamos de aquella información con la que no simpatizamos o que no coincide con nuestros puntos de vista y nos aislamos en esa burbuja cultural e ideológica, ya que solamente nos llegan contenidos ajustados a nuestras preferencias e intereses (Parisi, "El filtro burbuja").

¿Existe una salida?
Como señala la VeChain Foundation, "En la era del Big Data, [...] como interesados, los usuarios de los que recogen los datos rara vez obtienen su parte de los dividendos a pesar de las contribuciones significativas a la fortuna. El advenimiento de las infraestructuras blockchain allana el camino para un nuevo dominio de venta de datos, lo que permite a los propietarios de datos individuales beneficiarse directamente de compartir datos de su propiedad que son compatibles con los reguladores e inmutables." (Medium, 22/3/2018) Pero, como he explicado en posts anteriores, recién estamos empezando a caminar en esta dirección. "La realidad es que la mayoría de la gente no quiere tener sus propios servidores web o nodos de redes sociales", escribieron Chelsea Barabas, Neha Nerula y Ethan Zuckerman, tres investigadores del Media Lab del Instituto de Tecnología de Massachusetts, en Wired. Tampoco quieren adherir a una red social si no encuentran ahí a sus amigos, lo cual es la principal fuerza de Facebook. Aún así, el creciente interés en redes sociales descentralizadas como Mastodon muestra que aumenta el interés entre los usuarios de internet por algo diferente del modelo establecido por las compañías más grandes de Silicon Valley (Stuff). Puede ver también "7 social media powered by blockchain" en Hackernoon, 3/4/2018).