14 de noviembre de 2014

Big Data: ¿Qué hacen con ellos?


Las empresas de internet - como muchas otras - acumulan una cantidad enorme de informaciones, superior a lo que es posible humanamente conocer y manejar. Facebook, Google y otros realizan un seguimiento permanente de sus usuarios y acumulan estas informaciones. Incluso los medios de prensa pueden conocer los intereses de sus lectores. Son cantidades ingentes de datos, que conforman conjuntos gigantescos llamados por ello “big data”. Con los móviles y las redes sociales, las empresas conocen nuestras listas de amigos, nuestros gustos, donde hemos estado, y más.

¿Para qué?

Analizando o vendiendo estos datos, las empresas pueden obtener mayores beneficios gracias a la información que inocentemente les entregamos. 
Alex “Sandy” Pentland, un científico de los datos, afirma que la capacidad de recoger estos datos sobre nuestro comportamiento permitirá a los científicos desarrollar “una teoría causal de la estructura social” y, finalmente, establecer “una explicación matemática de por qué la sociedad reacciona como lo hace” en todo tipo de circunstancias...e incluso predecir comportamientos.

Se espera que el marketing predictivo personalizado utilizando los datos sociales sea una de las áreas de negocio que más se beneficiarán de la minería (análisis) de big data en los próximos años, a pesar de que el 71% de los directores de marketing de todo el mundo dicen que su organización no está preparada para hacer frente a esta explosión de datos en los próximos 3 a 5 años (Business Insider, 12/05/2014). Y es que analizar estas montañas de datos que modo que se obtenga información útil no es tarea fácil, como lo muestra el hecho de que los grandes "recopiladores" intenten recurrir a la inteligencia artificial.

La cantidad de aplicaciones y usos posibles no ha dejado indiferente la Comisión Europea. Ha pedido a los gobiernos nacionales que “abran los ojos ante la revolución del Big Data” y, además de establecer una serie de centros de supercomputación de excelencia y crear una incubadora de datos abiertos, ha propuesto realizar una cartografía de normas sobre datos, identificando las posibles lagunas y proponiendo nuevas reglas en lo referente a la “propiedad de los datos” y a la responsabilidad del suministro de los mismos (TICbeat, 5/07/2014).

Quiénes y cómo

Facebook, Twitter, LinkedIn y otros están comenzando a utilizar técnicas de inteligencia artificial para desarrollar su capacidad de aprendizaje “profundo” a partir de los datos que acumulan a través de sus redes, desde las conversaciones hasta el reconocimiento facial de las fotos y la actividad en los juegos. Así, tienen el potencial de ser mucho más personalizados. Y hacen emerger nuevos campos de marketing: la agrupación de audiencia (clustering), el marketing predictivo y el análisis de los sentimientos frente a las marcas. Facebook dispone para ello de un laboratorio de investigación dedicado a la inteligencia artificial (IA); Google adquirió DeepMind, una compañía que agrupa los mejores talentos en IA y crea algoritmos de análisis para el e-comercio; LinkedIn compró Bright, una compañía parecida, que desarrolla algoritmos de selección de trabajos; Pinterest adquirió VisualGraph, que reconoce imágenes. (Wired, 24/04/2014).

Greg DeMichillie, director de gestión de productos de Google en la “nube”, anunció que, en 2015, la empresa se centrará en el lanzamiento de herramientas y servicios que facilitarán las operaciones con grandes datos. Será “Google Cloud Dataflow”, un servicio gestionado de procesamiento de datos, diseñado para crear canales de datos que “ingieran, transformen y analicen los datos, tanto en lotes como en flujos transmitidos”. (ComputerWorld, 26/06/2014). Pero van más lejos: la totalidad de nuestra información genética podría almacenarse en la nube gracias a Google Genomics. Tan sólo el genoma de una persona puede alcanzar los 100 GB de información. Google ya ha logrado conseguir la información genética de 3.500 personas y la almacena en los servidores de la compañía. Almacenar el genoma cuesta USD $25 al año.(FayerWayer, 7/11/2014). [¿Quedará separado de los otros datos personales y más privado, o también será comercializado a terceros?]

Microsoft ha lanzado un servicio en la nube llamado Azure Machine Learning (AzureML), un sistema de aprendizaje Automático (ML) que permite analizar los big data para reconocer patrones y extraer valor. Ofrece una interfaz tipo web de arrastrar y soltar para colocar fácilmente las piezas del rompecabezas y extraer información  sobre la base de conjuntos de datos complejos. (Evenbrite.ca, 13/11/2014).

IBM está invirtiendo miles de millones de dólares en su división de investigación dedicada a lo que llaman "computación cognitiva", un término que la compañía utiliza para referirse a las técnicas de inteligencia artificial relacionadas con su supercomputador Watson. Los esfuerzos de investigación son de largo alcance, e incluyen el desarrollo de componentes electrónicos conocidos como chips de neurosinápticos, que tienen características modeladas en base al funcionamiento de los cerebros biológicos y son más eficientes en el procesamiento información sensorial. A pesar de ello, algunas empresas e investigadores que han estado probando sistemas Watson señalan haber tenido dificultades para adaptar la tecnología y hacer que funcione con sus conjuntos de datos. "No está despegando tan rápido como les gustaría", señaló el profesor de administración en la Escuela de Negocios de Copenhagen, Robert Austin, que ha estudiado la estrategia de IBM durante los últimos años. "Esta es una de esas áreas en las que hacer que una demostración se convierta en algo de valor empresarial real depende de detalles poco conocidos." (TechnologyReview.es, 7/11/2014)

Y es que la "inteligencia artificial", si bien tiene unos 50 años de historia, aún tiene muy poco de inteligente. Aunque los sistemas más avanzados utilizan métodos inspirados en la estructura del cerebro (como las redes neuronales artificiales, simuladas en supercomputadores, que facilitan el reconocimiento de patrones) o sus procedimientos (como el reconocimiento de secuencias de operaciones), estamos lejos de acercarnos a la capacidad del cerebro humano (con sus 100 billones de neuronas, 10E15 conexiones y 10E27 operaciones por segundo y por neurona).   [Se describen algunos procedimientos aquí]
Más vale no hacerse ilusiones acerca de sus avances. Empresas como Netflix pueden extraer tendencias y ofrecer contenidos cercanos a los intereses de sus clientes (como también pueden hacerlo los medios de prensa), pero no se requiere inteligencia artificial para ello: solo un buen sistema de clasificación y una aplicación estadística básica.
Puede ser útil pero ¿hasta que punto es "inteligente" ofrecer "más de lo mismo" con estos sistemas de marketing predictivo?

No hay comentarios:

Publicar un comentario

No se reciben comentarios.

Nota: solo los miembros de este blog pueden publicar comentarios.