31 de octubre de 2014

Análisis digital de imágenes y reconocimiento de objetos

Cuando vemos una fotografía o un cuadro, reconocemos con mucha facilidad sus componentes (como aquí un televisor, algunos gatos, unos libros, frutas). Pero es mucho más difícil lograr que un programa informático lo haga.

Hasta ahora se han multiplicado las aplicaciones de reconocimiento de caras, especialmente por el éxito de la fotografía con smartphones y las redes sociales. En este caso, los patrones de reconocimiento son bastante estables y se trata de un solo tipo de objeto (que funciona bien con vistas frontales pero no en otras posiciones; ver más abajo). Lograr una aplicación general, capaz de analizar cualquier fotografía e identificar cualquier objeto es mucho más difícil. Se recurre para ello a redes neuronales artificiales, las que se "aprenden" mediante repetición. Aunque el entrenamiento de una red neuronal es habitualmente producto de la intervención de "tutores" humanos que van señalando lo correcto o incorrecto hasta que el análisis logra la mayor eficiencia, los últimos trabajos relativos a la identificación de objetos en fotografías recurren a la "nube", donde existe una enorme cantidad de imágenes ya acompañadas de descripciones verbales. Así, se construye una gran base de datos de imágenes con su descripción y se ponen los computadores a repasarlas hasta lograr la tasa de reconocimiento automático esperada.

Entre los laboratorios de informática que abordan este problema está el de Google -como no- que ha desarrollado un sistema (GoogLeNet) que ganó el primer premio en el ImageNet large-scale visual recogniticion challenge (ILSVRC), un concurso organizado por expertos de las universidades de Stanford, Princeton y Columbia que se repite desde el año 2010. La Universidad de Toronto lo ganó en 2012 con su programa SuperVision, el que introdujo una nueva técnica llamada de "convolución profunda" en las redes neuronales, que revolucionó la "visión de máquina", acercándola por primera vez a la eficiencia de la visión humana. Este sistema recurre a múltiples capas de colecciones reducidas de neuronas que son enfocadas a distintas áreas de la imagen. Supervision tiene 650.000 neuronas agrupadas en 5 capas y afinan 60 millones de parámetros durante el proceso de entrenamiento. La simplificación por lo concursantes de este tipo de tecnología de entrenamiento ha sido fundamental y ha permitido duplicar en cuatro años la tasa de exactitud. Equipos de Adobe, la Universidad de Oxford y la Nacional de Singapur también concursaron y fueron premiados. Microsoft, por su parte, ha desarrollado el Project Adam, que pretende permitir a los usuarios identificar cualquier objeto haciendo una foto o incluso obtener información adicional como las calorias que contiene su cena. Para ello, pretende imitar el funcionamiento del cerebro humano con el fin de tratar de identificar un objeto en el menor tiempo posible. Todos compiten utilizando una misma base de datos (Imagenet) de 14 millones de imágenes encontradas en internet y previamente identificadas, dividas en 22.000 categorías diferentes. Google logró una tasa de error de 6,7%, mientras un observador humano entrenado obtiene una tasa de 1,7%. La diferencia se debe esencialmente a la dificultad -para la máquina- en reconocer imágenes alteradas por filtros, cosa que pocas veces impide el reconocimiento humano, mientras la máquina ya el gana al humano en ciertas definiciones de subcategorías (como las razas de perros, por ejemplo). (MIT Technology Review, 9/09/2014)

Identificación de personas 
Reconocer que algo es una cara o una persona, en una foto, es sencillo, pero la identificación de las personas es un problema diferente, especialmente debido a la enorma variedad genética (incluso ya presente en los neandertales), resultado de la presión evolutiva para que cada individuo sea fácilmente reconocible dentro de un grupo complejo y evitar así el caos social, como determinó un equipo de científicos, liderado por la Universidad de California en Berkeley (EE UU) que analizó los datos genéticos de poblaciones de África, Europa y Asia.
El profesor Domingo Mery, de la Escuela de Ingeniería de la Pontificia Universidad Católica (Chile), ganó la distinción al mejor trabajo presentado en una conferencia en Zurich sobre identificación por computador, pero identificación tomando en cuenta características "suaves". El profesor Mery explica que hay muy buenas herramientas para identificar rostros si la cámara los toma de frente, como en el pasaporte: eso es "biométrica dura". Así no es gracia reconocer. La biometría "suave" (soft biometrics) se fija en rasgos como edad, barba, maquillaje, género, anteojos, etnia, color de pelo, color de ojos, largo de los brazos y piernas, altura, peso, gestos, y más. Súper difícil de combinar tantos factores, pero de eso se trata.
El profesor Mery es tenaz; ganó su doctorado en Alemania porque ideó un programa de computador que identificaba, mediante una cámara de rayos X, fallas en las llantas de los autos. Después logró el reconocimiento de armas ocultas en los controles de aeropuertos, también con rayos X. Ahora investiga por un año sobre identificación de personas en los laboratorios de la Universidad de Notre Dame, en EE.UU. (El Mercurio, 15/09/2014).

24 de octubre de 2014

¿Controlarán la productividad de los empleados con los "wearables"?

Este año Chris Brauer de Goldsmiths, Universidad de Londres, pidió a los empleados en la agencia de medios Mindshare London usar uno de tres seguidores de actividad diferentes: una pulsera acelerómetro, un monitor de ondas cerebrales portátil o un entrenador de actividad física. Después de un mes, observó que la productividad había aumentado en un 8,5 por ciento y la satisfacción laboral en un 3,5 por ciento en general. El estudio de Brauer encontró que los dispositivos registran datos suficientes para realizar perfiles detallados de los empleados individuales: su estilo de vida, ejercicio y hábitos de sueño.
Muchas compañías - incluyendo BP, eBay y Buffer - ya alientan a sus empleados a usar trackers de actividad como el Fitbit, a menudo a cambio de descuentos en seguros de salud. Coca-Cola incluyó la app Shine, un monitor de sueño, en el programa de bienestar de sus empleados. En los almacenes de la cadena de supermercados británica Tesco, los trabajadores llevan brazaletes que hacen un seguimiento de adonde van, por lo que se los pueden enviar a tareas específicas según el lugar en que se encuentran. Varios bancos europeos, como también el Bank of America, hacen un seguimiento de sus empleados mediante insignias con sensores que captan la localización, la voz y los movimientos de su cuerpo.
Que una empresa se preocupe de la salud de sus emnpleados es favorable tanto para ellos como para ella. ¿Pero seguirlos a todas partes? ¿Verificar sus actividades y tomar decisisones en base a los datos recogidos?
Algunos tribunales estadounidenses ya han lidiado con estas preguntas, al menos cuando se trata de los herramientas de seguimiento más comunes como los trackers de GPS en equipos de la empresa. Varios estados, incluyendo California y Texas, tienen leyes que impiden el seguimiento de los equipos sin consentimiento expreso. Pero en la mayoría de los estados es legal para las empresas equipar a sus empleados con elementos vestibles, siempre y cuando tengan claro qué seguimiento se está realizando y por qué. (De Newscientist.com, 20/10/2014).

Noticias

* Un estudio de Thomson Reuters apunta que los casos de difamación en Redes Sociales aumentó un 300% en el último año y un 85% en medios de comunicación. También remarca el auge de las denuncias interpuestas por personajes conocidos ante situaciones de difamación en el último año (PRnoticias, 20/10/2014).

* Según Jeremy Rifkin, un teórico de la sociología y las ciencias económicas, la era digital está en condiciones de impulsar el sistema económico hacia una realidad nueva enmarcada en el "común colaborativo" (collaborative commons). Se trata, a su juicio, del primer cambio de paradigma económico que se produce desde el capitalismo y el socialismo a principios del siglo XIX. Lo apoya la canciller alemana, Angela Merkel, quien calificó de "extraordinariamente importante" el objetivo de lograr una regulación europea de protección de datos en internet que posibilite el comercio digital seguro y la oferta de productos en el espacio europeo. "Europa debe ser un espacio común digital. Si lo hacemos bien y utilizamos las oportunidades que nos brinda la digitalización, al final del proceso no tendremos menos puestos de trabajo, sino más", dijo.

17 de octubre de 2014

¿Ya no hay novedad en los videojuegos?

Son múltiples los géneros de videojuegos. Los más populares parecen ser los de acción (especialmente los de disparos o shooters, como Halo), los de estrategia (como Age of Empires), los de deportes (FIFA) y carreras (p.ej. Need for Speed) y los de simulación (como The Sims o Microsoft Flight Simulator). Los de aventura alcanzaron cierto nivel de popularidad en los años 80 y hasta mediados de los 90, aunque aparecieron algunos títulos en 2005 y, mezclando aventura y acción, títulos como los de la saga Assassin's Creed. Y no se pueden olvidar los juegos de rol (RPG), como el famoso Dungeons & Dragons y el MMORPG (Massive Multiplayer Online RPG) World of Warcraft.

Recientemente se estrenó Destiny, un juego que habría costado 500 millones de dólares (una parte importante de ellos en publicidad), la obra más cara de toda la historia. Una gráfica excelente, en un marco en que la gráfica ha mejorado constantemente gracias al poder creciente de los procesadores gráficos de los clientes y del software de los diseñadores. ¿Pero que hay de las rutinas de juego? Es aquí que surgen las críticas: "una cascada eterna de rutinas que se repiten dolorosamente" dice "El Mundo", que agrega que "lo ideal sería que la industria fuera capaz de volver a tratar de arriesgar con nuevas ideas e historias".

¿Cuáles son las novedades?

La modalidad más novedosa es la de los eSports, juegos en línea, para varios jugadores, que pueden pertenecer a alguna de las categorías ya citadas, pero aquí apuntan a ganar dinero. Tiene varios torneos importantes en los 5 continentes, como la WCG (World Cyber Games), CB (Clan Base), ED (Enemy Down) o la ESL (Electronic Sports League). Entre los juegos utilizados están, por ejemplo, diversas versiones de World of Warcraft, Battlefield, Call of Duty, Unreal Tournament, Halo, etc.

Los juegos más novedosos parecen ser los de realidad aumentada: una "realidad alternativa" acompañada de videos en YouTube, hangouts, contenido multimedia en web y hasta eventos que envolverían al público en el mundo real. Un ejemplo es el novedoso  Endgame, creado por James Fray (junto a una trilogía de novelas impresas). 

Microsoft parece haber captado el desafío: presentó un proyecto llamado RoomAlive, que pretende convertir nuestra habitación en una completa experiencia de juego en la que podamos interactuar de forma completa. Para ello, será necesario instalar una serie de proyectores en el techo de la habitación, que funcionarán de forma conjunta con seis Kinect y permitirán que los jugadores puedan moverse por la habitación y sentirse parte del juego. Las posibilidades son tales que incluso se podrá interactuar con los objetos del juego, pudiendo incluso disparar a las paredes y ver cómo se rompen.  Vídeo

10 de octubre de 2014

¿Puedo estar bien informado hoy con internet?

Cómo consultar múltiples fuentes
Es posible que, para muchos, leer un diario local en internet sea una buena manera de mantenerse informado. Pero no hay que olvidar que muchos canales de televisión y radios también tienen su página informativa en la web. En cuestiones de periodismo, ya no existen muchas distinciones entre los "medios tradicionales" que se plegaron a la red. ¿Pero que ocurre si mis intereses van mucho más allá de las noticias locales?
Personalmente, me interesa, por ejemplo, saber lo que ocurre con los medios de comunicación en todo Iberoamérica. Incluso escogiendo un solo medio por país, no es posible revisar diariamente los titulares de todos los diarios, por el tiempo que tomaría. ¿Que hacer? Hoy, lo más simple es escoger los medios que ofrecen una versión sindicada (RSS) y registrarlos en un lector adecuado. Aún así, la lista de titulares recibidos es larga y no es fácil detectar los artículos que pueden ser relevantes, a menos que el lector de RSS ofrezca la posibilidad de aplicar un filtro. Es el caso de G2Reader, que recomiendo por ello. Ahí, podemos ingresar (una vez por todas, pero siempre ajustable) las palabras claves que estimemos adecuadas y nos aparecen subrayadas (con un fondo de color) en la lista de títulos. Aún así, es difícil tener una visión de conjunto y, por esta razón, publico los resultados de mi búsqueda con G2Reader y con algunas suscripciones en Twitter en estos dos mismos medios: http://flip.it/oNTcJ y @recinet. (Hago este ejercicio desde hace varios años y pueden leer el resultado acumulado -y más comentarios sobre este tipo de investigación- en el capítulo 5 del e-libro Estudios sobre la Prensa Digital Iberoamericana.).

¡Que vivan las "plataformas"!
Solo he dado un ejemplo y es evidente que vale para muchos otros temas. Y no solo en el campo periodístico. También vale en materia de información científica. Los académicos e investigadores tienen cada vez mayores dificultades para mantenerse al día en su propio campo de estudio ante la profusión de publicaciones en la web. Si bien Google Academics puede ser una ayuda, no es un sistema muy adecuado para hacer un seguimiento permanente de una serie de publicaciones. Es cuando agradecemos a los inventores de algunas "plataformas" que se encargan de reunir y difundir los títulos nuevos de conjuntos de revistas de un mismo ámbito. Mi especial aprecio, aquí, por la "Plataforma Latina de Revistas de Comunicación" que, si bien no las reúne todas, hace un esfuerzo no despreciable. En materia científica en general, es interesante la Plataforma SINC pero solo sigue a investigadores españoles. Sería útil que este tipo de esfuerzo se amplíe y se multiplique. 

Reinventar el espacio de noticias para cautivar al usuario
En el encuentro Social Media Summit, realizado en Londres, a principios de la semana, se señaló que en los últimos 15 años, los medios de noticias tienen la tendencia a caer en ser “exactamente iguales” (Videos en Youtube). Pero se multiplican las voces que, como nosotros, reclaman una mejor "asociación" con los lectores y experiencias que desmuestran que, a los medios de prensa, les va mejor cuando se ajustan mejor a los equipos de los lectores (con páginas web que se ajustan, por ejemplo, al ancho de la pantalla, lo que se llama diseño "responsive"). Y aún más si ofrecen contenidos que se acercan los intereses de los lectores. Ante los problemas económicos que enfrentan (sobre todo los que han partido de sus versiones impresas), muchos han respondido con los llamados “muros de pago” (paywalls), es decir con el acceso pagado a parte o a la totalidad de su contenido. Pero es dudoso que el resultado sea positivo si el lector no se ve compensado por una experiencia realmente gratificante. Y es también dudoso que lo sea si no recibe loque desea en la forma más eficiente que la web puede ofrecer hoy. Si entro al sitio de Amazon, me identifica de inmediato, recuerda las compras y las búsquedas que he realizado en el pasado y me ofrece de inmediato productos que se inscriben en los intereses que ha deducido de estas informaciones conservadas en su base de datos. Hace años que opera de este modo. ¿Por que no lo hacen los diarios? Sin duda guardan sus noticias en bases de datos y las clasifican. También guardan información sobre sus lectores y suscriptores (especialmente si tienen muros de pago). ¡Es incomprensible que no ofrezcan aún a los lectores registrados noticias seleccionadas de acuerdo a sus intereses! ¡Hay un amplio espacio aquí para "reinventar el espacio de noticias" y cautivar así el lector! [En el I Congreso Internacional Latina de Comunicación Social, en 2009, hice una detallada ponencia sobre la construcción de este tipo de hiperinformativo.]

¿Cómo descartar rumores aunque se transformen en "trending topics"?
Emergent.info apunta más allá de otros sitios similares como Snopes.com, pues por ejemplo este último es un trabajo básicamente manual de ir verificando información con Google, mientras que Emergent.info utiliza algoritmos y bases de datos para rastrear cómo se va diseminando por la Internet una información de dudosa veracidad. Por ejemplo, su script va chequeando las historias en los distintos sitios web para ir revisando si modifican el texto, o cuenta cómo estas se van diseminando por los diversos ecosistemas de redes sociales como Facebook o Twitter.

Actualización:
Apareció  News Republic, un sindicador de noticias para smartphones, tabletas y wearables que permite elegir y concentrar todas las noticias en una única app, pudiendo personalizar los temas que aparecen en nuestra página de inicio e incluso elegir las noticias que queremos que nos muestre según nuestro estado de ánimo. Además, la app va aprendiendo poco a poco de nuestros gustos para adaptar los contenidos que nos muestra. (Video)

3 de octubre de 2014

¿Deben los periodistas aprender a programar?

Es indudable que los periodistas de hoy deben saber usar los nuevos medios que ofrece internet. Pero ésto no implica saber programar y menos aún que se deba enseñar a programar en las escuelas de periodismo.

Veo al periodista como un usuario, aunque especializado. Su misión no es crear medios, que es lo que implica la función de programar (a mi entender).

Aprendí a programar hace unos 40 años pero he pasado pocas veces más de 5 años usando el mismo lenguaje de programación. Los lenguajes de programación evolucionan rapidamente, y ésto ha sido particularmente notorio en el caso del HTML que, de ser muy simple y elemental en los años 90, ha llegado a la versión 5, que es sumamente compleja. Es muy bueno para los usuarios, que ganan con ello muchas facilidades de comunicación, pero ha ido alejando a los aficionados a crear páginas o servicios web. Al mismo tiempo los expertos han tenido el buen ojo de crear servicios que permiten a los aficionados generar estos mismo productos sin la necesidad de saber programar (Acabo de ver, por ejemplo, Enjoycss, un editor online para generar código CSS3 http://enjoycss.com/; otros, como Layoutit, ofrecen crear webs adaptables http://www.layoutit.com/). Creo que hay muchas interesantes alternativas para aprender y practicar, sin complicarse con la programación "dura" con un conocimiento que queda rápidamente desfasado. Muchos ingenieros en informática me han dicho que a los 5 años de egresados se han quedado obsoletos y deberían haber vuelto a estudiar para seguir en lo mismo (se están dedicando a otras funciones ingenieriles).

Así, la realidad es que NO se asegurará a ningún alumno que, aún aprendiendo cómo programar hoy -por ejemplo- una página web "responsive" o una app, le servirá de algo dentro de 4 o 5 años.

¿Que es lo más importante y debería ser sabido por todos los comunicadores?
ENTENDER muy bien los conceptos y mecanismos fundamentales: cómo operan las redes, qué es y cómo debe ser la interfaz de usuario ("user interface design"), qué es la interactividad y cómo se logra en forma eficiente, qué es el diseño "responsive", qué es el "tracking", las bases de datos, los big data, etc... ¡Hay temas más que suficientes (e indispensables) para llenar un primer curso mínimo! Después ,en otro semestre, se podría pasar al taller de producción de prototipos, con las herramientas que faciliten la creación sin "programación dura" a las que aludí antes. Y si se quieren formar especialistas en comunicación multimedial, se podrá pensar después en recursos más profesionales y en abordar problemas más compeljos como la seguridad digital. 
¡No olvidemos nunca que el avance de la computación es vertiginoso!

Un complemento que puede ser de interés:
12 predictions for the future of programming
(El n°4 trata de JavaScript, pero no todos están de acuerdo en que JavaScript sea importante: algunos expertos anuncian su abandono)

Vea también: La formación de e-comunicadores