Buscador de Internet Capaz de Mirar el Futuro


Una herramienta de Yahoo Research analiza archivos de noticias a la búsqueda de significado—arrojando luz sobre acontecimientos del pasado, el presente e incluso el futuro.  


Mostrar las noticias sobre una línea del tiempo es algo que ya se ha intentado antes. Sin embargo Time Explorer, un prototipo de motor de búsqueda de noticias creado en el laboratorio de investigación de Yahoo en Barcelona, genera líneas del tiempo que se extienden hacia el futuro del mismo modo en que lo hacen hacia el pasado.

La página de resultados de Time Explorer está dominada por una línea del tiempo interactiva que ilustra cómo el volumen de artículos relacionado con un término de búsqueda en particular ha cambiado con el tiempo. Los artículos más relevantes aparecen en la línea del tiempo, mostrando cuándo se publicaron. Si el usuario mueve la línea del tiempo hacia el futuro, los artículos aparecen posicionados en cualquier momento en el tiempo al que el texto podría haberse referido.

Esto proporciona una nueva forma de descubrir artículos, y también una manera de verificar las predicciones del pasado. La línea del tiempo para el año 2010 se convierte en una forma de descubrir un artículo de opinión de 2004 que indicaba que a día de hoy, Corea del Norte habría construido unas 200 ojivas nucleares, o un artículo de 2007 que predecía con precisión la difícil toma de decisiones políticas que los Demócratas tendrían que llevar a cabo tras la expiración de los recortes fiscales de George Bush.

Con cada vez más frecuencia, las organizaciones de noticias buscan nuevas formas de presentar sus contenidos, incluso a través de formas mejoradas de búsqueda. Un estudio de investigación Pew en 2008 descubrió que el 83 por ciento de las personas en busca de noticias por Internet utiliza un motor de búsqueda para encontrarlas.

Time Explorer puede detectar tanto referencias absolutas a tiempos futuros, como por ejemplo "Noviembre de 2010", y trabajar desde la fecha de publicación de un artículo para averiguar tiempos relativos tales como "unas elecciones el próximo mes". También extrae los nombres, lugares y organizaciones mencionadas en los artículos. Estos se muestran en un recuadro a la derecha de los resultados. Se pueden utilizar para agregar una persona o entidad distinta a la línea del tiempo, y para afinar los resultados y crear combinaciones de personas o lugares determinados.


"Para las guerras o cualquier otro evento no sólo podemos observar las personas importantes, sino cuándo llegaron a serlo", afirma Michael Matthews, miembro del equipo de investigación de Yahoo. "La evolución de las noticias a través del tiempo no es algo que se pueda hacer muy fácilmente con las herramientas que ya existen en la actualidad".

Time Explorer fue construido utilizando una colección de 1,8 millones de artículos publicados por el New York Times desde 1987 hasta 2007 para estimular la investigación hacia nuevas maneras de explorar la cobertura de noticias. Time Explorer se presentó, junto con otras ideas para utilizar el mismo conjunto de datos, en una sesión del taller sobre Interacción Humano-Ordenador y Recuperación de Información (HCIR) en New Brunswick, Nueva Jersey, el fin de semana. Time Explorer ganó la mayoría de los votos de los asistentes a la hora de juzgar el mejor uso de los artículos del Times.

Otras herramientas presentadas en HCIR trataron de evaluar la autoridad de las personas citadas en un artículo, determinar frases relacionadas con un término de búsqueda, y crear rápidamente una página resumiendo las últimas noticias sobre un tema en particular, por ejemplo una celebridad o un país.

"Para la mayoría de los motores de búsqueda de noticias, el hecho de que dichas noticias sean recientes es un factor importante para determinar su relevancia", afirma Daniel Tunkelang, líder de tecnología en la oficina de Nueva York de Google y presidente de la sesión de desafío. "Time Explorer ofrece una perspectiva exploratoria a la dimensión del tiempo, permitiendo a los usuarios observar la evolución de un tema a través de él".

"La elegante visualización permite a los usuarios descubrir relaciones inesperadas entre entidades en determinados puntos en el tiempo—por ejemplo, entre Slobodan Milosevic y Saddam Hussein", afirma Tunkelang. Al definir una mejor una búsqueda del término "Yugoslavia" con los dos dirigentes, descubrimos cómo, en un principio, Hussein aparece como punto de comparación en la cobertura del líder serbio, aunque más tarde los dos líderes estuvieron directamente involucrados, con artículos que hablan de negocios de armas entre ellos.

Aunque Time Explorer actualmente sólo funciona con noticias antiguas, también podría ser utilizado para explorar nuevas coberturas, y para ponerlas en su contexto, afirma Matthews. "Sería difícil actualizarlas en tiempo real, aunque sin duda se podría hacer a diario, y creo que seguramente sería útil".

Afirma que el mejor uso del servicio sería en forma de herramienta que funcionase a partir de los temas relacionados con una noticia reciente. A una persona que leyese un informe de noticias sobre, por ejemplo, Medicaid, podría serle útil ver el historial de cobertura sobre el tema, así como las predicciones hechas sobre su futuro, afirma Matthews. "Es como una característica de artículos relacionados, aunque centrada en el futuro". Él y sus colegas están trabajando para añadir más fuentes de noticias actualizadas, así como el contenido de blogs y otros sitios al rango de Time Explorer.

El Times ha digitalizado su contenido y ha hecho que pueda ser consultado hasta el año 1851, aunque las tecnologías de búsqueda y las interfaces actuales no están a la altura de la tarea de hacer que estas grandes colecciones sean explorables, asegura Evan Sandhaus, miembro de los Laboratorios de Desarrollo e Investigación del New York Times, y que supervisó la publicación del archivo de artículos a finales de 2008.

"Podemos decir, 'Muéstrame todos los artículos sobre Barack Obama', pero no tenemos una base de datos que nos pueda decir cuándo nació, ni cuántos libros ha escrito," afirma Sandhaus, quien agrega que las herramientas desarrolladas para procesar el significado de los artículos de prensa podrían tener usos más amplios. "Ese recurso no sólo ayudará a que la comunidad de investigación genere un cambio en nuestra compañía, sino en cualquier empresa con problemas de gestión de datos a gran escala".

Dado que la mayoría de las organizaciones gestionan millones de documentos de texto, desde correos electrónicos a informes, un tipo de herramientas más inteligentes para gestionarlos probablemente serían populares, afirma Matthews. "En teoría, los algoritmos subyacentes deberían funcionar con cualquier cosa, tal vez haciéndoles unos cuantos ajustes".

Fuente |  Technology Review

0 comentarios: