0
18/12/10 Post By: Ramón Pastrano, WebMaster

Google, una herramienta para encontrar lo que buscas en 500.000 millones de palabras. El Google Books Ngram Viewer abre una puerta a la investigación.


La base de datos de libros del buscador incluye más de cinco millones de volúmenes.
Google ha construido una colosal base de datos con unos 5.200.000 libros digitalizados, que están disponibles al público de forma gratuita. La biblioteca digital, que permite descargas y consultas, tiene una herramienta para que los usuarios puedan hacer búsquedas turbo, entre los 500.000 millones de palabras que contienen todos los ejemplares digitalizados. El Google Books Ngram Viewer abre una nueva puerta a la investigación.

El almacén digital, que incluye palabras, frases cortas y un resumen año por año de la frecuencia con que aparecen, es la primera vez que un conjunto de datos de esta magnitud están a disposición de doctoress , estudiantes de ESO y de cualquier persona que le guste pasar tiempo delante de un ordenador, según publica el 'New York Times' .
Son 500 mil millones las palabras contenidas en los libros publicados entre 1500 y 2008 en diomas Inglés, francés, español, alemán, chino y ruso. ¿Cómo investigar o buscar en esta monumental cantidad de datos.
El Google Books Ngram Viewer permite que cualquiera con un ordenador puede elaborar una cadena de hasta cinco palabras y ver una gráfica que revela la frase de uso a lo largo del tiempo - una distracción que puede convertirse rápidamente en adictiva. ¿Cómo funciona esta herramienta? Se escribe el término sobre el que se quiera saber en un rango establecido en años, el corpus, el factor de precisión, que se cifra en tres por defecto. Con estos datos puedes la evolución de búsqueda de determinada materia, personaje o tema a lo largo del tiempo.
Por ejemplo, con un clic se puede ver que "las mujeres", en comparación con los hombres "," rara vez se les menciona y solo aparece en la década de 1970, cuando el feminismo se afianza.

Las líneas se cruzan con el tiempo alrededor de 1986. Buscando los libros dedicados a Mickey Mouse y a Marilyn Monroe en el decursar del tiempo es posible saber gracias 'culturomics' que no están tan presente en el sector editorial como el exp presiente de EEUU, Jimmy Carter.

Es revelador que se encuentran muchas más referencias en Inglés que en chino cuando se busca "la Plaza de Tiananmen" a partir de 1989 .

El método para buscar tiene por objetivo que "un niño de 8 años de edad, pueda ver las tendencias culturales a lo largo de la historia, según aparece en los libros", dijo Erez Lieberman Aiden, de la 'Society of Fellows de Harvard' que investigó cómo las grandes bases de datos digitales pueden transformar la compresión de la lengua, la cultura y el flujo de ideas.

"Queríamos mostrar lo que se hace posible cuando se aplica el análisis de datos a las preguntas sobre humanidades", dijo Lieberman Aiden, cuya experiencia está en las matemáticas aplicadas y la genómica. Esto es posible gracias, al método "culturomics".

El conjunto de datos pueden ser descargados, y los usuarios pueden construir su propia herramienta de búsqueda. De esta forma se abre una nueva oportunidad para estudiar literatura, historia y otras artes sin tener que hacer grandes análisis cuantitativos.

Trabajaron con un conjunto de datos que incluyó el hebreo y se inició en 1800, los investigadores midieron la resistencia de la fama, y constataron que las referencias escritas a las celebridades se desvanecía dos veces más rápido en la mitad del siglo XX, como lo hicieron a principios del XIX .

"En el futuro cada uno será famoso durante 7,5 minutos", aseguran.

Copyright Reserved ¡Qué Noche! con Pastrano 2010.
Design by: Bingo | Blogger Templates by Blogger Template Place | supported by One-4-All