El auge de la Ciencia de las Multitudes (Crowd Science)

Alexander S. Szalay es un reputado astrónomo, pero no ha mirado a través de un telescopio desde hace cerca de una década. En vez de eso, el profesor de física y astronomía de la Universidad Johns Hopkins aprendió a escribir código software, construir servidores y tejer una red de millones de imágenes telescópicas

Por el camino, gracias a su amistad con un importante ingeniero informático, ayudó a reinventar la forma en que se estudia la astronomía. Ha pasado de ser una ciencia solitario a una disciplina en la que compartir es la norma.

Una de las tareas más difíciles ha sido la de cambiar la actitud para facilitar las colaboraciones a gran escala. No todos los astrónomos se alegraron al dejar sus solitarias sesiones telescópicas. “Estar solo con el universo es una tarea muy dramática”, admite Mr. Szalay, quién estuvo años vendiendo la idea de publicar online las imágenes a sus colegas

Hoy, los datos astronómicos no se comparten solo con profesores. Los aficionados también están invitados a sumergirse en los datos a través de interfaces web amigables y una profesora de instituto de Holanda recientemente hizo un importante descubrimiento. Encontró una nube de gas que podría ayudar a comprender el ciclo de vida de los cuásares -centros brillantes de galaxias lejanas- tras pasarse parte de sus vacaciones de verano mirando objetos en la pantalla de su ordenador.

La Crowd Science (algo así como la Ciencia de la Multitud o de las Masas), como podría llamarse, está introduciéndose en otras disciplinas como la biología y está creciendo rápidamente en la oceanografía y otras ciencias ambientales. “El Crowdsourcing es una solución natural a muchos de los problemas que involucran muchos datos con los que se enfrentan los científicos”, dijo Hayim Hirsh, director de la División de Información y Sistemas Inteligentes de la National Science Foundation. Los hallazgos son ahora demasiado voluminosos y complejos para los métodos tradicionales, que consistían en el almacenamiento de números en hojas de cálculos para que una persona los leyese, dijo Edward Lazowska, informático y director del Instituto Lazowska de la Universidad de Washington. Así que los almacenes de datos accesibles a muchos investigadores están introduciéndose en muchos campos para poder manejar la gran cantidad de información.

Convencer a los científicos para que abracen la era de los grandes datos, sin embargo, requerirá un cambio en las estructuras de recompensación académica para dar crédito a artículos con un número de autores mayor que nunca en la historia y a científicos que se pasaron sus carreras analizando los números de otros.

“El cambio cultural lleva a compartir datos”, dijo Mr. Lazowska. “Y los astrónomos lideran el camino”.

Alexander Szalay. Ref: Chronicle

Alexander Szalay. Ref: Chronicle

Reinicio de la astronomía

La inusual carrera de Szalay comenzó con una etapa de estrella del rock. Mientras iba a la universidad en Hungría, tocaba la guitarra en el grupo Panta Rhei, que sacó dos discos y varios singles en los 70. “No diría que eramos ‘estrellas’, pero tuvimos una acogida bastante buena”, dijo modestamente. “Hicimos giras por Alemania, Polonia y Checoslovaquia”.

Su sonido era similar al nerd rock -muchos sintetizadores y ritmos rotos. Los sintetizadores eran caseros. “En la Hungría comunista no podías comprar nada -tenías que hacértelo tú”, dijo Szalay. La ganas de juguetear serían una clave de su carrera.

Dejó la banda para centrarse en su carrera académica tras obtener un post doctorado en la Universidad de California en Berkeley, realizando visitas solitarias a telescopios como muchos astrónomos hacían.

Acabó en la Johns Hopkins, donde ha estado la mayor parte de los últimos 23 años.

Luego en 1992 le llegó un proyecto que cambiaría su carrera. La Johns Hopkins se unió al Sloan Digital Sky Survey Project, un álbum de fotos del cielo.

Szaley aceptó liderar el diseño y la construcción del archivo, aunque no sabía casi nada de tecnología ni de almacenaje de datos. Sus intereses investigadores le llevaron a decidirse a dar el paso: esperaba comprender mejor el Big Bang observando la distribución de las galaxias en el universo.

“Necesitaba una gran cantidad de información que estuviese bien organizada para poder aplicarle herramientas estadísticas”, dijo. Aún así, fue una tarea tan grande que prometió a sus colegas que dedicaría todo su tiempo al estudio del cielo y dejó de lado sus viajes a observatorios. “Pensé, vale, esto va a durar de seis a ocho años, puedo soportarlo”, dijo. “Terminaron siendo 18 años”.

Una guía geek

Un par de años después de que Szalay se uniese al proyecto, un compañero le presentó a Jim Gray, quien también era una especie de estrella del rock -en el mundo de la informática. Wired escribió una vez que su trabajo había hecho posibles los cajeros automáticos, los billetes electrónicos y otras maravillas de la vida moderna.

Cuando Szalay lo conoció, Gray era un trabajador de investigación de Microsoft y estaba buscando ingentes cantidades de datos para llenar las bases de datos que estaba diseñando.

Los dos hombres entablaron amistad rápidamente y decidieron que tenían mucho que aprender el uno del otro.

“Así que le enseñé astronomía y la verdad es que se convirtió en un muy buen astrónomo -llegó a ser un miembro distinguido de la comunidad”, dijo Szalay.

Y Gray le enseñó informática al astrónomo. Szalay ha publicado ahora tantos artículos sobre su trabajo en bases de datos que también está asociado al departamento de informática de Hopkins.

A pesar de todo, aunque el estudio progresaba, muchos astrónomos tradicionales seguían siendo escépticos.

“>La comunidad astronómica no creía que íbamos a publicar estos datos”, dijo Szalay. Lo que se solía hace a mediados de los 90 era guardar los datos porque era muy difícil conseguir horas en el telescopio y los investigadores no querían que les quitasen la exclusiva de los análisis que estaban desarrollando.

Una anécdota demuestra los ánimos de aquella época. Un joven astrónomo vio unos datos en una revista publicada y quería volver a analizarlos, así que pidió los números a sus compañeros. El investigador que había publicado el artículo se negó, así que el joven tomó el gráfico, supuso los datos y publicó su propio análisis. El investigador original se enfadó tanto que llamó a la segunda revista para que anulasen el artículo del joven.

Szalay dijo que los astrónomos cambiaron de opinión cuando vieron que la gran cantidad de datos se publicó en la web, comenzando con imágenes de la NASA y siguiendo por la publicación oficial de los primeros resultados de Sloan en 2000.

“Cuando se publicaron los primeros datos y también se vio lo fácil que era utilizarlos, creo que comenzaron a cambiar su parecer”, dijo.

Y Szalay y Gore dieron conferencias en muchos congresos presentando una lista de 20 preguntas que sólo podían ser respondidas utilizando una gran cantidad de datos compartidos para intentar ganarse el apoyo de sus compañeros. Sentían que estaban tras algo que llegaría mucho más lejos que la astronomía.

Nos dimos cuenta de que esta es una nueva manera de hacer ciencia”, dijo Szalay. “Los ordenadores son un nuevo tipo de instrumento”.

Perdido en el mar

En una tragedia de 2007 acabó su unión, Gray salió de San Francisco en un viaje en solitario en su lancha de 12 metros de eslora y no volvió.

Sus amigos en la informática y la astronomía rápidamente movilizaron lo que se ha convertido en un esfuerzo legendario, elevando por el camino sus ideas sobre crowdsourcing a un nuevo nivel.

Los científicos, junto con los líderes de la industria tecnológico que habían tenido como mentor a Gray se ofrecieron para ayudar a la Guardia Costera en la búsqueda en mar abierto utilizando cualquier tecnología que pudiesen imaginar. Los ejecutivos de Google y otros ayudaron a dar nuevas imágenes por satélite del área. Y un directivo de Amazon utilizó los servidores de la compañía para enviar esas imágenes a voluntarios -más de 12.000- que los analizaron en busca de alguna señal del investigador perdido.

Szalay y su hijo, Tamas, escribieron software que “limpiaría” las imágenes del satélite y dirigiese un análisis paralelo con investigadores voluntarios por email..

Algunas de las técnicas que el astrónomo aprendió en la búsqueda fue incorporado a la web que invita a categorizar las imágenes de la Sloan Digital Sky Survey.

Se llama Galaxy Zoo, y está dirigida por Chris Lintott, un astrónomo de Oxford.

Simplemente haz click en “clasificar galaxias” en la web y una imagen de un telescopio aparecerá, junto con varias preguntas como “¿es la galaxia picuda o redonda?”. Los visitantes se registran y leen un pequeño tutorial antes de que sus resultados sean tenidos en cuenta. Cada imagen se muestra a 10 personas como mínimo para intentar eliminar clasificaciones erróneas. Si el 80% de los encuestados está de acuerdo con la clasificación de una imagen, se tiene en cuenta. De otro modo, la imagen se hará pasar por todo el proceso de nuevo.

No se trata de un juego online en el que los científicos hacen el trabajo real”, dijo Lintott. “Espero que los visitantes aprendan que la ciencia no es sólo algo hecho por gente con batas en búnqueres bajo tierra. La ciencia es algo en lo que la gente puede participar”.

El número de voluntarios ha sorprendido a los organizadores. “El servidor se colapsó pocas horas después de que lo abriéramos”, en julio de 2007, dijo. Más de 270.000 personas se han apuntado para clasificar galaxias por el momento.

Uno de ellos es Hanny van Arkel, un profesor holandés, quien supo del portal a través de su guitarrista favorito, Brian May, del grupo Queen, quien escribió sobre el en su blog.

Tras visitar Galaxy Zoo durante un tiempo un verano, se encontró con una imagen con lo que describe como un “punto azul muy brillante”. “Leí el tutorial y no había nada como eso”, dijo, así que lo posteó en los foros. “Simplemente me preguntaba, ¿qué es esto?”.

La curiosidad tuvo su recompensa.

Los científicos ahora creen que el punto es una nube de gas inusual que podría explicar el ciclo de vida de los cuásares. El telescopio Hubble ha sido enfocado recientemente al objeto, ahora llamado “Hanny’s Voorwep”, la palabra holandesa para objeto.

Los astrónomos han publicado artículos sobre el descubrimiento, poniendo a Ms. van Arkel como coautora. “No me pidas que te lo explique, pero soy coautora”, dijo riéndose.

Ahora otras disciplinas se han acercado a Galaxy Zoo para averiguar cómo pueden utilizar ese enfoque.

Hanny van Arkel, astrónoma aficionada. Ref: Chronicle

Hanny van Arkel, astrónoma aficionada. Ref: Chronicle

Wikis genéticos

La astronomía es sólo una de las muchas disciplinas que están siendo modificadas por la explosión de datos. Los biocientíficos encontraron que la decodificación de un genoma al completo también significó un cambio cultural para su profesión. De nuevo, convencer a sus profesores para que se tomen el tiempo de compartir fue un nuevo reto.

Un caso especial es el de crear una hoja de ruta genética utilizando una plataforma wiki como la de la Wikipedia.

Comenzó con el nombre de GenMAPP, o Gen Map Annotator and Pathway Profiler. Las tasas de participación eran bajas al principio porque los investigadores tenían pocos incentivos a dar formato a sus datos y añadirlos al proyecto. Las decisiones sobre los puestos de enseñanza se basan en el número de artículos publicados, no en la cantidad de material valioso publicado online. “El sistema académico no está preparado para recompensar el hecho de compartir los datos”, dijo Alexander Pico, líder del grupo de bioinformática e ingeniero informático del Instituto Gladstone de Enfermedades Cardiovasculares.

En 2007, Pico, un desarrollador de GenMAPP, y sus compañeros añadieron un wiki fácil de editar al proyecto (haciendo que consumiese menos tiempo) y permitió a los investigadores que marcasen sus rutas como privadas hasta que hubiesen publicado sus hallazgos en revistas académicas. Desde entonces, la participación ha crecido como la espuma, en parte porque muchos investigadores -incluso algunas compañías farmacéuticas- se están dando cuenta de que la información genética es muy útil sólo si se acumula.

“Hay una especie de llamada en la comunidad biológica ahora mismo para que compartan información en formatos utilizables y de manera útil”, dijo Pico. Pero admite que algunos científicos en su campo siguen siendo escépticos de que compartir se convierta en la norma.

Otro flujo de datos se están encontrando en el Océano Pacífico, una serie de miles de sensores colgados de los cables de fibra óptica que están sumergidos en el mar, junto con sensores móviles que pueden enviar los datos, promete convertir la oceanografía en el próximo campo que abrace la revolución de los datos con un enfoque masivo.

Lazowska, el informático de la Universidad de Washington quien ahora se centra en la ciencia basada en datos, dice que en este momento la oceanografía es “exploratoria”, lo que quiere decir que los datos son difíciles de analizar porque sólo pocas organizaciones pueden permitirse el equipamiento para analizar las profundidades. Pero las nuevas tecnologías como los sensores móviles, prometen dar más datos que los que los científicos podrán gestionar sin una base de datos compartido, como la que Sloan hizo para la astronomía.

“En la oceanografía los investigadores individuales tienden a ser reyes o reinas -son los artículos individuales los que realmente muestran cómo se trabaja en el campo”, dijo John Orcutt, un profesor de geofísica de la Institución Scripps de Oceanografía de la Universidad de California en San Diego. “No han habido muchas investigaciones con grandes cantidades de datos en este campo, pero muchas presiones ahora están forzando el cambio y creo que nos movemos hacia una forma diferente de trabajar.”

Los principales problemas siguen sin estar resueltos. Mientras que los datos sigan creciendo a un ritmo más rápido que nunca, se necesitarán formas más eficientes de almacenar y procesar la información. Los algoritmos computacionales jugarán un interesante papel también, así que los científicos especializados en robótica pueden ayudar clasificando, quizá supervisados por voluntarios humanos.

Szalay pasa una gran parte de su tiempo intentando construir servidores más rápidos para poder manejar todos los datos de los telescopios.

Está involucrado en un nuevo proyecto, el Observatorio Nacional Virtual, que vinculará muchos telescopios y sus datos que han sido obtenidos en los últimos años.

Este artículo ha sido traducido de Chronicle y publicado bajo licencia CC by-sa

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: