El problema del archivo de datos a largo plazo: un caso real

Biblioteca Pública de Dublín, en Flickr (399634755) con licencia CC by-nc-saSi tienes un mínimo interés por la gestión documental, sabrás que los principales procesos que componen las prácticas de ECM son capturar, gestionar, almacenar, conservar y distribuir. De estos procesos, el de la conservación de la información es, en mi opinión, al que menos atención se presta actualmente, pues se suele considerar algo fácil de resolver. Los motivos por los que esta práctica cuenta con menor prioridad en la mente de muchos son variados: desde la constante reducción del precio del almacenamiento digital, hasta la equivocada idea de que conservar es igual a “mantener en un sitio seguro”. Conservar la información es mucho más que asegurarse de que tenemos suficientes cintas o discos y de que están bien guardados en un armario ignífugo: implica también, entre otras cosas, asegurarse de que podremos acceder a la información en el futuro. ¿Seguiremos teniendo repuestos para el lector de cintas magnéticas? ¿Con qué software se crearon los ficheros que guardamos hace quince años? ¿Quién recordará qué información era verdaderamente útil?

Pues bien, en el Centro Europeo para la Investigación Nuclear (CERN), se están enfrentando actualmente a varios de los típicos problemas de la conservación de la información digital. Resulta, según este artículo del Technology Review del MIT, que hay serios obstáculos para asegurar que la información producida por el LEP (el antecesor del ahora famoso LHC) hasta el año 2000, unos 10 Terabytes de datos, pueda ser reutilizada en el futuro. Los problemas son varios: algunas de las cintas magnéticas en que se guardaron los datos se han estropeado, hay que asegurar que el software necesario para leer los datos sigue estando disponible para usarlo en el futuro y, para colmo, aunque los datos en bruto sí se han guardado, muchos de los programas realizados ad hoc para su análisis se han ido borrando sistemáticamente a lo largo del tiempo. De momento, se cuenta con el conocimiento de aquellos que participaron en el proyecto para echar una mano y poner un poco de sentido en esos datos, pero ese conocimiento tiene la misma fecha de caducidad que los cerebros humanos en los que está contenido, lo que es muy poco para una información que debería ser considerada patrimonio de la Humanidad y que debería estar disponible durante siglos.

No pensemos que estos problemas sólo los sufren las grandes instituciones de investigación. Cualquier empresa medianamente grande lleva veinte años almacenando electrónicamente grandes cantidades de información que, cualquier día, puede resultar inaccesible porque no haya forma de leerla de su soporte o nadie sepa compilar la aplicación propietaria con la que se creó.

  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • BarraPunto
  • Meneame
  • Technorati
  • Wikio
  • Bitacoras.com
  • LinkedIn
  • MySpace
  • Twitter

This website uses IntenseDebate comments, but they are not currently loaded because either your browser doesn't support JavaScript, or they didn't load fast enough.

Un comentario a “El problema del archivo de datos a largo plazo: un caso real”

  1. Bitacoras.com dijo:

    Información Bitacoras.com…

    Valora en Bitacoras.com: Si tienes un mínimo interés por la gestión documental, sabrás que los principales procesos que componen las prácticas de ECM son capturar, gestionar, almacenar, conservar y distribuir. De estos procesos, el de la conservación…..

    12 de Diciembre de 2009 a las 08:35:18

Haga un comentario

cargando...
Sígueme en http://twitter.com

Últimos comentarios