en software libre disponible en la web, su influencia en el desarrollo de servicios y la necesidad de interconexión e intercambio de información. Se analizan las técnicas para mejorar la interoperabilidad y la recuperación. Se describen las iniciativas de metadatos aplicadas a los gestores de contenidos (Dublin Core, RDF (Resource Description Framework) y Formato MARC) y su importancia para la formación de instituciones cooperantes para la integración de contenidos y la creación de una web semántica. Además, se describen los lenguajes de marcado como medio para estructurar la información y favorecer la interoperabilidad XML. Se concluye con la existencia actual de una conciencia generalizada sobre la adopción de estándares para la gestión de información web y el desarrollo de servicios característicos de la administración electrónica.
Hoy día existe toda una gama de aplicaciones de software libre orientadas a la gestión de contenidos, así como al manejo de información digital en web. Estas herramientas cada vez más han ido ganando terreno en el medio bibliotecario, ya que permiten de una manera flexible y económica manejar información referencial y contenidos digitales en texto completo. A continuación se presentan cuatros de estas herramientas, por sus bondades y características se han convertido en las preferidas por este sector. Greenstone, se presenta como la mejor opción por su versatilidad en el diseño orientado al usuario, cumple con la exigencia de formar una red cooperante entre instituciones interesadas en compartir su información. KOHA, es uno de los primeros sistema para automatizar bibliotecas con software de libre, distribución que permite modificar libremente el código fuente, es un programa individual para unidades de información, básicamente abarca al menos tres funciones: circulación, consulta y adquisiciones, su código ha estado en continuo movimiento, Openbiblio, es fácil de utilizar ofrece una interfaz intuitiva y de usabilidad en la administración del catálogo en línea, a igual que los demás se ofrecen en licencia GNU y DSpace es un sistema que permite dar acceso público a una colección digital que requiere una planificación previa para su instalación y está orientado a trabajar en colaboración con sus mismos pares.
Escenarios para el intercambio de información
Las tecnologías de la información han facilitado una variedad de herramientas para el manejo de contenido con acceso libre, permitiendo hacer uso de ellas a través de la web, en el cuál los usuarios interesados pueden instalar en sus respectivas organizaciones, un gestor de contenidos, que no es más que un conjunto de programas, apoyado usualmente por una base de datos y que consiste en una serie de rutinas en un servidor web, que permite la administración del sitio sobre el que pueden trabajar una o más personas, cada una de las cuales tiene una función determinada dentro del sitio web dinámico, se presentan con un diseño centrado en el usuario. El objetivo de estos gestores de contenidos es proveer las herramientas necesarias para administrar el ciclo de vida de los documentos y facilitar la creación o manejo de la información y a su vez la publicación y promoción de la misma, de una manera fácil como completar un formulario, en una sola base de datos para cumplir todas las funciones de administración del sitio web. Además agregan valor con múltiples formatos y en el mejor de los casos añaden metadatos a la estructura de la base de datos para facilitar la navegación y la recuperación de la información por diferentes campos cómo autor, título y materia. La diversidad de estas herramientas informáticas para las unidades de información desarrolladas en software libre disponibles en la web, cada una de ellas con iniciativa de colocar catálogos digitales en líneas de sus respectivas colecciones, hoy en día ya no basta con tener la información accesible para los usuarios de una unidad de información en particular en forma aislada, en el cuál el usuario debe de consultar más de un repositorio de información para satisfacer sus necesidades de información, es por ello que cada día se hace más necesario el uso de los metadatos y formatos estándares como MARC para compartir la información entre instituciones académicas de forma cooperante. Es por ello que se desarrolla este análisis de los cuatros software más reconocidos en la web, para dar a conocer la posibilidad que existe de intercambiar la información entre ellos, a través de los metadatos, formatos intercambiables y protocolos de comunicación como los son: OAI y Z39.50. Cuando se plantean soluciones tecnológicas para las unidades de información y es fácil perderse en el medio de la variedad, por desconocimiento de la herramienta o por la carencia de funciones de la misma. Cuando se hablan de sistemas integrados de gestión contenidos, como soluciones para automatizar las unidades de información y los procesos que involucran tanto los administrativos como los técnicos, debemos involucrar todos los niveles de las unidades, para garantizar el éxito de automatización y así poder crear redes cooperantes especializadas en áreas del conocimiento humano, ya que permitirá integrar en una comunidad científica-social y disminuir la llamada dependencia tecnológica, así como el aislamiento entre ellas. El intercambio y la recuperación de documentos a través de los sistemas de información, deberá limitarse a los agentes autorizados y definidos en las políticas y/o reglas aprobadas por un comité para la interoperabilidad de metadatos para la gestión de documentos con el objeto de facilitar el intercambio y la recuperación de documentos que regule el proceso. Además hacer uso de un mecanismo para localizar y documentar el acceso o modificaciones realizadas sobre los metadatos. Así mismo, los metadatos es una parte inseparable de la gestión de documentos, que tiene diversas funciones y objetivos, los metadatos se definen como datos que describen el contexto, contenido y estructura de los documentos. Los metadatos son información estructurada o semiestructurada que posibilita la creación, registro, clasificación, acceso, conservación y disposición de los documentos a lo largo del tiempo y dentro de un mismo dominio o entre dominios diferentes. Los dominios representan un área del discurso intelectual y de la actividad social o de la organización desarrollada por un grupo propio o limitado de individuos que comparten ciertos valores y conocimiento. Para el intercambio de información entre los diferentes programas para la gestión de documentos es necesaria la utilización de los metadatos que pueden usarse para identificar, autenticar y contextualizar tanto los documentos como los agentes, procesos y sistemas que los crean, gestionan, mantienen y utilizan. Esto permite mejorar la compresión, de los datos y de los procesos relacionados con el documento, es la información estructurada sobre la información distribuida, datos asociados a los objetos de información que proporciona un conocimiento más completo sobre dónde encontrar una información. Es por eso la importancia de estructurar la información con metadatos para facilitar la recuperación y cómo esta puede o no ser útil según sus características. La necesidad de proporcionar el acceso abierto o el intercambio de información lo facilita la localización de y recopilación de los metadatos, que permiten ajustarse al protocolo OAI-PMH (Open Archives Initiative-Protocol Metadata Harvesting). Este protocolo se vuelve de vital importancia tanto para los que son proveedores de datos como para los que desarrollan o proveen servicios de información a partir de los mismos, ya que permite construir servicios de búsqueda complejos por medio de los metadatos que se comparten a través del protocolo OAI-PMH. Así mismo, hay que considerar la normalización de las estructuras de la base datos de cada unidad de información, tomando en cuenta el incremento y desarrollo de los documentos digitales en la web, el estándar de Metadatos Dublin Core (DC-MI) se ha convertido en un simple pero eficaz conjunto de elementos que sirven para describir una amplia gama de recursos de Internet. Actualmente es la iniciativa de catalogación más extendida en el mundo electrónico, al tiempo que es considerada un estándar internacional (ISO-15836-2003). La norma DC promueve dos niveles de codificación: simple y cualificado. El Dublin Core simple comprende quince elementos; el Dublin Core cualificado implica el mismo número de elementos más un subgrupo de éstos denominados cualificadores, que refinan la semántica de los quince elementos a fin de recuperar y localizar de mejor modo los recursos en Internet. RDF, (Resource Description Framework), es un conjunto de especificaciones técnicas para la normalización de los metadatos en XML, podemos decir que RDF proporciona una herramienta genérica para la creación, gestión y búsqueda de datos inteligibles por máquinas en la web. Transforma la web en un repositorio de información procesable por máquinas, las ventajas esenciales es facilitar la interoperabilidad en los metadatos, proporciona una semántica para la creación de metadatos inteligibles por máquinas, ofrece mayor precisión en la recuperación de recursos que las búsquedas a texto completo. El objetivo fundamental del RDF se centra en establecer un mecanismo que permita describir recursos que tengan como principios trabajar en multiplataforma y la interoperatividad de los datos. El mecanismo utilizado para ello debe ser neutral con respecto al área de aplicación y, al mismo tiempo, lo suficientemente flexible como para describir cualquier tipo de información. Mientras que el lenguaje XML sirve para la sintaxis del RDF importa para la semántica, porque ofrece de manera clara una serie de reglas para proveer información descriptiva. RDF integra una gran variedad de aplicaciones, como pueden ser catálogos de bibliotecas, directorios web, colecciones particulares de música, fotos, eventos, etc. Se puede usar XML como una sintaxis de intercambio. Las recomendaciones RDF ofrecen una estructura muy potente para soportar el intercambio de conocimiento en la Web. RDF ha supuesto uno de los mayores avances en la web. Para el intercambio de información bibliográfica entendible por el computador, el formato MARC (Catalogación Legible por Máquina), está diseñado para codificar los datos del registro y cada uno de los elementos de la ficha catalográfica tiene asignado un identificador numérico de tres cifras. Dentro de cada campo cuenta con indicadores que especifican su contenido, códigos de subcampo que identifican un elemento concreto del campo y delimitadores que señalan la localización del campo dentro del registro. Para el manejo y la interconexión de la información entre las diferentes bases de datos, hay que utilizar un lenguaje de marca para estructurar el conocimiento en distintos tipos de documentos, además se pueden desarrollar para los distintos tipos de información de la web, XML (eXtensible Markup Language – Lenguaje de Marcas eXtensible) soporta las herramientas de control terminológico, es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más grande y con unas posibilidades mayores. Tiene un papel muy importante en la actualidad, ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil, no ha nacido sólo para su aplicación en la web, sino que se propone como un estándar para el intercambio de información estructurada entre diferentes plataformas. Greenstone: Es un conjunto de programas y aplicaciones de software especialmente diseñados para la creación y difusión de colecciones y documentos digitales, el cual le ofrece una nueva forma de organizar la información y publicarla en Internet. Esta herramienta ha sido elaborad como parte del proyecto de Biblioteca Digital de Nueva Zelanda de la Universidad de Waikato y actualmente es desarrollado y distribuido en colaboración con la UNESCO y la ONG Human Info. Es un software de código abierto disponible en http://greenstone.org bajo los términos y condiciones de la Licencia Pública General de GNU. KOHA: Se desarrolló en Nueva Zelanda a igual que la anterior en el año 1999 por Horowhenua Library Trust y Katipo Communications Ltd. Esta herramienta propone resolver las necesidades de las unidades de información, varias bibliotecas del mundo lo han probado con resultados favorables y prometedores. Tiene el potencial de convertirse en un sistema universal, siempre y cuando se despierte un interés serio por parte del gremio bibliotecario por utilizar aplicaciones de fuente abierta. La firma que comenzó el proyecto no quiso asumir los costos futuros del desarrollo o manejar la ayuda técnica. Desde entonces, la biblioteca del ILS Horowhenua y la biblioteca pública de Nelsonville continuaron su uso porque podían desarrollar y modificar los campos, añadir nuevos módulos según sus necesidades y las características y requisitos particulares de su institución. Así se demostró que un proyecto de fuerte abierta, de estas características, prosperará en la comunidad, si las bibliotecas destinan sus recursos humanos a su desarrollo sustentable. Openbiblio: Se ha desarrollado constantemente desde el año 2002 por ser el código fuente abierto de uso más fácil, más intuitivo entre los SIGB disponibles en el mercado libre. Como algunas de sus contrapartes de código fuente abierto, emplea plantillas del CSS y de PHP para asistir la gerencia del contenido por parte de los bibliotecarios más inexpertos a cargo de mantenimiento de la red. Aunque ninguna biblioteca grande ha expresado interés por su adopción, el número de creadores activos ha crecido y su funcionalidad ha mejorado proporcionalmente. El blanco de su audiencia se centra más bien en colecciones privadas o personales, clubes, iglesias, escuelas o bibliotecas públicas, tiene el potencial de ser universal. Desafortunadamente, el módulo de la circulación puede manejar sólo los códigos postales de los Estados Unidos; su internacionalización se realiza por medio de plantillas multilingües. Opensiblio funciona bajo Linux o Windows, cualquier Web Server, PHP, y MySQL. Actualmente de un catálogo completamente desarrollado, el módulo de circulación y la catalogación con ayuda de USMARC. DSpace: Es un software de código abierto diseñado por el Massachusetts Institute of Technology (MIT) y los laboratorios de HP para gestionar repositorios de ficheros (textuales, audio, vídeo, etc.), facilitando su depósito, organizándolos en comunidades, asignándoles metadatos y permitiendo su difusión a recolectores o agregadores. Estas características han hecho que, sea uno de los programas preferidos por las instituciones académicas para gestionar el repositorio dónde los investigadores depositan sus publicaciones y materiales de búsqueda con objeto de darles una mayor visibilidad.
El análisis realizado sobre las herramientas en software libre utilizadas para crear colecciones digitales se realizó según indicadores como: tipo de licencia, software abierto, base de datos, lenguaje de programación, lenguaje de marcado, sistema operativo, metadatos, formato de documento, protocolo, servidor web y compatibilidad entre ellos. El total de las herramientas presentan licencia pública general, que están desarrollada para la distribución sin fines de lucros, es decir, que podemos bajar la aplicación de la web sin costo alguno. Además son código abierto (open source) es un término que se aplica a los programas cuyo código fuente está disponible al público, esto lo relaciona con software libre, ya que los programas de código abierto son apropiados de que cualquier programador pueda mejorar, corregir, ampliar o adaptarlos para sus necesidades o los de una comunidad determinada. En referencia al manejo y utilización de base de datos, podemos observar que cada aplicación tiene un manejador diferente, sin embargo no quita posibilidad de compatibilidad entre ellas, ya que por medio de la estructura, protocolos y los metadatos se puede hacer el intercambio de información en entre ellas. El lenguaje de programación no es relevante para el intercambio de información, pero si importante Greenstone esta desarrollado en C++ y Perl, KOHA en Perl, PHP y utiliza hoja de estilo CCS para la programación de sus salidas, a igual que XHTML, Openbiblio se apoya en PHP y DSpace en java 1.4 y XHTML. Una coincidencia en tres de los gestores de documentos es la forma de procesar documentos, todas permiten asignar metadatos según estándares ampliamente distribuidos, como Dublin Core, aunque también brindan la posibilidad de que los especialistas declaren otros, si así lo necesitan o lo desean. De la misma manera trabajan con XML o alguna de su variante, como es el caso XMLUI de DSpace, que ofrece un vocabulario controlado que ayuda en la indización, además de la libertad de escoger el más idóneo, según las necesidades institucionales. Cabe decir, también, que tanto Greenstone y DSpace, permiten crear colecciones de distintos tipos de documentos como son: texto, en varios formatos, imágenes, audio, etcétera. La recuperación de información en todos estos gestores se realiza mediante los índices, generalmente autor, título, materia y en el texto completo, así como por medio de la navegación en listas o por toda la colección, que pueden incluir la temática, autores, títulos u otros campos declarados por los creadores de la colección. Los sistemas que soportan estos gestores son muy parecidos, Linux, Windows y Unix son los sistemas operativos que todos pueden utilizar, o al menos uno de ellos, KOHA es el más completo de todos, ya que permite trabajar además de los anteriores también con MacOs y Solaris. Además de instalarse en servidores web como: IIS, PWS, Apache o Tomcat, como generalidad, con otras opciones disponibles. Una vez comparadas todas las herramientas, puede afirmarse que Greenstone y DSpace, son los que presentan la posibilidad inmediata sobre el intercambio y la interoperabilidad de software. Además, aunque ambas herramientas tienen una amplia comunidad de creadores alrededor del mundo. Otra ventaja de Greenstone es que emplea este software para la creación de colecciones digitales, y si otras instituciones lo utilizan, se garantiza continuidad y compatibilidad en el trabajo de otras unidades de información, entonces, Greenstone parece ser la opción de elección para crear colecciones interoperable. Greenstone es altamente interoperativo porque usa estándares contemporáneos, este incorpora un servidor que puede ofrecer servicios a cualquier colección sobre el protocolo OAI-PMH, y puede recolectar los documentos sobre este protocolo e incluirlos en la colección, cualquier colección puede ser exportada a METS y pueden introducirse documentos en el formato METS. Las colecciones pueden ser exportadas a DSpace y viceversa.
En conclusión podemos decir, que los desarrollos en software libre como gestores de documentos para las unidades de información están teniendo un grado de éxito importante en cuanto al cumplimiento de los objetivos de programar con estándares y tomar en cuenta la utilización de los metadatos para la recuperación de información a igual que la interoperabilidad entre sistemas. El mismo ha sido posible gracias al aporte de cada uno de los actores, por parte de los especialistas en información y desarrolladores de los gestores, en trabajar con normas internacionales cambiar ciertas pautas culturales, no cambiar otras y exigir al equipo de informáticos. Por parte del equipo de informáticos, poner esfuerzo e imaginación en uno de los mayores desafíos que existen en el área, que es el reemplazo de un sistema de contenido exitoso. No podemos dejar de mencionar que esto ha sido posible gracias al respaldo constante y exigencia de la comunidad científica en información en pro de obtener resultados, valorizar los servicios que brindan las unidades de información y tender a mejorarlos como línea de gestión política. En cuanto a los gestores de documentos, no podemos hablar de soluciones completas ni ideales, podemos decir que con el esfuerzo comprometido, con las mejoras aún pendientes, las soluciones implementadas tienden a ser los únicos.
Referencias citadas
1.- Open Archives Initiative – promueve estándares de interoperabilidad para la difusión y recuperación de publicaciones científicas en Internet. Facilita la comunicación de metadatos codificados en el formato Dublín Core, entre servidores proveedores y clientes recolectores.
2.- Z39.50 Es un protocolo de red que gestiona la interconexión de computadores para funciones de búsqueda y recuperación.
3.-Eito Brun, Ricardo. Normalización documental y colaboración electrónica: una visión retrospectiva. En Revista Española de Documentación Científica, 30(1)24-48, enero-marzo, 2007.
4.- Méndez Rodríguez, Eva María. Metadatos y tesauros: aplicación de XML/RDF a los sistemas de organización del conocimiento en Intranets, [en línea]. Disponible en: http://www.bib.uc3m.es/~mendez/publicaciones/fesabid00/fesabid002.pdf [Consulta: 20/08/2008].
5.- Silió, Teresa. Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System. En Profesional de la Información, 14(5):365-380, septiembre-octubre. 2005.
6.- Zurita Sánchez, Juan Manuel; Cervantes Cruz, Alicia y Miranda Quevedo, Pablo. Propuesta de normalización bibliográfica para la creación de metadatos basados en Dublin Core en los Repositorios Universitarios del proyecto 3R, [en línea]. Disponible en: http://eprints.rclis.org/archive/00011811/01/propuesta_metadatos_3R.pdf [Consulta: 19/08/2008]
7.- Martínez Usero, José Ángel. El uso de metadatos para mejorar la interoperabilidad del conocimiento en los servicios de administración electrónica. Profesional de la Información, 15(2):114-126, marzo-abril, 2006. [en línea]. Disponible en: http://eprints.ucm.es/5638/1/2006-metadatos.pdf [Consulta: 18/08/2008]
8.- Soria González, Inocencia. La organización de la información, los lenguajes documentales y la normalización. [en línea]. Disponible en: http://www.binal.ac.pa/archivos/catcoop/auts/orginfo.pdf [Consulta: 21/08/2008]
9.- Baeza Moreira, María Francisca. Interoperatividad y XML, [en línea]. Disponible en: http://www.gestionpublica.cl/biblioteca/documentos/67112INTEROPERATIVIDADYXML.pdf [Consulta: 20/08/2008]
10.- Witten, Ian H. y Boddie, Stefan. Biblioteca digital Greenstone: guía de instalación [en línea]. Disponible en: http://www.greenstone.org/manuals/gsdl2/es/html/Install_es_all.html [Consulta: 23/08/2008]
11.- Porcel Iturralde, María Laura y Rodríguez Mederos, Mabel. Software libre: una alternativa para las bibliotecas [en línea]. Disponible en: http://bvs.sld.cu/revistas/aci/vol13_6_05/aci090605.htm [Consulta: 16/08/2008]
12.- Rodríguez Mederos, Mabel. Software libre: una alternativa para las bibliotecas [en línea]. Disponible en: http://www.linuxmil.com.ar/modules.php?name=News&file=article&sid=20 [Consulta: 28/08/2008]
13.- Rodríguez-Gairín, Josep-Manuel y Sulé Duesa, Andreu. DSpace: un manual específico para gestores de la información y la documentación [en línea]. Disponible en: http://www2.ub.edu/bid/consulta_articulos.php?fichero=20rodri2.htm [Consulta: 25/08/2008]
14.- Witten, Ian H. y Boddie, Stefan. Biblioteca digital Greenstone guía del usuario, [en línea]. Disponible en: http://uisk.jinonice.cuni.cz/jedlickova/ikaros/docs/es/User-2.39-es.pdf [Consulta: 19/08/2008].
Autor: Jesús R. Yzquierdo H. – Lesly Cardozo F.
Compilado Por. Javier Mejía T.
Autor original y fuente del artículo

