En muchas bibliotecas, como por ejemplo la Biblioteca Nacional de España, podemos descargar conjuntos de datos en varios formatos.
En lo siguiente analizamos para qué sirve cada uno de estos formatos y como usarlos, especialmente los formatos MARC y LOD.
Objetivo
El objetivo principal de esta tarea es facilitar el mayor número de datos pertenecientes al corpus usado en un proyecto en el formato LOD.
Formatos de archivos
El tipo de salida se refiere al formato de exportación. Para los lectores se recomienda especialmente el formato etiquetado y el ISBD
- Etiquetado: Los registros seleccionados aparecerán con
visualización de etiquetas, es decir, dando nombre a los campos: autor,
título, edición, materia….
- MARC 21: el fichero que genera presenta los campos en
visualización MARC, es decir, con los campos: 001, 100, 245…. Cada campo
en un párrafo independiente, para favorecer su legibilidad.
- ISO 2709: convierte el registro al formato ISO 2709. Este
formato, codifica el registro de manera que los Sistemas de Gestión
Bibliotecaria (SIGB) pueden interpretarlo e integrarlo en su base de
datos. Es posible que los Sistemas de Gestión no reconozcan directamente
el formato 2709. Existen varios software que ayudan a convertir el ISO
2709 en un formato más compresible por los SIGB. Entre ellos, uno
gratuito se puede descargar en: https://marcedit.reeset.net/
- MARCXML: el formato MARCXML consiste en la codificación de un
registro MARC en XML (eXtensible Markup Language). Este formato permite
que diverso software de uso general y muchas páginas web puedan
importar, visualizar, etc. estos registros.
- ISBD: la norma ISBD (International Standard Bibliographic
Description) establece las reglas para la redacción normalizada de
registros bibliográficos, con el fin de que éstos sean legibles por
personas de diferentes países y lenguas, normalmente en el marco de un
catálogo de biblioteca o una bibliografía. Los datos del registro se
reparten en 8 áreas y están separados por diversos signos
ortográficos. Tras el envío por correo electrónico de uno o varios
registros en formato ISBD, se recibe éstos en código HTML.
MARC
MARC (del inglés:
MAchine-Readable Cataloging), es un estándar digital internacional de descripción de información bibliográfica desarrollado por la
Biblioteca del Congreso de Estados Unidos durante la década de 1960 para facilitar la creación y diseminación de catalogación
computarizada de una biblioteca a otra dentro del mismo país o entre
varios países. En 1971, el formato MARC se convirtió en el estándar
nacional para la diseminación de información bibliográfica; y en 1973,
en estándar internacional.
En el mundo hay en uso varias versiones de MARC, entre ellas: MARC 21
que es la más predominante, creada en 1999 como resultado de la
armonización de los formatos MARC de Estados Unidos y Canadá; y UNIMARC,
de uso amplio en Europa. Hoy día, en la familia de estándares MARC 21
existen formatos para registros de autoridades, registros de tenencia,
calendarios de clasificación e información comunitaria, además de los
formatos para los registros bibliográficos.
Bibliografía relacionada:
LOD
Linked Open Data define una visión de los datos vinculados y accesibles a nivel mundial en Internet según los estándares RDF de la web semántica. A menudo se piensa en LOD como una nube de datos virtual donde cualquier persona puede acceder a cualquier dato que esté autorizado a ver y también puede agregar a cualquier dato sin perturbar la fuente de datos original. Esto proporciona un entorno abierto donde los datos se pueden crear, conectar y consumir a escala de Internet. Una teoría básica de LOD es que los datos tienen más valor si se pueden conectar a otros datos. Los datos, en este contexto, son cualquier información estructurada basada en la web.
LOD se ha propuesto como base para el gobierno abierto y para resolver muchos de los problemas de integración de datos.
RDF
RDF es un modelo estándar para el intercambio de datos en la Web. RDF tiene características que facilitan la fusión de datos incluso si los esquemas subyacentes difieren, y apoya específicamente la evolución de los esquemas a lo largo del tiempo sin requerir que se modifiquen todos los consumidores de datos.
RDF extiende la estructura de enlace de la Web para usar URI para nombrar la relación entre las cosas, así como los dos extremos del enlace (esto generalmente se conoce como "triple"). Con este modelo simple, permite mezclar, exponer y compartir datos estructurados y semiestructurados en diferentes aplicaciones.
Esta estructura de enlace forma un gráfico dirigido y etiquetado, donde los bordes representan el enlace con nombre entre dos recursos, representado por los nodos del gráfico. Esta vista de gráfico es el modelo mental más fácil posible para RDF y se usa a menudo en explicaciones visuales fáciles de entender.
Conversión
MARC Edit es capaz de abrir los tipos de archivo que se
enumeran a continuación. Conversión entre los tipos de archivo que
figuran a continuación también es posible con la ayuda de MARC Edit.
Puede encontrar más información al respecto en el manual de la
aplicación.
Tipos de archivos asociados
Search/Retrieve via URL Response Format Data
Importante! Hay muchas aplicaciones dañinas, infectadas
por virus en Internet. Sólo descargar aplicaciones en su ordenador
desde fuentes confiables, verificados!