¿Qué son y para qué sirven los metadatos?

Producto de la gran cantidad información y recursos que existen en Internet, se hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y clasificar los recursos presentes en la World Wide Web, esto para facilitar la posterior búsqueda y recuperación de la información. Este mecanismo los constituyen los llamados metadatos.

Según Howe (1993), el término fue acuñado por Jack Myers en la década de los 60 para describir conjuntos de datos. La primera acepción que se le dio, fue la de dato sobre el dato, ya que proporcionaban la información mínima necesaria para identificar un recurso. En este mismo trabajo se afirma que puede incluir información descriptiva sobre el contexto, calidad y condición o características del dato. El término no ha evolucionado en gran medida, pero sí lo han hecho los conceptos asociados a él, las aplicaciones y el nivel de uso de los metadatos[1].

Según la definición, un metadato es “toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso, dato u objeto que tiene la finalidad de facilitar su recuperación, autentificación, evaluación, preservación y/o interoperabilidad”[2]. La generación de Metadatos también debe aplicarse a cualquier conjunto de datos independientemente del soporte en el cual se encuentren, ya que ello puede facilitar su localización, y así, agregarle un valor añadido a la información histórica con la que cuenta una entidad.

Los metadatos, consisten en información que caracteriza datos, describen el contenido, calidad, condiciones, historia, disponibilidad y otras características de los datos. En el ámbito bibliotecario por ejemplo: el catalogo de una biblioteca o una ficha bibliográfica son metadatos. Para la creación de estos metadatos se usan reglas de catalogación y formatos. Pero los metadatos son también, la información generada por los usuarios cuando usan tecnologías digitales, por ejemplo, en el caso de un email o una llamada, son metadatos el horario, la fecha en que se envió y la localización desde donde se conectó el usuario la última vez, entre otros.

Entre las principales características que podemos destacar de los metadatos se encuentran las siguientes[3]:

  • Son paquetes de información altamente estructurados que describen contenido, calidad y características de los datos del sitio web.
  • Son precisos y en muchos casos cortos e integrados por palabras simples.
  • Proporcionan puntos de acceso a la información del sitio web.
  • Codifican la descripción del sitio web.

 Las funciones principales de un metadato son[4]:

  • Búsqueda: los metadatos deben proporcionar suficiente información, bien para descubrir si existen datos de interés dentro de la colección de datos disponibles, o simplemente, para saber que existen.
  • Recuperación: los metadatos deben proporcionar información a los usuarios para que puedan adquirir la información que sea de su interés. La analogía con una biblioteca consistiría en el procedimiento a seguir para sacar un libro. El componente que recupera los datos desde el metadato puede ser tan simple como proporcionar un URL que identifique la localización de un conjunto de datos digitales, o tan complejo como para cubrir cuestiones de seguridad o realizar una transacción financiera para poder acceder a la información, como compra en línea. En este sentido, también se considera la “función recuperación” a aquella información que describe cómo localizar fuera de línea los datos, la persona de contacto, los formatos de distribución de los datos o cualquier restricción de acceso a los datos, así como la información sobre los costes.
  • Transferencia: los metadatos deben facilitar la información necesaria para que los usuarios hagan uso de los archivos recuperados en sus máquinas. Este componente incluiría información sobre el tamaño del conjunto de datos, y sus metadatos, la estructura tanto lógica como física de los datos y metadatos.
  • Evaluación: los metadatos deben considerar información que asista a los usuarios a determinar si los datos van a ser útiles para una aplicación.
  • Archivo y conservación: los metadatos son una pieza clave para garantizar que los recursos de información se documenten, se definan sus responsables y continúen siendo accesibles en el futuro (NISO, 2004).
  • Interoperabilidad: los metadatos facilitan la interoperabilidad, puesto que se han definido estándares de metadatos y existen protocolos compartidos para el intercambio de esta información. Protocolos como el Z39.50 o el CSW han ayudado en búsquedas simultáneas de datos en sistemas distribuidos.

Ya en la vida cotidiana, los metadatos revelan patrones, relaciones y comportamientos. Su conocimiento o desvelar dicha información, puede afectar nuestra privacidad, y muchas veces se puede saber más a través de los metadatos, que examinando el contenido de los mensajes que crearon un metadato, cosa que por otra parte es mucho más complicada e imposible cuando hay cantidades masivas de datos a analizar, sin una muestra específica o limitada. Los datos en el contexto de la web, se pueden guardar, intercambiar y/o procesar a través de las tecnologías como: computador, celular o tablets.

Los expertos dan una importancia creciente al acceso masivo a metadatos. Edward W. Felten, profesor de Ciencias de la Computación en Princeton, alertó sobre la existencia de sofisticadas herramientas informáticas que permiten almacenar y analizar amplios conjuntos de datos para identificar patrones de comportamiento, hábitos, relaciones y detalles personales[5].

Si nuestros datos son mal usados podrían emplearse para un fraude bancario, hasta conocer cada detalle de nuestra vida privada, los patrones de llamadas por ejemplo, pueden revelar cuándo estamos despiertos o durmiendo, nuestra religión mediante llamadas durante navidad o no hacerlo el día de descanso judío, nuestros hábitos de trabajo y nuestras aptitudes sociales, el número de amigos que tenemos o incluso nuestras afinidades civiles y políticas. Los metadatos, por lo tanto, son una herramienta muy poderosa para la gestión de la información dentro de un programa de gobierno de datos. Dentro de la práctica de gobierno de datos, interpretar el contexto del contenido de los datos es esencial para administrarlos de la mejor manera y los metadatos son la llave para hacerlo.

Referencias bibliográficas

[1]Introducción a los metadatos: estándares y aplicación. [En línea] [Fecha de consulta: 13 de Marzo de 2017]Disponible en: http://www.sedic.es/autoformacion/metadatos/tema1.htm

[2] Ibid.

[3] Cual es la importancia de los metadatos.[En línea] [Fecha de consulta: 13 de Marzo de 2017]Disponible en: http://culturacion.com/cual-es-la-importancia-de-los-metadatos/

[4] Qué son los metadatos. Geoidep.[En línea] [Fecha de consulta: 13 de Marzo de 2017]Disponible en: http://www.geoidep.gob.pe/metadatos/que-son-los-metadatos

[5] La importancia de los metadatos. El Mundo. [En línea] [Fecha de consulta: 13 de Marzo de 2017] Disponible en: http://www.elmundo.es/espana/2014/06/16/539dfdcaca474118648b457d.html