Sobre datos abiertos

¿Qué es un repositorio de datos de investigación?

Un repositorio de datos de investigación es una biblioteca que, sobre una infraestructura institucional tecnológica, permite la preservación y el acceso libre-gratuito a través de Internet a los datos curados, generados durante las investigaciones en el ámbito académico.

Debe cumplir con los principios FAIR: que los datos se puedan encontrar (findable), sean accesibles (accesible), interoperables (interoperable) y reutilizables (reusable) por la comunidad.

¿Qué son los datos de investigación?

Los datos de investigación son la evidencia recolectada o generada durante el proceso de investigación, que fundamenta las afirmaciones de la investigación y sirve para validar los resultados. Los datos son de diversos tipos y se guardan en múltiples formatos: registros numéricos, textuales, imágenes, sonidos, entre otros. 

¿Qué son los datos abiertos?

Los datos abiertos son aquellos datos de investigación que se disponen en un repositorio digital de acceso libre y gratuito, luego de un proceso de curación.

¿Por qué es importante publicar los datos de investigación?
  • Promueve  el descubrimiento e impacto de la investigación a través de la cita de datos. 
  • Facilita la reutilización de los datos, promoviendo la optimización de los recursos  destinados a la investigación.
  • Fortalece la calidad e integridad de la ciencia, al compartir evidencias relacionadas con las publicaciones en revistas y conferencias.
  • Permite preservar y organizar los datos de investigación de forma segura y a largo plazo.
  • Posibilita compartir los datos, habilitando a que otros investigadores y la sociedad los utilicen para crear y producir nuevos conocimientos.
  • Favorece la adopción de buenas prácticas aceptadas por la comunidad científica internacional, en el marco de la ciencia abierta.
  • Impulsa el crecimiento económico y social a través de la investigación, innovación y desarrollo.
  • Ayuda a descubrir redes de colaboración y propicia la coautoría.
¿Por qué la UNR dispone de un repositorio de datos?

La Universidad Nacional de Rosario cuenta con un repositorio institucional para datos de investigación denominado Repositorio de Datos Académicos (RDA-UNR). Este repositorio multidisciplinar cumple con todos los principios necesarios para compartir conjuntos de datos, permitiendo además, que los autores sean debidamente reconocidos y citados. 

De este modo, la Universidad contribuye al Sistema Nacional de Repositorios Digitales Institucionales, permitiendo el cumplimiento de la Ley 26.899, que establece depositar en repositorios los conjuntos de datos generados durante los proyectos de investigación financiados con fondos públicos.

Glosario
  • Anonimización: proceso para ocultar la información personal posibilitando la divulgación de los datos sin vulnerar los derechos a la protección de datos personales u organizaciones. Evita el riesgo que representa la obtención y tratamiento masivo de datos personales.
  • Citación de datos: al igual que otros tipos de publicaciones los datos deben ser citados para el debido reconocimiento de su autor/a productor/a original y para ayudar a otros usuarios a encontrar el recurso. Para promover esta buena práctica RDA-UNR provee una cita estandarizada a cada conjunto de datos.
  • Curadores: asesoran a los investigadores de las diversas áreas temáticas con el objetivo de agregar valor académico al set de datos, optimizando la organización, descripción de los mismos y la documentación del proceso de su producción (proveniencia). La curación de los datos, basada en los principios FAIR, potencia su visibilidad, comprensión y reutilización.
  • Dataset: es el conjunto de datos de una investigación, su documentación y descripción publicados en un repositorio de datos. Puede contener uno o múltiples archivos. En RDA-UNR, los datasets se publican dentro de un Dataverse.
  • Dataverse: software de código abierto desarrollado para depositar, preservar, citar, explorar y analizar datos de investigación. Facilita la disponibilidad de los datos y alienta su reutilización potenciando su visibilidad y el crédito académico. Además, un dataverse es una unidad de publicacion que reúne datasets. El modelo de organizacion de datos del Dataverse permite la ubicacion de dataverses dentro de otros dataverses
  • Dataverse en el RDA-UNR: el RDA-UNR esta implementado en el software Dataverse versión 5. Cada Facultad tiene su correspondiente dataverse dentro del cual pueden publicar los miembros de su comunidad. Aquellos equipos de investigación que cuenten con al menos cinco conjuntos de datos (datasets) publicados podrán acceder a su propio dataverse, su colección de datos dentro del dataverse de su Facultad.
  • Datos de investigación: datos generados o recolectados en el transcurso de una investigación, que permiten la validación de la misma y fundamentan un nuevo conocimiento. Pueden ser físicos o digitales, en bruto o analizados, de tipo cualitativo o cuantitativo. Los datos digitales pueden encontrarse en muchos formatos y pueden estar almacenados en soportes diversos.
  • Datos sensibles: toda información que pueda atentar contra los derechos al honor, la intimidad, a la protección de datos personales, y a la imagen de terceros (contemplados en el artículo 19 de la Constitución Nacional), ya sea a través del uso de imágenes y/o información sensible sobre terceros que requieren especial tratamiento (véase Anonimización). Resolución 753 – E/2016.
  • DOI (Digital Object Identifier): identificador global único. Constituye un enlace permanente en forma de código alfanumérico que se le asigna a un objeto digital, en este caso, al dataset publicado en RDA-UNR. El sistema DOI, a diferencia de lo que sucede con las URL de las páginas web, no cambia, lo que permite que los datos sean localizados aun cuando son reubicados.
  • Licencia de uso de los datos: RDA-UNR adopta como licencia Creative Commons Atribución 4.0 Internacional (CC BY 4.0). Las Licencias Creative Commons son instrumentos jurídicos, basados en la normativa de derecho de autor, que permiten a los creadores de una obra dar acceso público a la misma, bajo los términos y condiciones de su elección, de una manera simple y estandarizada.
    Se trata de herramientas que cuentan con un amplio reconocimiento en la comunidad científica internacional, repositorios y publicaciones de acceso abierto.
  • Metadatos: información descriptiva sobre los datos, su contexto, calidad, condición o características de un dato u objeto de información, que tiene la finalidad de facilitar su búsqueda, recuperación, identificación, autentificación, evaluación, preservación y/o interoperabilidad. Resolución 753 – E/2016.
  • Principios FAIR (Findable, Accessible, Interoperable, and Reusable): sigla en inglés que representa cuatro principios fundamentales que sirven de orientación para favorecer y maximizar el valor agregado de los datos de investigación y las publicaciones científicas contemporáneas, traducido al español estos cuatro principios son: 
    • Encontrable: los datos deben ser fácilmente encontrados tanto por humanos como por computadoras. Los metadatos legibles por máquina son esenciales para el descubrimiento automatizado de los conjuntos de datos.
    • Accesible: una vez que el usuario/a encuentra los datos requeridos necesita saber cómo puede acceder a los mismos, si requiere alguna autenticación o autorización.
    • Interoperable: por lo general, los datos deben integrarse con otros datos e interactuar con aplicaciones o flujos de trabajo para su análisis, almacenamiento y procesamiento.
    • Reutilizable: el objetivo final de FAIR es optimizar la reutilización de los datos, para ello, datos y metadatos deben estar bien descritos para que puedan replicarse y o combinarse en diferentes entornos.