Sobre datos abiertos – RDA-UNR Info

¿Qué es un repositorio de datos de investigación?
¿Qué son los datos de investigación?
¿Qué son los datos abiertos?
¿Qué son los identificadores persistentes?
¿Por qué es importante publicar los datos de investigación?
¿Por qué es importante citar datos de investigación?
¿Por qué la UNR dispone de un repositorio de datos?
¿Cuáles son los beneficios y caracterísiticas del repositorio de datos?
¿Necesitás depositar los datos para publicar tu artículo?
¿Cómo promocionar los datos publicados en el RDA-UNR?
Glosario

¿Qué es un repositorio de datos de investigación?

Un repositorio de datos de investigación es una biblioteca que, sobre una infraestructura institucional tecnológica, permite la preservación y el acceso libre-gratuito a través de Internet a los datos curados, generados durante las investigaciones en el ámbito académico.

Debe cumplir con los principios FAIR: que los datos se puedan encontrar (findable), sean accesibles (accesible), interoperables (interoperable) y reutilizables (reusable) por la comunidad.

Infografía

¿Qué son los datos de investigación?

Los datos de investigación son información recolectada, observada o generada durante el proceso de investigación, que fundamenta las afirmaciones de la investigación y sirve para validar los resultados.

Los datos pueden ser de diversos tipos como, por ejemplo, registros numéricos, textuales, imágenes, vídeo, información geográfica, sonido, etc. Los datos digitales se guardan en formatos diversos como, por ejemplo, hojas de cálculo, tiff (imágenes), pdfA, csv, etc.

¿Qué son los datos abiertos?

Los datos abiertos son aquellos datos de investigación que se disponen en un repositorio digital de acceso libre y gratuito, luego de un proceso de curación.

¿Qué son los identificadores persistentes?

Los Identificadores Persistentes son referencias digitales únicas y permanentes que permiten encontrar, acceder, reutilizar y citar objetos de información digital de cualquier tipo en la web.
A través de ellos, los usuarios acceden a una URI (PID) permanente y son redirigidos a la URL asociada al identificador. Garantizan el acceso a los contenidos aunque el sitio web cambie de dirección web.

Algunos ejemplos son: DOI – Digital Object Identifier; ORCID – Open Researcher and Contributor ID; ROR – Research Organization Registry; ARK – Archival Resource Key; Handle – Handle System; PMID – PubMed Unique Identifier; ISBN – International Standard Book Number; ISSN – International Standard Serial Number; PURL – Persistent Uniform Resource Locator.

Infografía

¿Por qué es importante publicar los datos de investigación?

Promueve el descubrimiento e impacto de la investigación a través de la cita de datos.
Facilita la reutilización de los datos, promoviendo la optimización de los recursos destinados a la investigación.
Fortalece la calidad e integridad de la ciencia, al compartir evidencias relacionadas con las publicaciones en revistas y conferencias.
Permite preservar y organizar los datos de investigación de forma segura y a largo plazo.
Posibilita compartir los datos, habilitando a que otros investigadores y la sociedad los utilicen para crear y producir nuevos conocimientos.
Favorece la adopción de buenas prácticas aceptadas por la comunidad científica internacional, en el marco de la ciencia abierta.
Impulsa el crecimiento económico y social a través de la investigación, innovación y desarrollo.
Ayuda a descubrir redes de colaboración y propicia la coautoría.

Infografía

¿Por qué es importante citar datos de investigación?

Citar los datos de investigación ofrece muchos beneficios para investigadores:

Facilita la identificación y el acceso a los datos asegurando que puedan ser efectivamente localizados, validados y reutilizados.
Proporciona mayor visibilidad a la investigación realizada.
Atribuye a los investigadores el crédito por la autoría.
Permite realizar seguimiento del impacto de los datos y de sus creadores.

¿Por qué la UNR dispone de un repositorio de datos?

La Universidad Nacional de Rosario cuenta con un repositorio institucional para datos de investigación denominado Repositorio de Datos Académicos RDA-UNR. Este repositorio multidisciplinar cumple con todos los principios necesarios para compartir conjuntos de datos, permitiendo además, que los autores sean debidamente reconocidos y citados.

De este modo, la Universidad contribuye al Sistema Nacional de Repositorios Digitales Institucionales, permitiendo el cumplimiento de la Ley 26.899, que establece depositar en repositorios los conjuntos de datos generados durante los proyectos de investigación financiados con fondos públicos.

Anonimización
Citación de datos
Curadores
Dataset
Dataverse
Dataverse en el RDA-UNR
Datos de investigación
Datos sensibles
DOI (Digital Object Identifier)
Licencia de uso de los datos
Metadatos
Principios FAIR

Anonimización: proceso para ocultar la información personal posibilitando la divulgación de los datos sin vulnerar los derechos a la protección de datos personales u organizaciones. Evita el riesgo que representa la obtención y tratamiento masivo de datos personales.

Citación de datos: al igual que otros tipos de publicaciones los datos deben ser citados para el debido reconocimiento de su autor/a productor/a original y para ayudar a otros usuarios a encontrar el recurso. Para promover esta buena práctica RDA-UNR provee una cita estandarizada a cada conjunto de datos.

Curadores: asesoran a los investigadores de las diversas áreas temáticas con el objetivo de agregar valor académico al set de datos, optimizando la organización, descripción de los mismos y la documentación del proceso de su producción (proveniencia). La curación de los datos, basada en los principios FAIR, potencia su visibilidad, comprensión y reutilización.

Dataset: es el conjunto de datos de una investigación, su documentación y descripción publicados en un repositorio de datos. Puede contener uno o múltiples archivos. En RDA-UNR, los datasets se publican dentro de un Dataverse.

Dataverse: software de código abierto desarrollado para depositar, preservar, citar, explorar y analizar datos de investigación. Facilita la disponibilidad de los datos y alienta su reutilización potenciando su visibilidad y el crédito académico. Además, un dataverse es una unidad de publicacion que reúne datasets. El modelo de organizacion de datos del Dataverse permite la ubicacion de dataverses dentro de otros dataverses.

Dataverse en el RDA-UNR: el RDA-UNR esta implementado en el software Dataverse versión 5. Cada Facultad tiene su correspondiente dataverse dentro del cual pueden publicar los miembros de su comunidad. Aquellos equipos de investigación que cuenten con al menos cinco conjuntos de datos (datasets) publicados podrán acceder a su propio dataverse, su colección de datos dentro del dataverse de su Facultad.

Datos de investigación: datos generados o recolectados en el transcurso de una investigación, que permiten la validación de la misma y fundamentan un nuevo conocimiento. Pueden ser físicos o digitales, en bruto o analizados, de tipo cualitativo o cuantitativo. Los datos digitales pueden encontrarse en muchos formatos y pueden estar almacenados en soportes diversos.

Datos sensibles: toda información que pueda atentar contra los derechos al honor, la intimidad, a la protección de datos personales, y a la imagen de terceros (contemplados en el artículo 19 de la Constitución Nacional), ya sea a través del uso de imágenes y/o información sensible sobre terceros que requieren especial tratamiento (véase Anonimización). Resolución 753 – E/2016.

DOI (Digital Object Identifier): identificador global único. Constituye un enlace permanente en forma de código alfanumérico que se le asigna a un objeto digital, en este caso, al dataset publicado en RDA-UNR. El sistema DOI, a diferencia de lo que sucede con las URL de las páginas web, no cambia, lo que permite que los datos sean localizados aun cuando son reubicados.

Licencia de uso de los datos: RDA-UNR adopta como licencia Creative Commons Atribución 4.0 Internacional (CC BY 4.0). Las Licencias Creative Commons son instrumentos jurídicos, basados en la normativa de derecho de autor, que permiten a los creadores de una obra dar acceso público a la misma, bajo los términos y condiciones de su elección, de una manera simple y estandarizada. Se trata de herramientas que cuentan con un amplio reconocimiento en la comunidad científica internacional, repositorios y publicaciones de acceso abierto.

Metadatos: información descriptiva sobre los datos, su contexto, calidad, condición o características de un dato u objeto de información, que tiene la finalidad de facilitar su búsqueda, recuperación, identificación, autentificación, evaluación, preservación y/o interoperabilidad. Resolución 753 – E/2016.

Principios FAIR (Findable, Accessible, Interoperable, and Reusable): sigla en inglés que representa cuatro principios fundamentales que sirven de orientación para favorecer y maximizar el valor agregado de los datos de investigación y las publicaciones científicas contemporáneas, traducido al español estos cuatro principios son:
- Encontrable: los datos deben ser fácilmente encontrados tanto por humanos como por computadoras. Los metadatos legibles por máquina son esenciales para el descubrimiento automatizado de los conjuntos de datos.
- Accesible: una vez que el usuario/a encuentra los datos requeridos necesita saber cómo puede acceder a los mismos, si requiere alguna autenticación o autorización.
- Interoperable: por lo general, los datos deben integrarse con otros datos e interactuar con aplicaciones o flujos de trabajo para su análisis, almacenamiento y procesamiento.
- Reutilizable: el objetivo final de FAIR es optimizar la reutilización de los datos, para ello, datos y metadatos deben estar bien descritos para que puedan replicarse y/o combinarse en diferentes entornos.