- Lista de revisión para la curaduría de datos
- ¿Cómo escribir una correcta descripción de datos?
- Formatos recomendados para datos
- Diccionario de Metadatos
Lista de revisión para la curaduría de datos
Lista elaborada a partir de la práctica de curación para guiar la revisión de publicaciones de datos, con el fin de asegurar la calidad del dataset y maximizar su potencial para la reutilización.
- Ubicación del dataset
El conjunto de datos se subió a la colección correspondiente, considerando que los autores pueden tener permisos en más de una colección.
- Colección
El contenido está organizado para permitir el crecimiento y versionado de la colección.
- Título
El título no es una copia del título del paper resultante de la investigación, excepto si contiene la frase “Datos de Replicación de: (título del paper)” al inicio.
Se refiere específicamente a los datos publicados, destacando su propósito, metodología y contenido.
Utiliza un lenguaje claro y explicativo del dataset, fácil de recordar.
No contiene siglas, a menos que se expliquen entre paréntesis.
Incluye palabras clave relevantes que se podrían usar en búsquedas, como “datos” o “dataset” y términos específicos sobre el tema.
Cuenta con una alternativa en español e inglés.
- Autores
Los autores cuentan con filiación institucional.
Están vinculados a un identificador ORCID (sin prefijo “https://orcid.org/“).
Los autores están registrados en el repositorio para recibir notificaciones de publicación, en lo posible.
- Descripción de los datos
En el RDA-UNR, se promueve la elaboración de descripciones detalladas de los datos, estructuradas con subtítulos que incluyan, como mínimo, los siguientes ítems: introducción, tabla de contenidos, tipos de datos, metodología, organización de los datos, declaración de calidad y valor de los datos. Asimismo, se deberán considerar características específicas del conjunto de datos, tales como la protección de datos personales, explicación de licencias y el software utilizado o modelo relacionado.
La descripción debe ser informativa, resaltando la importancia, el contenido y la estructura de los datos, evitando ser extensa y dificultar así la comprensión del lector. Los detalles más específicos y técnicos necesarios para la reutilización de los datos deben registrarse en un archivo README o Informe de datos.
- 1 Introducción
Contiene al menos 200 palabras.
No es una copia del resumen del paper; se refiere específicamente a los datos.
Repite palabras clave y del título para mejorar la búsqueda.
Cumple con las indicaciones de la Guía para escribir una correcta descripción de datos de investigación.
Describe la motivación, el contexto en el que se crearon los datos y la metodología utilizada.
Menciona el origen de los datos primarios, cuando corresponda.
Cuenta con versión en español e inglés.
- 2 Tabla de contenidos de datos
Lista los tipos de datos contenidos en el dataset, incluyendo la función y la cantidad de cada tipo.
Menciona material complementario (cuestionarios, README/Informe de datos, diccionario de datos).
Indica licencias y acuerdos de uso si los datos derivan de otro dataset.
Contiene referencias a fuentes originales (DOI, URL o dirección física).
- 3 Metodología
Describe el procedimiento de recolección y procesamiento de los datos.
Especifica herramientas e instrumentos utilizados.
Incluye metadatos especializados, si corresponde (ej., Dataverse para ciencias sociales).
Registra las fechas de recolección en los metadatos.
- 4 Organización y nombramiento del dataset
Organiza los archivos en carpetas, si el dataset es voluminoso o diverso en tipos y formatos.
La estructura de carpetas es clara y refleja los componentes del dataset, su proveniencia y la estructura de la investigación (ej., por fecha, lugar, participantes).
Los nombres de archivos y carpetas reflejan su contenido y origen.
Explica las convenciones de nombramiento en la descripción o en el README/Informe de datos.
Dirige a los usuarios a visualizar el dataset en Vista Árbol.
Incluye una descripción detallada para cada archivo que facilita la comprensión de su contenido.
- 5 Calidad de los datos
Incluye una declaración sobre la calidad del dataset, como controles realizados o indicación de datos crudos.
Describe las medidas adoptadas para minimizar errores en la recolección y procesamiento de los datos, incluyendo técnicas de normalización, estandarización y verificación.
Documenta procedimientos de limpieza, indicando el manejo de valores atípicos, datos faltantes o inconsistentes.
Indica si se realizaron pruebas de replicabilidad o reproducibilidad, incluyendo resultados y problemas detectados.
Explica la falta de evaluación de calidad en datos crudos e invita al feedback del usuario mediante la opción “Contactar al propietario”.
- 6 Valor de los datos
Detalla la contribución científica del dataset.
Indica si el dataset está asociado a un paper, el cual está citado en “Publicación relacionada”.
Explica el potencial de reutilización y la audiencia objetivo.
- Palabras claves
Las palabras clave son específicas del contenido de la publicación y del campo de estudio.
Repite las palabras clave del título y resumen.
Utiliza vocabulario controlado y menciona el enlace correspondiente, siempre que sea posible.
Considera las palabras clave que los usuarios podrían usar para encontrar la publicación; esto podría incluir frases específicas y detalladas, compuestas de tres o más palabras.
Incluye sinónimos y términos alternativos relevantes.
Usa formas completas de siglas y abreviaturas.
Incluye palabras clave relevantes a toda la publicación, no solo al título.
Representa los datos con las palabras clave, no el análisis.
No se repiten palabras clave en exceso ni se manipulan para motores de búsqueda.
- Publicación relacionada
Cita y vincula con un enlace persistente las publicaciones relacionadas.
- Tipos de datos
Indica el tipo de datos en el formulario de metadatos.
Utiliza un vocabulario controlado sobre la tipología de datos, como el de COAR.
- Software
Indica software y versiones usados para generar y visualizar los datos.
Menciona software o modelos de IA/ML, si aplica.
Cita el software o enlaza al repositorio donde reside (ej., GitHub).
- Formato de datos
Los archivos se pueden abrir correctamente.
Los datos tabulares son visualizables en Dataverse.
Los archivos están en formatos abiertos, conforme a las Buenas Prácticas.
Realiza la conversión a formatos abiertos sin pérdida de información, estructura o fórmulas.
Si hay formatos propietarios, se publican junto con formatos abiertos.
Utiliza formatos aceptados por la comunidad de investigación.
- Revisión del contenido de los datos
Los archivos se abren correctamente y no están dañados.
Los datos están completos y sin archivos en blanco.
Los valores numéricos son correctos y explica datos faltantes.
Adjunta un diccionario de datos para datos tabulares que describe términos, variables y define los códigos o símbolos utilizados.
Incluye un archivo README/Informe de datos que describe el contenido y la metodología.
Cumple con la política de Datos sensibles y confidenciales del repositorio.
¿Cómo escribir una correcta descripción de datos?
Describir bien los datos garantiza que cualquier usuario pueda descubrirlos, entenderlos y reutilizarlos. Para hacerlo correctamente, se deben seguir las indicaciones de esta guía:
Formatos recomendados para datos
A continuación, se muestra una lista orientativa adaptada de la lista de formatos recomendados para datos:
- Bases de datos: XML, CSV, JSON
- Datos Geoespaciales: SHP, DBF, GeoTIFF, netCDF, GeoJSON, Rinex
- CAD: .dxf, .sat, .igs, .stp
- Nube de Puntos (PointCloud): LAS, LAZ, XYZ, PTX
- Videos: MPEG, AVI, MXF, MKV
- Audio: WAVE, AIFF, MP3, MXF
- Estadísticas: ASCII, DTA, POR, SAS, SAV
- Imagenes: TIFF, JPEG 2000, PDF, PNG, GIF, BMP, SVG
- Datos tabulares: CSV, TXT
- Texto: XML, PDF/A, HTML, ASCII, UTF-8
- Sismología: SEED
- Código: (tcl files, py files) Jupyter Notebook
- Archivo web: WARC
- Contenedores: TAR, GZIP, ZIP
Diccionario de metadatos
Diccionario de metadatos del Repositorio de Datos de Texas
Creado por Courtney C. Mumma
Última actualización: 27 de Nov, 2018
El Diccionario de metadatos del Repositorio de Datos de Texas (TDR) se compone de campos de metadatos de cita, incluidos los metadatos de revistas, y metadatos específicos del área disciplinar, geoespaciales, de ciencias sociales y humanidades, astronomía y astrofísica y ciencias biológicas. El diccionario contiene una definición de cada campo, describe las especificaciones de formato asociadas, indica si el campo es obligatorio u opcional y si es visible para el depositario durante la carga. Tenga en cuenta que los miembros de la Biblioteca Digital de Texas (TDL) pueden optar por ampliar el número de campos obligatorios según los procedimientos operativos de la institución.
Campo | Descripción | Formato | Obligatorio /Opcional | Visible durante la carga |
---|---|---|---|---|
Title (Título) | Título completo por el que se conoce al dataset. | Ob | SÍ | |
Subtitle (Subtítulo) | Título secundario que se utiliza para ampliar o limitar el título principal. | Op | NO | |
Alternative Title (Título alternativo) | Título por el que comúnmente se hace referencia a la obra, o abreviatura del título. | Op | NO | |
Alternative URL (URL alternativa) | URL donde se puede visualizar el dataset, como la de un sitio web personal o del proyecto. | Introduzca la URL completa empezando por escribir http:// Ejemplo: http://www.my.org | Op | NO |
Other ID (Otro ID) | Los datos de esta sección se refieren a otro identificador único de este dataset (p. ej. del productor o a su número de identificación en otro repositorio). | |||
Agency (Agencia) | Nombre de la agencia que generó este identificador. | Op | NO | |
Identifier (Identificador) | Otro identificador que corresponde a este dataset. | Op | NO | |
Author (Autor) | Los datos de esta sección se refieren a la(s) persona(s), persona(s) jurídica(s) o agencia(s) responsable(s) de la creación de la obra. | |||
Name (Nombre) | Apellido y nombre del autor o nombre de la organización responsable de este dataset. | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca Digital de Texas | Ob | SÍ |
Affiliation (Afiliación) | Organización a la que está afiliado el autor. | Ob | SÍ | |
Identifier Scheme (Esquema de identificadores) | Nombre del esquema de identificadores (ORCID, ISNI, LCNA). | Op | SÍ | |
Identifier (Identificador) | Identifica de forma única a un autor u organización individual, de acuerdo con varios esquemas. | Op | SÍ | |
Contact (Contacto) | Los datos de esta sección se refieren a los contactos de este dataset. | |||
Name (Nombre) | Apellido y nombre del contacto, o nombre de la organización. | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca digital de Texas | Op | SÍ |
Affiliation (Afiliación) | Organización a la que está afiliado el contacto. | Op | SÍ | |
E- mail | Direcciones de correo electrónico de los contactos del dataset. Esto no se mostrará al usuario. | Ob | SÍ | |
Description (Descripción) | Los datos de esta sección se refieren a un resumen que describe el propósito, la naturaleza y el alcance del dataset. | |||
Text (Texto) | Resumen que describe el propósito, la naturaleza y el alcance del dataset. | Ob | SÍ | |
Date (Fecha) | En los casos en que un dataset contenga más de una descripción (p. ej. el productor de datos puede proporcionar una y el repositorio donde se depositan los datos, otra), la fecha se utiliza para distinguir entre ambas descripciones. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | SÍ |
Subject (Tema) | Categorías temáticas específicas del área que son relevantes para el dataset. | Ob | SÍ | |
Keyword (Palabras clave) | Los datos de esta sección se refieren a términos clave que describen aspectos importantes del dataset. | |||
Term (Término) | Términos clave que describen aspectos importantes del dataset. Se puede utilizar para crear índices de palabras clave y con fines de clasificación y recuperación. Se puede emplear un vocabulario controlado. | Op | SÍ | |
Vocabulary (Vocabulario) | Para la especificación del vocabulario controlado de palabras clave en uso. | Nombre abreviado del vocabulario. Ejemplos: LCSH LCNA MeSH | Op | SÍ |
Vocabulary URL (URL de vocabulario) | URL que lleva al sitio web donde se describe el vocabulario de palabras clave, si corresponde. | Ingrese la URL absoluta del sitio web sonde se encuentra el vocabulario de palabras clave. Ejemplo: http://www.my.org | Op | SÍ |
Topic Classification (Clasificación de temas) | Los datos de esta sección se refieren al campo de clasificación que indica los temas importantes y generales que abarcan los datos. | |||
Term (Término) | Término del tema o tópico relevante para este dataset. | Op | NO | |
Vocabulary (Vocabulario) | Especifica el vocabulario controlado en uso. | Nombre abreviado del vocabulario. Ejemplos: LCSH LCNA MeSH | Op | NO |
Vocabulary URL (URL de vocabulario) | Especifica la dirección URL donde se encuentra el vocabulario controlado completo. | Ingrese la URL absoluta del sitio web donde se encuentra el vocabulario de palabras clave. Ejemplo: http://www.my.org | Op | NO |
Related Publication (Publicación relacionada) | Los datos de esta sección se refieren a publicaciones que utilizan los datos de este dataset. | |||
Citation (Citación) | Citación bibliográfica completa para esta publicación relacionada. | Op | NO | |
ID Type (Tipo de ID) | Tipo de identificador digital utilizado para esta publicación (p. ej. Identificador de objeto digital [DOI]). | Ejemplos: Identificador de Objeto Digital (DOI) handle isbn | Op | NO |
ID Number (Número de ID) | Identificador para el tipo de ID seleccionado. | Op | NO | |
URL | Enlace a la página web de la publicación | Ingrese la URL absoluta del sitio web donde se encuentra la publicación. Ejemplo: http://www.my.org | Op | NO |
Notes (Notas) | Información adicional importante sobre el dataset. | Op | SÍ | |
Language (Idioma) | Idioma del dataset. | Op | NO | |
Producer (Productor) | Los datos de esta sección se refieren a la persona u organización con responsabilidad financiera o administrativa sobre este dataset. | |||
Name (Nombre) | Nombre del productor | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca digital de Texas | Op | NO |
Affiliation (Afiliación) | Organización a la que está afiliado el productor. | Op | NO | |
Abbreviation (Abreviatura) | Abreviatura por la que se conoce comúnmente al productor. | Ejemplo: TDL | Op | NO |
URL | URL que lleva al sitio web del productor, si corresponde. | Ingrese la URL absoluta del sitio web del productor. Ejemplo: http://www.my.org | Op | NO |
Logo URL (URL del logo) | URL que lleva a la imagen del logotipo del productor accesible en la web. | Ingrese una URL absoluta a la imagen del logotipo del productor. Ejemplo: http://www.my.org/images/logo.gif | Op | NO |
Production date (Fecha de producción) | Fecha en que se produjo la recolección de datos u otros materiales (no distribuidos, publicados o archivados). | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Ob | SÍ |
Production place (Lugar de producción) | Ubicación donde se produjo la recolección de datos y cualquier otro material relacionado. | Ob | SÍ | |
Contributor (Colaborador) | Los datos de esta sección se refieren a la organización o persona responsable de recolectar, gestionar o contribuir de alguna forma al desarrollo del recurso. | |||
Type (Tipo) | El tipo de colaborador. | Op | NO | |
Name (Nombre) | Apellido y nombre del colaborador o nombre de la organización del colaborador. | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca digital de Texas | Op | NO |
Grant Information (Información de la subvención) | Los datos de esta sección se refieren a la información de la subvención. | |||
Grant agency (Agencia que otorga la subvención) | Nombre de la agencia que otorga la subvención | Op | NO | |
Grant Number (Número de subvención) | Número de subvención o de contrato del proyecto por el que se patrocina la iniciativa. | Op | NO | |
Distributor (Distribuidor) | Los datos de esta sección se refieren a la organización designada por el autor o productor para generar copias del trabajo, incluidas las ediciones o revisiones necesarias. | |||
Name (Nombre) | Nombre del distribuidor. | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca digital de Texas | Op | NO |
Affiliation (Afiliación) | Organización a la que está afiliado el distribuidor. | Op | NO | |
Abbreviation (Abreviatura) | Abreviatura con la que se conoce comúnmente a este distribuidor (p. ej. IQSS, ICPSR). | Ejemplo: TDL | Op | NO |
URL | URL que lleva al sitio web del distribuidor, si corresponde. | Ingrese la URL absoluta al sitio web del distribuidor. Ejemplo: http://www.my.org | Op | NO |
Logo URL (URL del logo) | URL que lleva a la imagen del logotipo del distribuidor accesible en la web. | Ingrese la URL absoluta a la imagen del logotipo del distribuidor. Ejemplo: http://www.my.org/images/logo.gif | Op | NO |
Distribution date (Fecha de distribución) | Fecha en que el trabajo estuvo disponible para distribución/presentación. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | NO |
Depositor (Depositario) | Persona (apellido, nombre) o nombre de la organización que depositó este dataset en el repositorio. | Nombre personal expresado como: Apellido, Nombre Segundo nombre. Nombre de la organización tal como aparece. Ejemplos: Obama, Barack H. Biblioteca digital de Texas | Op | SÍ |
Deposit date (Fecha de depósito) | Fecha en que se depositó el dataset en el repositorio. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | SÍ |
Time period covered (Período de tiempo comprendido) | Los datos de esta sección corresponden al período de tiempo al que se refieren los datos. Este ítem refleja el período de tiempo cubierto por los datos; no así las fechas en que los documentos se codificaron o hicieron legibles por computadora, ni las fechas en que se recolectaron los datos, también conocido como lapso. | |||
Start (Inicio) | Fecha de inicio que refleja el período de tiempo cubierto por los datos; no así las fechas en que los documentos se codificaron o hicieron legibles por computadora, ni las fechas en que se recolectaron los datos. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | NO |
End (Finalización) | Fecha de finalización que refleja el período de tiempo cubierto por los datos; no así las fechas en que los documentos se codificaron o hicieron legibles por computadora, ni las fechas en que se recolectaron los datos. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | NO |
Date of Collection (Fecha de recolección) | Los datos de esta sección se refieren a la(s) fecha(s) en que se recolectaron los datos. | |||
Start (Inicio) | Fecha en que inició la recolección de datos. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | NO |
End (Finalización) | Fecha en que finalizó la recolección de datos. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplo: 2016-01-30 | Op | NO |
Kind of data (Tipo de datos) | Tipo de datos incluidos en el archivo. | Texto libre. Ejemplos: datos de encuesta datos del censo, enumeración, datos agregados, datos clínicos, datos de sucesos, transacciones código fuente del programa, texto legible por computadora, datos de registros administrativos, datos experimentales, tests psicológicos, datos de texto, datos de texto codificados, documentos codificados, presupuestos de tiempo, datos/evaluación de observación, datos producidos en procesos. | Ob | SÍ |
Series | Los datos de esta sección se refieren a información sobre las series de datasets. | |||
Name (Nombre) | Nombre de la serie de datasets a la que pertenece el dataset. | Op | NO | |
Information (Información) | Historial de la serie y resumen de las características que se aplican a la serie en su conjunto. | Op | NO | |
Software | Los datos de esta sección se refieren al software utilizado para generar el dataset. | |||
Name (Nombre) | Nombre del software utilizado para producir el dataset. | Op | NO | |
Version (Versión) | Versión del software utilizado para producir el dataset. | Op | NO | |
Related material (Material relacionado) | Cualquier material relacionado con este dataset. | Op | NO | |
Related datasets (Datasets relacionados) | Cualquier dataset relacionado con este dataset, como investigaciones anteriores sobre el tema. | Op | NO | |
Other references (Otras referencias) | Cualquier referencia que sirva como antecedente o material de apoyo para este dataset. | Op | NO | |
Data sources (Fuentes de datos) | Lista de libros, artículos, publicaciones seriadas o archivos de datos legibles por computadora que sirvieron como fuente para la recolección de datos. | Op | NO | |
Origin of sources (Origen de las fuentes) | Para materiales históricos, se debe especificar el origen de las fuentes y los criterios de selección de las mismas. | Op | NO | |
Characteristic of Sources Noted (Característica de las fuentes señaladas) | Evaluación de características y material de origen. | Op | NO | |
Documentation and Access to Sources (Documentación y acceso a fuentes) | Nivel de documentación de las fuentes originales. | Op | NO |
Campo | Definición | Formato | Obligatorio /Opcional | Visible durante la carga |
---|---|---|---|---|
Journal (Revista) | Los datos de esta sección se refieren al volumen, número y fecha de la revista a la que está asociado este dataset. | |||
Volume (Volumen) | Volumen de la revista al que está asociado este dataset. | Ejemplo: Volumen 4 | Op | NO |
Issue (Número) | Número de publicación de la revista al que está asociado este dataset, | Ejemplo: Número 2, Otoño | Op | NO |
Publication Date (Fecha de publicación) | Fecha de publicación del volumen/número al que está asociado este dataset. | Fecha expresada en formato ISO (AAAA-MM-DD). Ejemplos: 2016-01-30 1999 | Op | NO |
Type of article (Tipo de artículo) | Indica qué tipo de artículo es. | Valores de JATS. Ejemplos: artículo de investigación comentario crítico reseña de libro reseña de producto | Op | NO |
Metadatos específicos del área
Campo | Definición | Formato | Obligatorio /Opcional | Visible durante la carga |
---|---|---|---|---|
Geographic Coverage (Cobertura geográfica) | La información de esta sección se refiere a la cobertura geográfica de los datos, que incluye el alcance geográfico total. | |||
Country/ Nation (País/Nación) | País o nación sobre el que se trata el dataset. | Op | NO | |
State/Province (Estado/Provincia) | Estado o provincia sobre el que se trata el dataset. | Utilice GeoNames para corregir la ortografía y evite las abreviaturas. | Op | NO |
City (Ciudad) | Nombre de la ciudad sobre la que se trata el dataset. | Utilice GeoNames para corregir la ortografía y evite las abreviaturas. | Op | NO |
Other (Otro) | Otra información sobre la cobertura geográfica de los datos. | Op | NO | |
Geographic Unit (Unidad geográfica) | Nivel más bajo de agregación geográfica cubierto por el dataset, p. ej. localidad, departamento, región. | Op | NO | |
Geographic Bounding Box (Rectángulo delimitador geográfico) | La descripción geométrica fundamental para cualquier dataset que modele la geografía es el rectángulo delimitador geográfico. Describe el cuadro mínimo, definido por las longitudes oeste y este y las latitudes norte y sur, que incluye la mayor extensión geográfica cubierta por el dataset. Este elemento se utiliza en el primer paso de una búsqueda basada en coordenadas. Se recomienda su inclusión en el libro de códigos. Es obligatorio si se incluye el cuadro de polígono delimitado. | |||
West Longitude (Longitud oeste) | Coordenada más occidental que delimita la extensión geográfica del dataset. | Un rango válido de valores, expresado en grados decimales, es -180,0 <= Valor de longitud del límite oeste <= 180,0. | Op | NO |
East Longitude (Longitud este) | Coordenada más oriental que delimita la extensión geográfica del dataset. | Un rango válido de valores, expresado en grados decimales, es -180,0 <= Valor de longitud del límite este= 180,0. | Op | NO |
North Latitude (Latitud norte) | Coordenada situada más al norte que delimita la extensión geográfica del dataset. | Un rango válido de valores, expresado en grados decimales, es -90,0 <= Valor de latitud del límite norte <= 90,0. | Op | NO |
South Latitude (Latitud sur) | Coordenada situada más al sur que delimita la extensión geográfica del dataset. | Un rango válido de valores, expresado en grados decimales, es -90,0 <= Valor de latitud del límite sur = 90,0. | Op | NO |
Campo | Definición | Formato | Obligatorio /Opcional | Visible durante la carga |
---|---|---|---|---|
Unit of Analysis (Unidad de análisis) | Unidad básica de análisis u observación que describe este dataset (p. ej. individuos, familias/hogares, grupos, instituciones/organizaciones, unidades administrativas, etc.) | Para obtener información sobre el vocabulario controlado de DDI para este elemento, consulte la página web: http://www.ddialliance.org/Specification/DDI-CV/ | Op | NO |
Universe (Universo) | Descripción de la población cubierta por los datos del archivo: el grupo de personas u otros elementos que son objeto del estudio y al que se refieren sus resultados. La edad, nacionalidad y residencia suelen ayudar a delimitar un universo dado, pero se pueden utilizar otros factores como límites de edad, sexo, estado civil, raza, grupo étnico, nacionalidad, ingresos, condición de veterano de guerra, condenas penales, etc. El universo puede constar de elementos diferentes de las personas, como unidades de vivienda, causas judiciales, defunciones, países, etc. En general, a partir de la descripción del universo debería ser posible determinar si un individuo o elemento dado compone la población estudiada. También conocido como universo de interés, población de interés y población objetivo. | Op | NO | |
Time Method (Método de tiempo) | Método de tiempo o dimensión temporal de la recolección de datos (p. ej. panel, corte transversal, tendencia, serie temporal, etc.). | Op | NO | |
Data collector (Recolector de datos) | Persona, organismo u organización responsable de administrar el cuestionario o entrevista, o recolectar los datos. | Op | NO | |
Collector training (Capacitación del recolector) | Tipo de capacitación brindada al recolector de datos. | Op | NO | |
Frequency (Frecuencia) | Si los datos se recolectan en más de un momento, indique la frecuencia; es decir, mensual, trimestral u otro. | Op | NO | |
Sampling Procedure (Toma de muestras) | Tipo de muestras y diseño muestral utilizado para seleccionar a los encuestados que representan a la población. Puede incluir una referencia al tamaño de la muestra objetivo y la fracción de muestreo. | Op | NO | |
Target Sample Size (Tamaño de muestra objetivo) | Los datos de esta sección se refieren a información específica sobre el tamaño de la muestra objetivo, el tamaño real de la muestra y la fórmula utilizada para determinarlo. | |||
Actual (Real) | Tamaño real de la muestra. | Op | NO | |
Formula (Fórmula) | Fórmula utilizada para determinar el tamaño de la muestra objetivo. | Op | NO | |
Major Deviations for Sample Design (Desviaciones importantes para el diseño de la muestra) | Muestre la correspondencia y las discrepancias entre las unidades muestreadas (obtenidas) y las estadísticas disponibles para el total de esa población (edad, razón por sexo, estado civil, etc.). | Op | NO | |
Collection Mode (Método de recolección de datos) | Método utilizado para recolectar los datos; características de la instrumentación (p. ej. entrevista telefónica, cuestionario por correo u otro). | Op | NO | |
Type of Research Instrument (Tipo de instrumento de investigación) | Tipo de instrumento de recolección de datos utilizado. “Estructurado” indica un instrumento por el que a todos los encuestados se les hacen las mismas preguntas/pruebas, posiblemente con respuestas precodificadas. | Si una pequeña parte de dicho cuestionario incluye preguntas abiertas, descríbalo de forma adecuados. “Semi-estructurado” indica que el instrumento de investigación contiene principalmente preguntas abiertas. “No estructurado” indica que se realizaron entrevistas en profundidad. | Op | NO |
Characteristics of Data Collection Situation (Características de la situación de recolección de datos) | Descripción de aspectos destacables de la situación de recolección de datos. Incluye información sobre factores como: cooperación de los encuestados, duración de las entrevistas, cantidad de llamadas devueltas o similares. | Op | NO | |
Actions to Minimize Losses (Acciones para minimizar pérdidas) | Resumen de las acciones realizadas para minimizar la pérdida de datos. Incluya información sobre acciones como visitas de seguimiento, controles de supervisión, comparación histórica, estimación, etc. | Op | NO | |
Control Operations (Operaciones de control) | Las operaciones de control son métodos para facilitar el control de datos por parte del investigador principal o del archivo de datos. | Op | NO | |
Weighting (Ponderación) | El uso de procedimientos de muestreo puede requerir aplicar ponderaciones para producir resultados estadísticos precisos. Describe los criterios para usar ponderaciones en el análisis de una recolección. | Si se desarrolló una fórmula o coeficiente de ponderación, se proporciona la fórmula, se definen sus elementos y se indica cómo se aplicó a los datos. | Op | NO |
Cleaning Operations (Operaciones de limpieza) | Métodos utilizados para limpiar la recolección de datos (p. ej. verificación de coherencia, verificación de rango, etc.). | Op | NO | |
Study Level Error Notes (Notas de error a nivel de estudio) | Nota utilizada para indicar cualquier información que aclare la metodología y el procesamiento del estudio. | Op | NO | |
Response Rate (Tasa de respuesta) | Porcentaje de miembros de la muestra que proporcionaron información. | Op | NO | |
Estimates of Sampling Error (Estimaciones del error de muestreo) | Medición de la precisión con la que se estima el valor de una población a partir de una muestra determinada. | Op | NO | |
Other Forms of Data Appraisal (Otras formas de evaluación de datos) | Otras cuestiones relativas a la evaluación de datos. Describa cuestiones como la variación de las respuestas, la tasa de no respuesta y las pruebas de sesgo, el sesgo del entrevistador y de las respuestas, los niveles de confianza, el sesgo de las preguntas o aspectos similares. | Op | NO | |
Notes (Notas) | Los datos de esta sección se refieren a las notas generales sobre este dataset. | |||
Type (Tipo) | Tipo de nota. | Op | NO | |
Subject (Tema) | Tema de la nota. | Op | NO | |
Text (Texto) | Texto de la nota. | Op | NO |
Metadatos de Astronomía y Astrofísica
Campo | Definición | Formato | Obligatorio /Opcional | Visible durante la carga |
---|---|---|---|---|
Type (Tipo) | Naturaleza o género del contenido de los archivos del dataset. | Op | NO | |
Facility (Instalaciones) | Observatorio o instalación donde se obtuvieron los datos. | Op | NO | |
Instrument (Instrumento) | Instrumento utilizado para recolectar los datos. | Op | NO | |
Object (Objeto) | Objetos astronómicos representados en los datos (expresados con los nombres reconocibles y preferidos por la SIMBAD). | Op | NO | |
Spatial Resolution (Resolución espacial) | Resolución espacial (angular) típica de las observaciones. | Usar grados decimales. | Op | NO |
Spectral Resolution (Resolución espectral) | Resolución espectral típica de las observaciones, expresada como relación λ / Δλ. | Op | NO | |
Time Resolution (Resolución en tiempo) | Resolución temporal típica de las observaciones. | Dada en segundos. | Op | NO |
Bandpass (Paso de banda) | Nombre de paso de banda convencional. | Op | NO | |
Central Wavelength (m) (Longitud de onda central (m) | Longitud de onda central del paso de banda espectral. | Usar medidores. | Op | NO |
Wavelength Range (Rango de longitud de onda) | Los datos de esta sección se refieren a la longitud de onda mínima y máxima del paso de banda espectral. | |||
Minimun (Mínima) (m) | La longitud de onda mínima del paso de banda espectral. | Usar medidores. | Op | NO |
Maximum (Máxima) (m) | La longitud de onda máxima del paso de banda espectral. | Usar medidores. | Op | NO |
Dataset Date Range (Rango de fechas del dataset) | Los datos de esta sección se refieren al período de tiempo cubierto por los datos. | |||
Start (Inicio) | Fecha de inicio del dataset. | Op | NO | |
End (Finalización) | Fecha de finalización del dataset. | Op | NO | |
Sky Coverage (Cobertura del cielo) | Cobertura del cielo del objeto de datos. | Op | NO | |
Depth Coverage (Cobertura de profundidad) | Cobertura de profundidad (típica), o sensibilidad, del objeto de datos en Jy. | Op | NO | |
Object Density (Densidad del objeto) | Densidad (típica) de objetos, entradas de catálogo, apuntamiento de telescopios, etc. | Usar número por grado cuadrado. | Op | NO |
Object Count (Recuento de objetos) | Número total de objetos, entradas de catálogo, etc., en el objeto de datos. | Op | NO | |
Fraction of sky (Fracción de cielo) | Fracción del cielo representada en las observaciones. | Valor que va de 0 a 1. | Op | NO |
Polarization (Polarización) | Cobertura de polarización. | Op | NO | |
RedshiftType (Tipo de corrimiento al rojo) | Tipo de corrimiento al rojo string C “Redshift”; o definiciones “Ópticas” o “Radiales” de la velocidad Doppler utilizadas en el objeto de datos. | Op | NO | |
Redshift Resolution (Resolución de corrimiento al rojo) | Resolución del corrimiento al rojo (sin unidades) o de la velocidad Doppler (km/s) en el objeto de datos. | Op | NO | |
Redshift Value (Valor de corrimiento al rojo) | Los datos de esta sección se refieren al valor de corrimiento al rojo (sin unidades) o de la velocidad Doppler (km/s) en el objeto de datos. | |||
Minimum (Mínimo) | Valor mínimo del corrimiento al rojo (sin unidades) o de la velocidad Doppler (km/s) en el objeto de datos. | Op | NO | |
Maximum (Máximo) | Valor mínimo del corrimiento al rojo (sin unidades) o de la velocidad Doppler (km/s) en el objeto de datos. | Op | NO |
Metadatos de Ciencias Biológicas
Campo | Definición | Formato | Obligatorio /Opcional | Visible para el depositario |
---|---|---|---|---|
Design Type (Tipo de diseño) | Tipos de diseño que se basan en el diseño experimental general. | Op | NO | |
Factor Type (Tipo de factor) | Factores utilizados en el dataset. | Op | NO | |
Organism (Organismo) | Nombre taxonómico del organismo utilizado en el dataset o del que deriva el material biológico inicial. | Op | NO | |
Other organism (Otro organismo) | Si seleccionó “Otro” en Organismo, enumere cualquier otro organismo que se haya utilizado en este dataset. | Se recomiendan los términos de la taxonomía de NCBI: https://www.ncbi.nlm.nih.gov/taxonomy | Op | NO |
Measurement Type (Tipo de medición) | Término para identificar la tecnología utilizada para la medición (p. ej. micromatrices de ADN, espectrometría de masas, etc.). | Op | NO | |
Other Measurement Type (Otro tipo de medición) | Si se seleccionó “Otro” en Tipo de medición, enumere cualquier otro tipo de medición que se haya utilizado. | Se recomiendan los términos de NCBO Bioportal: https://bioportal.bioontology.org/ | Op | NO |
Technology Type (Tipo de tecnología) | Término para identificar la tecnología utilizada para la medición (p. ej. micromatrices de ADN, espectrometría de masas, etc.). | Op | NO | |
Technology Platform (Plataforma tecnológica) | Fabricante y nombre de la plataforma tecnológica utilizada en la prueba (p. ej. Bruker AVANCE). | Op | NO | |
Cell Type (Tipo de célula) | Nombre de la línea celular de la que se deriva la fuente o muestra. | Op | NO |