Tipos de datos

Miren Berasategi

Fuente: Diccionario de la Real Academia Española

Diccionario de la Real Academia Española

Un dato es una representación simbólica (numérica, alfabética, algorítmica, espacial etc.) de un atributo o variable.

Wikipedia, "Dato"

Una variable estadística es una característica que puede fluctura y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse.

Wikipedia, "Variable estadística"

Un ejemplo

?

Una visualización de datos es…

la representación y presentación de datos para facilitar el entendimiento.

Kirk (2019)

Morelli (2016)

Morelli (2016)

Morelli (2016)

Morelli (2016)

Morelli (2016)

Morelli (2016)

Morelli (2016)

Tipos de datos

Tipos de datos

Cualitativos
  • Nominales grupoA | grupoB
  • Ordinales mucho | poco | algo
Cuantitativos
  • Discretos …|175|176|177|…
  • Continuos …|175,2|176,1|…
Algunos datos con tratamiento especial
  • Fechas, duración
  • Espacio
  • Documentos como fuentes de datos
>

Escalas o niveles de medición

NominalesOrdinalesDe intervaloDe razón
Se pueden identificar
Se pueden contar
Se pueden ordenar
Se pueden sumar/restar
Se pueden multiplicar/dividir

Estructuras de datos

Tabular

Formatos digitales

  • csv, tsv...
  • Hojas de cálculo: xlsx, ods...
  • Software estadístico: R, SPSS...

Consulta de datos

  • Filtros
  • Consultas tipo vlookup
Van Hooland y Verborgh (2014)

Tabular

Formatos digitales

  • csv, tsv...
  • Hojas de cálculo: xlsx, ods...
  • Software estadístico: R, SPSS...

Consulta de datos

  • Filtros
  • Consultas tipo vlookup
Van Hooland y Verborgh (2014)

Relacional

Formatos digitales

  • Archivos binarios
  • Microsoft Access, MySQL, Oracle...

Consulta de datos

  • SQL
Van Hooland y Verborgh (2014)

Relacional

Formatos digitales

  • Archivos binarios
  • Microsoft Access, MySQL, Oracle...

Consulta de datos

  • SQL
Van Hooland y Verborgh (2014)

Jerárquica

Formatos digitales

  • XML
  • JSON

Consulta de datos

  • XQuery, XPath
Van Hooland y Verborgh (2014)

Jerárquica

Formatos digitales

  • XML
  • JSON

Consulta de datos

  • XQuery, XPath
Van Hooland y Verborgh (2014)

De grafo o red

Formatos digitales

  • RDF-XML, N-triples...
  • Neo4j

Consulta de datos

  • SPARQL
  • Cypher
Van Hooland y Verborgh (2014)

De grafo o red

Formatos digitales

  • RDF-XML, N-triples...
  • Neo4j

Consulta de datos

  • SPARQL
  • Cypher
Van Hooland y Verborgh (2014)

Esctructuras de datos: comparación

VentajasDesventajas
TabularMuy portable
Independiente de la tecnología
Proclive a redundancias e inconsistencias
Recuperación de datos ineficiente
RelacionalDatos complejos
Mercado de software maduro
Formato binario
Dependiente de esquema
JerárquicoIndependiente de la tecnología
Legible por humanos y máquinas
Implementación compleja
Verbosidad
De grafo o redNeutro con respecto a esquemas
Permite descubrir nuevo conocimiento
Mercado de software inmaduro
Van Hooland y Verborgh (2014)

Diccionario de datos

Un diccionario de datos, o repositorio de metadatos, como lo define el IBM Dictionary of Computing, es un repositorio centralizado de información sobre datos tales como significado, relación con otros datos, origen, uso y formato.

Wikipedia, "Diccionario de datos"