Lista de datasets

Un dataset es un tabla de datos plana con observaciones por filas y variables por columnas. Los datasets son recursos educativos para universitarios muy útiles para practicar técnicas multivariantes o de series temporales. Así por ejemplo, sin necesidad de acudir a los microdatos, se pueden obtener datasets muy interesantes cruzando estadísticas de población, empleo y contabilidad nacional por Comunidades Autónomas.

Análisis Discriminante: laboral

Microdatos relativos a la encuesta de estructura salarial de las personas en 2018. Salario bruto, Edad y Antigüedad en el trabajo y días de vacaciones al año del encuestado con el fin de clasificar los estudios (o bien tienen pocos estudios o bien muchos) de una persona en función de las anteriores variables.
Técnica estadística: Análisis Discriminante
Temas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial
Número de observaciones: 99782

Análisis Discriminante: salud

Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso y Edad del encuestado con el fin de clasificar el sexo de una persona en función de las anteriores variables.
Técnica estadística: Análisis Discriminante
Temas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 23089

Cluster Jerárquico: VarCovid

Este dataset presenta un conjunto de datos de las Tasas de variación de fallecidos en 2020 respecto al año anterior. Destacar que que 2020 fue el año del COVID y 1Ola, 2Ola, 3Ola corresponden a las semanas en las que se dieron dichas olas.
Técnica estadística: Cluster Jerárquico
Temas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 20

Cluster Jerárquico: VarCovid_provincias

Datos por provincias del exceso de mortalidad durante las cinco primeras olas de COVID-19 en comparación con las personas fallecidas en el mismo periodo de los años 2017, 2018 y 2019, años previos a la pandemia, una estadística con carácter experimental.
Técnica estadística: Cluster Jerárquico
Temas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 53

Cluster Jerárquico: desigualdad_CCAA

Este dataset presenta un conjunto de datos sobre el salario medio anual de hombres y mujeres en España, relativos a años 2017/18.
Técnica estadística: Cluster Jerárquico
Temas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial (INE)
Número de observaciones: 17

Cluster Jerárquico: ecv_cluster

Datos por Comunidades Autónomas sobre la tasa de riesgo de pobreza, la carencia material o la situación laboral que encontramos dentro de la Encuesta de Condiciones de Vida (ECV). Datos correspondientes al año 2021.
Técnica estadística: Cluster Jerárquico
Temas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 19

Cluster K-Means: VarCovid

Este dataset presenta un conjunto de datos de las Tasas de variación de fallecidos en 2020 respecto al año anterior. Destacar que que 2020 fue el año del COVID y 1Ola, 2Ola, 3Ola corresponden a las semanas en las que se dieron dichas olas.
Técnica estadística: Cluster K-Means
Temas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 20

Cluster K-Means: desigualdad_CCAA

Este dataset presenta un conjunto de datos sobre el salario medio anual de hombres y mujeres en España, relativos a años 2017/18.
Técnica estadística: Cluster K-Means
Temas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial (INE)
Número de observaciones: 17

Cluster K-Means: ecv_cluster

Datos por Comunidades Autónomas sobre la tasa de riesgo de pobreza, la carencia material o la situación laboral que encontramos dentro de la Encuesta de Condiciones de Vida (ECV). Datos correspondientes al año 2021.
Técnica estadística: Cluster K-Means
Temas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 19

Cluster K-Means: salario_kmeans

Este dataset presenta un conjunto de datos sobre el salario medio de los trabajadores y la población en las comunidades autónomas junto a Ceuta y Melilla, relativos al año 2018.
Técnica estadística: Cluster K-Means
Temas: Mercado laboral y salarios, Demografía y población
Operaciones: Cifras Oficiales de Población de los Municipios Españoles , Encuesta Anual de Estructura Salarial
Número de observaciones: 18

Reducción Dimensionalidad - Análisis Factorial: ECV_factorial

Este dataset presenta un conjunto de microdatos relativos a la ECV donde se puntua el nivel de satisfacción en determinados ámbitos de la vida (laboral, económico, relaciones personales..). El objetivo es llevar a cabo un análisis factorial
Técnica estadística: Reducción Dimensionalidad - Análisis Factorial
Temas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 26883

Reducción Dimensionalidad - Análisis Factorial: pisa_factorial

Este dataset presenta un conjunto de microdatos relativos a la prueba PISA que trata de medir la existencia de variables socioeconómicas, metacognitivas, motivacionales e, incluso, emocionales, que pueden tener impacto sobre el rendimiento académico. El objetivo es llevar a cabo un análisis factorial.
Técnica estadística: Reducción Dimensionalidad - Análisis Factorial
Temas: Educación y formación
Operaciones: Ministerio Educación
Número de observaciones: 35943

Reducción Dimensionalidad - PCA: IMCV_pca

Datos por Comunidades Autónomas de las nueve dimensiones relativos a la calidad de vida que componen el Índice Multidimensional de Calidad de Vida (IMCV), una estadística con carácter experimental. Datos correspondientes al año 2020.
Técnica estadística: Reducción Dimensionalidad - PCA
Temas: Estadística Experimental
Operaciones: Estadística experimental
Número de observaciones: 20

Reducción Dimensionalidad - PCA: MercadoHipotecas

Este dataset presenta los datos de estudio del mercado de adquisición de viviendas en propiedad en todas las comunidades autónomas durante el ejercicio 2021, relacionando las transmisiones inmobiliarias con las hipotecas constituidas, los índices de precio de vivienda y otras variables económicas y sociodemográficas. Orientado a escalamiento multidimensional, técnicas de clusterización y análisis de componentes principales.
Técnica estadística: Reducción Dimensionalidad - PCA
Temas: Construcción y vivienda. Demografía y población. Nivel, calidad y condiciones de vida
Operaciones: Censos de Población y Viviendas 2021 INE , Indicadores Demográficos Básicos , Tablas de mortalidad , Encuesta de Población Activa (EPA). , Estadística de Transmisiones de Derechos de la Propiedad , Estadística de Hipotecas , Índice de Precios de la Vivienda (IPV)
Número de observaciones: 19

Reducción Dimensionalidad - PCA: Situacion_sanitaria

Datos para las Comunidades Autónomas, abordando sobre aspectos demográficos y de salud. Contiene variables como la tasa de natalidad y mortalidad, el índice de envejecimiento, tasas de profesionales de la salud (médicos y enfermeros) por cada 100,000 habitantes, el porcentaje de inaccesibilidad a medicamentos recetados por razones económicas y la tasa media de morbilidad hospitalaria debido a enfermedades.
Técnica estadística: Reducción Dimensionalidad - PCA
Temas: Demografía y población
Operaciones: Indicadores demográficos básicos , Estadística de profesionales sanitarios colegiados , Encuesta europea de salud en España
Número de observaciones: 17

Reducción Dimensionalidad - PCA: provincias_variado

El conjunto de datos abarca información diversa sobre variables socioeconómicas en provincias y ciudades autónomas. Contiene datos como número de explotaciones agrícolas, superficies agrícolas, indicadores de empleo, ejecuciones hipotecarias, empresas por sector, PIB per cápita y datos demográficos. Este conjunto de variables puede ser útil para aplicar técnicas de reducir la dimensionalidad y entender las relaciones entre las diferentes variables.
Técnica estadística: Reducción Dimensionalidad - PCA
Temas: Agricultura, ganadería, selvicultura y caza. Construcción y vivienda. Demografía y población. Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Población Activa , Estadística sobre Ejecuciones Hipotecarias. (INE) , Explotación Estadística del Directorio Central de Empresas , Contabilidad Regional de España , Estadística de migraciones , Estadística del Padrón Continuo , Censo Agrario , Estadística de prestaciones por desempleo. (Ministerio de Trabajo y Economía Social) , Estadística de apoyo a la creación de empleo.(Ministerio de Trabajo y Economía Social)
Número de observaciones: 52

Regresión Lineal: IMCV_reg

Datos por Comunidades Autónomas de ocho de las nueve dimensiones relativas a la calidad de vida que componen el Índice Multidimensional de Calidad de Vida (IMCV), una estadística con carácter experimental. Datos correspondientes al año 2020 y 2021 .
Técnica estadística: Regresión Lineal
Temas: Estadística Experimental
Operaciones: Estadística experimental
Número de observaciones: 38

Regresión Lineal: matrimonios_reg

Dataset con número de matrimonios en las ciudades españolas (de entre 50.000 y 300.000 habitantes), número total de habitantes, número de mujeres y número de nacimientos que ha habido ese año. Datos correspondientes a 2022.
Técnica estadística: Regresión Lineal
Temas: Demografía y población
Operaciones: Cifras Oficiales de Población de los Municipios Españoles: Revisión del Padrón Municipal , MNP: Estadística de Matrimonios , MNP: Estadística de Nacimientos
Número de observaciones: 133

Regresión Lineal: salud_reg

Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso, Edad Sexo e IMC del encuestado con el fin de hacer una regresión del Peso en función del resto de variables y explicar por qué es interesante este estudio.
Técnica estadística: Regresión Lineal
Temas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 22019

Regresión Logística: ECV_microdatos

Microdatos extraidos de la Encuesta de Condiciones de Vida (ECV) del año 2019. El objetivo es estimar si la calidad de vida de una persona ha mejorado respecto a su infancia , de acuerdo con su año de nacimiento y su nivel de estudios.
Técnica estadística: Regresión Logística
Temas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV)
Número de observaciones: 17463

Regresión Logística: Partos

Datos relativos a partos en 2022 en la Comunidad Autónoma de Navarra. El objetivo es clasificar los partos en si hubo o no una cesárea en función de la edad de la madre, las complicaciones en el parto y las semanas de gestación.
Técnica estadística: Regresión Logística
Temas: Demografía y población
Operaciones: Estadística de nacimientos. Movimiento natural de la población
Número de observaciones: 2809

Regresión Logística: laboral

Microdatos relativos a la encuesta de estructura salarial de las personas en 2018. Salario bruto, Edad y Antigüedad en el trabajo y días de vacaciones al año del encuestado con el fin de clasificar los estudios (o bien tienen pocos estudios o bien muchos) de una persona en función de las anteriores variables.
Técnica estadística: Regresión Logística
Temas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial
Número de observaciones: 99782

Regresión Logística: salud

Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso y Edad del encuestado con el fin de clasificar el sexo de una persona en función de las anteriores variables.
Técnica estadística: Regresión Logística
Temas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 23089

Series Temporales - ARIMA: Paro

Datos relativos al número de parados de España desde 2013 hasta 2024 con carácter trimestral.
Técnica estadística: Series Temporales - ARIMA
Temas: Mercado laboral y salarios
Operaciones: Encuesta de Población Activa (EPA)
Número de observaciones: 46

Series Temporales - ARIMA: ipc_series

Datos relativos a la serie del IPC mensual en españa desde 2002 hasta 2022.
Técnica estadística: Series Temporales - ARIMA
Temas: Precios
Operaciones: Índice de Precios de Consumo (IPC)
Número de observaciones: 252

Series Temporales - ARIMA: madrid_series

Datos relativos a la población de la CCAA de Madrid desde 1971 hasta 2022 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - ARIMA
Temas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 104

Series Temporales - ARIMA: navarra

Datos relativos a la población de la CCAA Navarra desde 1971 hasta 2021 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - ARIMA
Temas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 101

Series Temporales - Holt Winters: Paro

Datos relativos al número de parados de España desde 2013 hasta 2024 con carácter trimestral.
Técnica estadística: Series Temporales - Holt Winters
Temas: Mercado laboral y salarios
Operaciones: Encuesta de Población Activa (EPA)
Número de observaciones: 46

Series Temporales - Holt Winters: ipc_series

Datos relativos a la serie del IPC mensual en españa desde 2002 hasta 2022.
Técnica estadística: Series Temporales - Holt Winters
Temas: Precios
Operaciones: Índice de Precios de Consumo (IPC)
Número de observaciones: 252

Series Temporales - Holt Winters: madrid_series

Datos relativos a la población de la CCAA de Madrid desde 1971 hasta 2022 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - Holt Winters
Temas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 104

No matching items
Back to top