Lista de datasets
Un dataset es un tabla de datos plana con observaciones por filas y variables por columnas. Los datasets son recursos educativos para universitarios muy útiles para practicar técnicas multivariantes o de series temporales. Así por ejemplo, sin necesidad de acudir a los microdatos, se pueden obtener datasets muy interesantes cruzando estadísticas de población, empleo y contabilidad nacional por Comunidades Autónomas.
Análisis Discriminante: laboral
Microdatos relativos a la encuesta de estructura salarial de las personas en 2018. Salario bruto, Edad y Antigüedad en el trabajo y días de vacaciones al año del encuestado con el fin de clasificar los estudios (o bien tienen pocos estudios o bien muchos) de una persona en función de las anteriores variables.
Técnica estadística: Análisis DiscriminanteTemas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial
Número de observaciones: 99782
Análisis Discriminante: salud
Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso y Edad del encuestado con el fin de clasificar el sexo de una persona en función de las anteriores variables.
Técnica estadística: Análisis DiscriminanteTemas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 23089
Cluster Jerárquico: VarCovid
Este dataset presenta un conjunto de datos de las Tasas de variación de fallecidos en 2020 respecto al año anterior. Destacar que que 2020 fue el año del COVID y 1Ola, 2Ola, 3Ola corresponden a las semanas en las que se dieron dichas olas.
Técnica estadística: Cluster JerárquicoTemas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 20
Cluster Jerárquico: VarCovid_provincias
Datos por provincias del exceso de mortalidad durante las cinco primeras olas de COVID-19 en comparación con las personas fallecidas en el mismo periodo de los años 2017, 2018 y 2019, años previos a la pandemia, una estadística con carácter experimental.
Técnica estadística: Cluster JerárquicoTemas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 53
Cluster Jerárquico: desigualdad_CCAA
Este dataset presenta un conjunto de datos sobre el salario medio anual de hombres y mujeres en España, relativos a años 2017/18.
Técnica estadística: Cluster JerárquicoTemas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial (INE)
Número de observaciones: 17
Cluster Jerárquico: ecv_cluster
Datos por Comunidades Autónomas sobre la tasa de riesgo de pobreza, la carencia material o la situación laboral que encontramos dentro de la Encuesta de Condiciones de Vida (ECV). Datos correspondientes al año 2021.
Técnica estadística: Cluster JerárquicoTemas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 19
Cluster K-Means: VarCovid
Este dataset presenta un conjunto de datos de las Tasas de variación de fallecidos en 2020 respecto al año anterior. Destacar que que 2020 fue el año del COVID y 1Ola, 2Ola, 3Ola corresponden a las semanas en las que se dieron dichas olas.
Técnica estadística: Cluster K-MeansTemas: Salud
Operaciones: Estimación de Defunciones Semanales
Número de observaciones: 20
Cluster K-Means: desigualdad_CCAA
Este dataset presenta un conjunto de datos sobre el salario medio anual de hombres y mujeres en España, relativos a años 2017/18.
Técnica estadística: Cluster K-MeansTemas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial (INE)
Número de observaciones: 17
Cluster K-Means: ecv_cluster
Datos por Comunidades Autónomas sobre la tasa de riesgo de pobreza, la carencia material o la situación laboral que encontramos dentro de la Encuesta de Condiciones de Vida (ECV). Datos correspondientes al año 2021.
Técnica estadística: Cluster K-MeansTemas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 19
Cluster K-Means: salario_kmeans
Este dataset presenta un conjunto de datos sobre el salario medio de los trabajadores y la población en las comunidades autónomas junto a Ceuta y Melilla, relativos al año 2018.
Técnica estadística: Cluster K-MeansTemas: Mercado laboral y salarios, Demografía y población
Operaciones: Cifras Oficiales de Población de los Municipios Españoles , Encuesta Anual de Estructura Salarial
Número de observaciones: 18
Reducción Dimensionalidad - Análisis Factorial: ECV_factorial
Este dataset presenta un conjunto de microdatos relativos a la ECV donde se puntua el nivel de satisfacción en determinados ámbitos de la vida (laboral, económico, relaciones personales..). El objetivo es llevar a cabo un análisis factorial
Técnica estadística: Reducción Dimensionalidad - Análisis FactorialTemas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV) (INE)
Número de observaciones: 26883
Reducción Dimensionalidad - Análisis Factorial: pisa_factorial
Este dataset presenta un conjunto de microdatos relativos a la prueba PISA que trata de medir la existencia de variables socioeconómicas, metacognitivas, motivacionales e, incluso, emocionales, que pueden tener impacto sobre el rendimiento académico. El objetivo es llevar a cabo un análisis factorial.
Técnica estadística: Reducción Dimensionalidad - Análisis FactorialTemas: Educación y formación
Operaciones: Ministerio Educación
Número de observaciones: 35943
Reducción Dimensionalidad - PCA: IMCV_pca
Datos por Comunidades Autónomas de las nueve dimensiones relativos a la calidad de vida que componen el Índice Multidimensional de Calidad de Vida (IMCV), una estadística con carácter experimental. Datos correspondientes al año 2020.
Técnica estadística: Reducción Dimensionalidad - PCATemas: Estadística Experimental
Operaciones: Estadística experimental
Número de observaciones: 20
Reducción Dimensionalidad - PCA: MercadoHipotecas
Este dataset presenta los datos de estudio del mercado de adquisición de viviendas en propiedad en todas las comunidades autónomas durante el ejercicio 2021, relacionando las transmisiones inmobiliarias con las hipotecas constituidas, los índices de precio de vivienda y otras variables económicas y sociodemográficas.
Orientado a escalamiento multidimensional, técnicas de clusterización y análisis de componentes principales.
Técnica estadística: Reducción Dimensionalidad - PCATemas: Construcción y vivienda. Demografía y población. Nivel, calidad y condiciones de vida
Operaciones: Censos de Población y Viviendas 2021 INE , Indicadores Demográficos Básicos , Tablas de mortalidad , Encuesta de Población Activa (EPA). , Estadística de Transmisiones de Derechos de la Propiedad , Estadística de Hipotecas , Índice de Precios de la Vivienda (IPV)
Número de observaciones: 19
Reducción Dimensionalidad - PCA: Situacion_sanitaria
Datos para las Comunidades Autónomas, abordando sobre aspectos demográficos y de salud. Contiene variables como la tasa de natalidad y mortalidad, el índice de envejecimiento, tasas de profesionales de la salud (médicos y enfermeros) por cada 100,000 habitantes, el porcentaje de inaccesibilidad a medicamentos recetados por razones económicas y la tasa media de morbilidad hospitalaria debido a enfermedades.
Técnica estadística: Reducción Dimensionalidad - PCATemas: Demografía y población
Operaciones: Indicadores demográficos básicos , Estadística de profesionales sanitarios colegiados , Encuesta europea de salud en España
Número de observaciones: 17
Reducción Dimensionalidad - PCA: provincias_variado
El conjunto de datos abarca información diversa sobre variables socioeconómicas en provincias y ciudades autónomas. Contiene datos como número de explotaciones agrícolas, superficies agrícolas, indicadores de empleo, ejecuciones hipotecarias, empresas por sector, PIB per cápita y datos demográficos.
Este conjunto de variables puede ser útil para aplicar técnicas de reducir la dimensionalidad y entender las relaciones entre las diferentes variables.
Técnica estadística: Reducción Dimensionalidad - PCATemas: Agricultura, ganadería, selvicultura y caza. Construcción y vivienda. Demografía y población. Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Población Activa , Estadística sobre Ejecuciones Hipotecarias. (INE) , Explotación Estadística del Directorio Central de Empresas , Contabilidad Regional de España , Estadística de migraciones , Estadística del Padrón Continuo , Censo Agrario , Estadística de prestaciones por desempleo. (Ministerio de Trabajo y Economía Social) , Estadística de apoyo a la creación de empleo.(Ministerio de Trabajo y Economía Social)
Número de observaciones: 52
Regresión Lineal: IMCV_reg
Datos por Comunidades Autónomas de ocho de las nueve dimensiones relativas a la calidad de vida que componen el Índice Multidimensional de Calidad de Vida (IMCV), una estadística con carácter experimental. Datos correspondientes al año 2020 y 2021 .
Técnica estadística: Regresión LinealTemas: Estadística Experimental
Operaciones: Estadística experimental
Número de observaciones: 38
Regresión Lineal: Sucidios
Este dataset presenta la tasa de suicidios que ocurre en España con distintas variables demográficas y económicas que pueden llegar a influir o no, por Comunidades Autónomas.
Técnica estadística: Regresión LinealTemas: Salud
Operaciones: Cifras Oficiales de Población de los Municipios Españoles: Revisión del Padrón Municipal , Encuesta de Población Activa (EPA) , Índice de Precios de Consumo , Estadística de Condenados: Menores (INE) , Contabilidad Regional de España , Estadísticas sobre Recogida y Tratamiento de Residuos , Estadística de Sociedades Mercantiles , Estadística de Defunciones según la Causa de Muerte , Estadística de Movimientos Turísticos en Frontera (FRONTUR) , Estadística de Violencia Doméstica y Violencia de Género , Estadística de Defunciones según la Causa de Muerte , Estadística del Procedimiento Concursal , (Ficha plan) Estadística sobre Actividades en ID , Encuesta de Presupuestos Familiares (EPF) , Estadísticas sobre las Actividades de Protección Medioambiental
Número de observaciones: 17
Regresión Lineal: matrimonios_reg
Dataset con número de matrimonios en las ciudades españolas (de entre 50.000 y 300.000 habitantes), número total de habitantes, número de mujeres y número de nacimientos que ha habido ese año. Datos correspondientes a 2022.
Técnica estadística: Regresión LinealTemas: Demografía y población
Operaciones: Cifras Oficiales de Población de los Municipios Españoles: Revisión del Padrón Municipal , MNP: Estadística de Matrimonios , MNP: Estadística de Nacimientos
Número de observaciones: 133
Regresión Lineal: salud_reg
Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso, Edad Sexo e IMC del encuestado con el fin de hacer una regresión del Peso en función del resto de variables y explicar por qué es interesante este estudio.
Técnica estadística: Regresión LinealTemas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 22019
Regresión Logística: ECV_microdatos
Microdatos extraidos de la Encuesta de Condiciones de Vida (ECV) del año 2019. El objetivo es estimar si la calidad de vida de una persona ha mejorado respecto a su infancia , de acuerdo con su año de nacimiento y su nivel de estudios.
Técnica estadística: Regresión LogísticaTemas: Nivel, calidad y condiciones de vida
Operaciones: Encuesta de Condiciones de Vida (ECV)
Número de observaciones: 17463
Regresión Logística: Partos
Datos relativos a partos en 2022 en la Comunidad Autónoma de Navarra. El objetivo es clasificar los partos en si hubo o no una cesárea en función de la edad de la madre, las complicaciones en el parto y las semanas de gestación.
Técnica estadística: Regresión LogísticaTemas: Demografía y población
Operaciones: Estadística de nacimientos. Movimiento natural de la población
Número de observaciones: 2809
Regresión Logística: laboral
Microdatos relativos a la encuesta de estructura salarial de las personas en 2018. Salario bruto, Edad y Antigüedad en el trabajo y días de vacaciones al año del encuestado con el fin de clasificar los estudios (o bien tienen pocos estudios o bien muchos) de una persona en función de las anteriores variables.
Técnica estadística: Regresión LogísticaTemas: Mercado laboral y salarios
Operaciones: Encuesta Anual de Estructura Salarial
Número de observaciones: 99782
Regresión Logística: salud
Microdatos relativos a la encuesta de Salud a personas en 2017. Altura, Peso y Edad del encuestado con el fin de clasificar el sexo de una persona en función de las anteriores variables.
Técnica estadística: Regresión LogísticaTemas: Salud
Operaciones: Encuesta Nacional de Salud (ENSE)
Número de observaciones: 23089
Series Temporales - ARIMA: Paro
Datos relativos al número de parados de España desde 2013 hasta 2024 con carácter trimestral.
Técnica estadística: Series Temporales - ARIMATemas: Mercado laboral y salarios
Operaciones: Encuesta de Población Activa (EPA)
Número de observaciones: 46
Series Temporales - ARIMA: ipc_series
Datos relativos a la serie del IPC mensual en españa desde 2002 hasta 2022.
Técnica estadística: Series Temporales - ARIMATemas: Precios
Operaciones: Índice de Precios de Consumo (IPC)
Número de observaciones: 252
Series Temporales - ARIMA: madrid_series
Datos relativos a la población de la CCAA de Madrid desde 1971 hasta 2022 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - ARIMATemas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 104
Series Temporales - ARIMA: navarra
Datos relativos a la población de la CCAA Navarra desde 1971 hasta 2021 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - ARIMATemas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 101
Series Temporales - Holt Winters: Paro
Datos relativos al número de parados de España desde 2013 hasta 2024 con carácter trimestral.
Técnica estadística: Series Temporales - Holt WintersTemas: Mercado laboral y salarios
Operaciones: Encuesta de Población Activa (EPA)
Número de observaciones: 46
Series Temporales - Holt Winters: ipc_series
Datos relativos a la serie del IPC mensual en españa desde 2002 hasta 2022.
Técnica estadística: Series Temporales - Holt WintersTemas: Precios
Operaciones: Índice de Precios de Consumo (IPC)
Número de observaciones: 252
Series Temporales - Holt Winters: madrid_series
Datos relativos a la población de la CCAA de Madrid desde 1971 hasta 2022 desagregados por sexo y con cáracter bianual.
Técnica estadística: Series Temporales - Holt WintersTemas: Demografía y población
Operaciones: Estadística Continua de Población (ECP)
Número de observaciones: 104
No matching items