Caso de estudio: IoT y reconocimiento de la actividad de una persona

IoT
Gracias al surgimiento del Internet de las Cosas, IoT (por el inglés Internet of Things), se pueden combinar sensores electrónicos siempre conectados y técnicas de aprendizaje máquina para poder controlar, gestionar y estudiar numerosos fenómenos. En este post presentamos un caso uso de aplicación de técnicas de Data Analytics empleando los datos proporcionados por la competición DrivenData del proyecto SPHERE (Sensor Platform for Healthcare in Residential Environment). Este proyecto nace con el objetivo de monitorizar el estado de salud de personas ancianas mediante una serie de sensores de bajo coste instalados en los hogares; de este modo se pueden realizar dichas actividades de control de forma no intrusiva y respetando la privacidad de los pacientes. En el post describimos los trabajos que hemos realizado para abordar la problemática planteada en este escenario.

Caso de estudio en psicología: Data Analytics aplicado al análisis de personalidad basado en el modelo Big Five

Big Five
Durante décadas, los psicólogos han centrado una gran parte de sus esfuerzos en el estudio y comprensión de la personalidad y el comportamiento humano. Se han diseñado diferentes modelos de análisis, algunos con mayor acogida que otros, a modo de cuestionarios, como herramienta para medir de forma cuantitativa y estandarizada los perfiles de los individuos bajo estudio y clasificarlos según modelos de personalidad. En este post vamos a describir un caso de estudio de aplicación de las técnicas de Data Analytics sobre datos recogidos en cuestionarios online de evaluación de la personalidad. El objetivo último de nuestro análisis es realizar un agrupamiento de los diferentes perfiles o tipos de personas en función de su personalidad, en nuestro caso usando el modelo Big Five, que intenta definir la personalidad en función de 5 grandes factores. En este post nos vamos a centrar en la fase de análisis preliminar de los datos.

Caso de estudio en smart cities: Modelado del ruido en la ciudad de Madrid (España)

Contaminación acústica
En este post presentamos un nuevo de caso estudio de aplicación de Data Analytics, en concreto, sobre técnicas de modelado predictivo de contaminación en la ciudad inteligente sostenible. Nuestro trabajo, realizado en 2013 en el contexto del proyecto Ciudad2020 como parte del modelado predictivo de la contaminación en la ciudad del futuro, y componente esencial del sistema de Gestión Integral de la información medioambiental, se centra en la contaminación acústica en la ciudad de Madrid (España). El estudio aborda un análisis completo y real de contaminación acústica en la ciudad de Madrid, utilizando los datos históricos del año 2012 aportados por el Departamento de Control Acústico, perteneciente al Área de Gobierno de Medio Ambiente y Movilidad del Ayuntamiento de Madrid. El conjunto de datos proporcionado está compuesto de medidas horarias, desde el 1/1/2012 hasta el 31/12/2012, de las 28 estaciones automáticas de medición de la Red de Vigilancia de la Calidad del Aire del Ayuntamiento de Madrid.

CRISP-DM Fase II. Data Understanding. Estudio y comprensión de los datos

Data Understanding
En este post seguimos con la descripción de las fases de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), en este caso describiendo la segunda fase, Data Understanding, estudio y comprensión de los datos disponibles en el proyecto.

Caso de estudio en People Analytics: análisis exploratorio de entrevistas de salida del TAFE

Entrevista de salida
En este post describimos un nuevo caso de estudio en People Analytics, en este caso, el análisis exploratorio de los datos recogidos en entrevistas de salida de empleados del sector de la educación. La mayoría de los departamentos de Recursos Humanos concienciados por realizar una política activa de gestión eficiente del talento de la organización, suelen llevar a cabo entrevistas de salida a los empleados que abandonan la organización. Dado que las organizaciones gastan una gran cantidad de dinero y recursos en el reclutamiento del personal, aunque ya es tarde para retener el talento, la información recogida por esas entrevistas de salida sobre los motivos del abandono sirve para dar luz sobre problemas de retención del talento de la organización, que deben ser detectados y resueltos lo antes posible para evitar futuros abandonos. Los datos empleados en nuestro caso de estudio han sido proporcionados por el departamento de empleo del TAFE (Technical and Further Education), instituciones educativas en Australia. Las entrevistas de salida del TAFE fueron desarrolladas para recoger las opiniones y actitudes de los empleados que abandonan los colleges e institutos, para identificar qué variables operacionales, organizativas o personales son las que afectan en la retención de los empleados. La información recogida es empleada para optimizar las iniciativas de atracción y retención del talento y para mejorar las prácticas en el trabajo para que el TAFE sea un lugar atractivo para los trabajadores de calidad.

CRISP-DM Fase I. Comprensión del negocio (Business Understanding)

Business Understanding
Como continuación de la introducción general a la metodología CRISP-DM (Cross Industry Standard Process for Data Mining) que hicimos en un post anterior, en este post vamos a describir un poco más en detalle la primera fase, Business Understanding, comprensión del negocio o la definición de necesidades del cliente.

Caso de estudio: predicción de donación de sangre

Donación de sangre
La donación de sangre es un ejercicio de solidaridad que salva muchas vidas en nuestro día a día. Por ello, se realizan numerosas campañas para concienciar a la población, especialmente en momentos en los que hay escasez en las reservas de los hospitales. En este post presentamos un caso de estudio de aplicación de Data Analytics para la predicción del número de donantes de sangre en un determinado periodo de tiempo, en un escenario concreto, empleando los datos de una competición de DataDriven.

CRISP-DM: La metodología para poner orden en los proyectos de Data Science

CRISP-DM
En un intento de normalización del proceso de descubrimiento de conocimiento, de forma similar a como se hace en ingeniería software para normalizar el proceso de desarrollo software, surgieron a finales de los 90 dos metodologías principales: CRISP-DM (Cross Industry Standard Process for Data Mining) y SEMMA (Sample, Explore, Modify, Model, and Assess). Ambas especifican las tareas a realizar en cada fase descrita por el proceso de análisis de datos, asignando tareas concretas y definiendo lo que es deseable obtener tras cada fase. De ellas, CRISP-DM era más completa y alcanzó incuestionablemente una mayor popularidad. En este post vamos a realizar una introducción a la metodología CRISP-DM, sus objetivos, fases de las que consta y tareas contenidas en cada fase, resumido de la guía del consorcio que propuso la metodología.

Caso de estudio: análisis de la demanda de bicicletas públicas (bike sharing)

Servicio de bicicletas públicas
En este post presentamos un caso de estudio realizado sobre una de las competiciones ofrecidas en la plataforma Kaggle en 2015, sobre la predicción de la demanda en alquiler de bicicletas públicas, o bike sharing. Aunque los datos proporcionados son del programa Capital Bikeshare de Washington, D.C. en Estados Unidos, este mismo análisis se podría llevar a cabo en España, en las diferentes ciudades donde existe el servicio de bicicletas públicas y cuyos datos están disponibles. Con este estudio preliminar hemos pretendido ilustrar cómo el empleo de las técnicas de Data Science permiten el análisis y la interpretación de un conjunto de datos, en este caso sobre uso de las bicicletas en las ciudades.

Evolución del pool de talento de la plantilla. Análisis del talento mediante People Analytics (IV)

Evaluación del talento
El análisis de la evolución profesional de la plantilla de la empresa es otra de las contribuciones esenciales de la aplicación de People Analytics. Comparando las evaluaciones de un año a otro, se puede analizar qué empleados han evolucionado en su carrera profesional, tanto a nivel individual como colectivamente, y esta información puede emplearse para evaluar el impacto de las medidas de desarrollo de talento adoptadas por la organización.