Customer analytics: veni, vidi, vici

Customer analytics
Te enseñamos cómo el uso de tecnología Big Data nos permite obtener una visión de 360° de nuestros clientes y así poder ofrecerles lo que desean. De esta manera, se reduce el riesgo de abandono y podemos satisfacerlos y retenerlos más fácilmente.

ADAM: Automated Discovery and Analysis Machine

ADAM: Automated Discovery and Analysis Machine
En nuestro trabajo como científicos de datos nos encontramos todos los días con conjuntos de datos mal formateados, con valores ausentes o incorrectos y todo tipo de problemas que obstaculizan nuestro avance. Algunos estudios ("Cleaning Big Data: Most Time-Consuming, Least Enjoyable Data Science Task, Survey Says") han estimado que un 60% del tiempo de un científico de datos se invierte limpiando y formateando el conjunto de datos con el que se va a trabajar. Tras este proceso, viene la fase de análisis de datos, donde se estudian de forma sistemática los rangos de valores, los histogramas, las distribuciones de las variables y las correlaciones entre ellas. Después, en muchas ocasiones, gran parte del tiempo dedicado a la siguiente fase de modelado consiste en unas tareas de análisis bastante repetitivas, consistentes en procesos de selección del mejor algoritmo entre un conjunto de ellos mediante procedimientos más o menos automatizados (por ejemplo, en scikit-learn, empleando GridSearchCV) y/o selección de características empleando diferentes técnicas más o menos preestablecidas. Al final, en definitiva, cada proyecto de Data Analytics es en general bastante parecido a los demás en la metodología aplicada y las técnicas empleadas. Para ayudarnos en estas tareas sistemáticas y permitirnos dedicar nuestro tiempo a labores intelectuales y a optimizar las técnicas para el problema en concreto que estemos resolviendo, ahorrándonos el esfuerzo de realizar labores repetitivas, abordamos el desarrollo del sistema ADAM, acrónimo de Automated Discovery and Analysis Machine, un framework de ayuda al análisis automatizado de conjuntos de datos empleando tecnologías de Data Science.

Customer Analytics: ¿ya sabes lo que dicen de ti?

customer-analytics
Saber qué dice el cliente, cómo y cuándo es fundamental para las empresas que quieran destacar frente a sus competidores. La analítica se pone al mando y te dice cómo captar, retener y satisfacer a tus clientes.

Pronto dejaremos de oír hablar de Big Data

Multitud en estación
Predicción: dentro de unos años ya no se hablará de “Big Data”. En Estados Unidos el término “Big Data” ya está quedando obsoleto. Pronto lo estará aquí también.

CRISP-DM Fase V. Evaluation. Evaluación (obtención de resultados)

Evaluation
En este post seguimos con la descripción de las fases de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), aquí describiendo la quinta fase, Evaluation o evaluación de los modelos construidos en la anterior fase.

Caso de estudio en psicología: análisis de perfiles de personalidad

Big Five
En este post continuamos la descripción del caso de estudio de aplicación de Data Analytics en psicología, en concreto, al análisis de cuestionarios para detección de perfiles de personalidad, basado en el modelo Big Five. En un primer post describimos en detalle el contexto del caso de estudio, los datos disponibles, y presentamos el análisis de los datos. En este post abordamos la siguiente fase del análisis, según la metodología CRISP-DM, de modelado (IV. Modeling), estudiando la identificación de diferentes perfiles de personalidad según el modelo Big Five, aplicando técnicas de análisis de datos, en concreto, clustering con diferentes algoritmos y técnicas de reducción de dimensionalidad del conjunto de datos.

CRISP-DM Fase IV. Modeling. Modelado

Modeling
En este post seguimos con la descripción de las fases de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), aquí describiendo la cuarta fase, Modeling, propiamente la fase de modelado o análisis de los datos.

¿Qué es Real World Evidence y para qué sirve?

Real World Evidence. People walking
La austeridad y los recortes de precios relacionados con los medicamentos han puesto una presión sin precedentes en la industria farmacéutica. Se pide a los fabricantes que proporcionen información relacionada no sólo con la seguridad, el uso apropiado, y la eficacia, sino también sobre el valor clínico y económico de sus medicamentos. Real World Evidence se refiere a las pruebas que obtenemos a partir de datos usados para tomar decisiones sobre medicamentos o procedimientos médicos que se recogen fuera de los ensayos clínicos aleatorizados

Caso de estudio: análisis de encuestas a estudiantes de programación

Coder Survey
Free Code Camp es una comunidad de código abierto que tiene como objetivo enseñar a la gente a programar y a desarrollar proyectos para organizaciones sin ánimo de lucro. CodeNewbie es una comunidad internacional de ayuda para gente que está aprendiendo a programar. De manera conjunta, Free Code Camp y CodeNewbie diseñaron una encuesta y la distribuyeron a través de Twitter y listas de correo a más de 15 000 personas que están aprendiendo a programar. El objetivo era comprender sus motivaciones hacia la programación y cómo están aprendiendo a programar, cruzando esta información con datos demográficos (sexo, edad, etc.) y situación socioeconómica. La metodología y los resultados principales se han descrito en "We asked 15,000 people who they are, and how they’re learning to code". El dataset de respuestas obtenidas se ha liberado bajo la Open Database License y en Kaggle lo han propuesto como caso de estudio: 2016 New Coder Survey. En este post describimos el análisis exploratorio básico que hemos realizado sobre este dataset.

CRISP-DM Fase III. Data Preparation. Análisis de los datos y selección de características

Data Preparation
En este post seguimos con la descripción de las fases de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), en este caso describiendo la tercera fase, Data Preparation o análisis y preprocesado de datos.