Coder Survey

Free Code Camp es una comunidad de código abierto que tiene como objetivo enseñar a la gente a programar y a desarrollar proyectos para organizaciones sin ánimo de lucro. CodeNewbie es una comunidad internacional de ayuda para gente que está aprendiendo a programar. De manera conjunta, Free Code Camp y CodeNewbie diseñaron una encuesta y la distribuyeron a través de Twitter y listas de correo a más de 15 000 personas que están aprendiendo a programar. El objetivo era comprender sus motivaciones hacia la programación y cómo están aprendiendo a programar, cruzando esta información con datos demográficos (sexo, edad, etc.) y situación socioeconómica.

La metodología y los resultados principales se han descrito en "We asked 15,000 people who they are, and how they’re learning to code". El dataset de respuestas obtenidas se ha liberado bajo la Open Database License y en Kaggle lo han propuesto como caso de estudio: 2016 New Coder Survey. En este post describimos el análisis exploratorio básico que hemos realizado sobre este dataset.

Descripción del conjunto de datos

El conjunto de datos del que se dispone está compuesto por 113 variables, que corresponden a otras tantas preguntas de la encuesta. Estas preguntas están agrupadas en dos partes: información demográfica sobre los estudiantes e información relativa a su aprendizaje de la programación.

Preguntas personales

  • Age (Edad)
  • Gender (Género)
  • CountryLive (Lugar de residencia)
  • CountryCitizen (Lugar de origen)
  • CityPopulation (Población de tu ciudad)
  • IsEthnicMinority (¿Eres una minoría étnica en tu país?)
  • LanguageAtHome (¿Qué idioma hablas en casa?)
  • SchoolDegree (Nivel de estudios)
  • SchoolMajor (¿Qué estudiaste en la universidad?)
  • FinanciallySupporting (¿Tienes personas a tu cargo?)
  • HasDebt (¿Tienes algún crédito?)
  • HasHomeMortgage (¿Tienes hipoteca?)
  • HomeMortgage (¿Cuánto debes de tu hipoteca?)
  • HasStudentDebt (¿Tienes algún crédito de estudiante?)
  • EmploymentStatus (Situación laboral)
  • EmploymentField (Sector de tu empleo)
  • Income (Ingresos en el último año)
  • CommuteTime (¿Cuánto tardas en ir y volver del trabajo?)
  • IsUnderEmployed (¿Te consideras subempleado?)
  • HasServedInMilitary (¿Has hecho el servicio militar?)
  • IsReceiveDisabilityBenefits (¿Recibes alguna prestación del Estado?)
  • HasHighSpeedInternet (¿Tienes Internet de alta velocidad en casa?)

Preguntas sobre programación

  • IsSoftwareDev (¿Trabajas como desarrollador?)
  • JobPref (Preferencia de tipo de empresa: startup, multinacional, etc)
  • JobRoleInterest (Puesto de trabajo de preferencia)
  • JobApplyWhen (¿Cuándo tienes pensado buscar trabajo como desarrollador?)
  • ExpectedEarning (¿Cuánto dinero esperas cobrar en tu primer año como desarrollador?)
  • JobWherePref (Preferencia de lugar de trabajo: oficina, en casa, etc)
  • JobRelocate (Disponibilidad para traslado)
  • CodeEvent (Participación en eventos de programación)
  • Resource (Plataformas de aprendizaje preferidas)
  • Podcast (Podcasts de programación preferidos)
  • HoursLearning (Horas semanales dedicadas al estudio)
  • MonthsProgramming (Meses programando)
  • Bootcamp (Asistencia a bootcamp: el nombre del bootcamp, si ha sido terminado, si lo recomendarías, si fue necesario un crédito, etc)
  • MoneyForLearning (Dinero invertido en formación de programación)

Aplicando técnicas de análisis de datos, se ha obtenido un perfilado demográfico de los estudiantes de programación que participaron en el sondeo que resulta interesante y revelador.

Edad

Si observamos el histograma de la variable de edad, podemos ver que la mayoría de los estudiantes pertecen al rango de edad de 20 a 30 años, siendo 25 la edad más frecuente y 27 años la edad media.

Género

Los estudiantes de programación son, en su mayor parte, hombres, con más de un 75% de los casos, porcentaje que está muy por encima del porcentaje de mujeres (21%).

Puesto de trabajo de preferencia

La mayoría de los estudiantes están interesados en dedicarse a la programación web, siendo su máxima preferencia llegar a ser Full-Stack developer. El ámbito que más interesa a los estudiantes después de la programación web es Data Science.

Trabajo actual

Al analizar el campo de trabajo de los estudiantes que están empleados actualmente, podemos observar que más de la mitad de los encuestados se dedica al sector de desarrollo de software e IT. Es un resultado esperable, puesto que es un campo que se encuentra en continuo desarrollo, y para el que es necesaria la continua actualización de aptitudes y conocimiento por parte de los profesionales del sector.


Preferencia de trabajo por edades

El interés por ser trabajador autónomo (freelance) aumenta con la edad, siendo esta la mayor preferencia para los mayores de 60 años. Los estudiantes menores de 30 años prefieren trabajar para una startup o empezar su propio negocio, mientras que esta preferencia disminuye con la edad. Trabajar para una empresa de tamaño mediano es la preferencia mayoritaria para los estudiantes de programación con edad comprendida entre los 20 años y los 50.

Sector laboral y subempleo

El sector en que los empleados se sienten menos subempleados es el de desarrollo de software, seguido del desarrollo de software e IT. Por el contrario, el sector donde los empleados se sienten más infravalorados en el trabajo es el sector de la restauración.

Disponibilidad para el traslado por edades

La disponibilidad para ser trasladado por trabajo decrece significativamente con la edad. Casi un 80% de los menores de 30 años estaría dispuesto a ser trasladado.


Participación en "Bootcamp”

Solo un 6% de todos los estudiantes de programación han formado parte de un programa de “bootcamp”. Entre los que sí lo han hecho, el “bootcamp” preferido es General Assembly, seguido de Flatiron School.

Recomendación de “bootcamps”

Se han tenido en cuenta los “bootcamps” con más de 10 asistentes, y se ha analizado la respuesta de los estudiantes que ya han terminado el “bootcamp” a la pregunta “¿Recomendarías este bootcamp?”. Los resultados revelan que el “bootcamp” más recomendado es Dev Academy, con un 100% de estudiantes satisfechos. Por el contrario, Galvanize fue el peor valorado, con menos de un 40% de participantes satisfechos.


Inversión en formación y salario esperado

Los estudiantes que invierten más dinero en su formación esperan, en general, un salario más alto en el futuro, aunque hay un número muy elevado de estudiantes que esperan un sueldo elevado, pese a invertir muy poco dinero en su educación (en muchos casos $0).


Ingresos actuales e inversión en formación

No hay una relación significativa entre los ingresos actuales de los estudiantes trabajadores y el dinero que invierten en formación, es decir, los estudiantes que tienen mayores ingresos no necesariamente los destinan a su educación.

Horas dedicadas al estudio y salario esperado

La cantidad de horas que los estudiantes dedican a aprender a programar no está relacionado con el salario que esperan obtener en el futuro. Esto implica que aquellas personas que esperan un sueldo más alto no dedican más horas a formarse para conseguir dicho objetivo.


Meses programando y horas dedicadas al estudio

Los estudiantes que llevan programando más tiempo tienden a dedicar menos horas, ya que es más sencillo aprender y ser capaz de dominar un nuevo lenguaje de programación cuando ya se tienen conocimientos de programación previos.

En media, los participantes en la encuesta empezaron a programar aproximadamente desde hace 11 meses.

Edad y horas dedicadas al estudio

La edad de los estudiantes no está relacionada con el número de horas que dedican al estudio.

Conclusiones

Con este caso de estudio queremos ilustrar cómo las técnicas de Data Science permiten la interpretación de un determinado escenario, en este caso sobre encuestas a estudiantes de programación. No hemos pretendido ser en absoluto exhaustivos y cubrir todas las posibles dimensiones de análisis. Simplemente, nuestra idea es mostrar que incluso con un sencillo análisis de variables, empleando técnicas de visualización como gráficos de barras, de tarta e incluyendo en algunos casos una recta de regresión, es posible extraer una serie de insights relevantes sobre el escenario en estudio, como que el sector de la programación es mayoritariamente de hombres.

Nuestro equipo puede abordar proyectos de Data Analytics como éste en cualquier escenario complejo con las máximas garantías de éxito. Si tiene cualquier pregunta o necesidad en estas áreas, por favor, no dude en contactar con nosotros: estaremos encantados de ayudarle.