Según la revista Harvard Business Review, la profesión de data scientist es la más atractiva del siglo XXI. Queda constatado que se trata de una carrera con gran futuro. De hecho, el estudio de StitchData revela que solo en los últimos cuatro años se han creado la mitad de los puestos que existen hoy en día de científicos de datos. ¿Quieres saber más sobre esta prometedora actividad?

Ya lo hemos comentado en otros artículos relacionados con big data. Para las empresas, los datos pueden convertirse en un activo del que extraer un gran beneficio. Y ya no es solo el beneficio, sino las pérdidas que le llega a ocasionar el no invertir en esta tecnología. No puede erigirse como competencia para otras empresas que sí invierten en big data dentro de su sector. Además, ya se están empleando los datos para optimizar incluso los procesos productivos.

Por este motivo, muchas empresas están recopilando gran cantidad de datos. Sin embargo, todavía no hay suficiente gente que se pueda hacer cargo de su procesamiento. En esa tarea la figura del data scientist es esencial. La falta de talento cualificado unido al gran rendimiento que puede aportar este profesional a la empresa justifican su sueldo. Se cobra desde los 32.000 euros anuales para un perfil junior a los 45.000 de uno senior, es decir, de 5 a 10 años de experiencia.

Qué es un data scientist y a qué se dedica

Las profesiones IT están cada vez más definidas. Hay muchas que se parecen, sin embargo contienen diferencias ya muy sustanciales. Se han ido creando especializaciones concretas. Por ejemplo, una profesión muy cercana es la de data engeniers. La diferencia entre un data engenier y un data scientist consiste en que los primeros se dedican a extraer información, guardarla y procesarla de una manera eficaz, mientras que los científicos de datos son los que verán el modo de explotarla.

La industria que más está reclamando este talento cualificado es la de las tecnologías de la información y servicios, a la que sigue la relacionada con Internet y software informático. Con una demanda también significativa se encuentran las compañías de seguros, financieras, consultorías y de ingeniería.

Entre los principales cometidos de un data scientist se encuentran los siguientes:

  • Analiza los datos en busca de patrones de comportamiento con los que se puedan generar modelos predictivos.
  • Agrupa datos en determinados valores que resulten operativos para el fin anterior.
  • Desarrolla algoritmos para resolver problemas y para construir herramientas con las que se puedan automatizar tareas.
  • Realiza un mantenimiento predictivo. Esto es, desarrolla técnicas para predecir cuándo hay indicios de un comportamiento extraño puede dañar algún elemento interno.

Trabajar de data scientist

Formación, habilidades y competencias de un buen data scientist

La frase que define la preparación de un data scientist la pronunció Josh Wills, ingeniero de datos de referencia: “Un data scientist es alguien que es mejor en estadística que cualquier programador y mejor en programación que cualquier estadístico”.

Ejercen esta profesión gente con titulación en matemáticas, física y, en general, las ciencias más puras, así como estadística y algunas ingenierías. Con respecto a estudios de posgrado, están muy bien considerados los especializados en las áreas de big data y en data science o ciencia de datos.

Según el informe StitchData, las cinco habilidades que los científicos de datos han calificado como principales son las siguientes: análisis de datos, R, Python, data mining o exploración de datos, y machine learning o aprendizaje automático. En general, son muy útiles los conocimientos matemáticos basados en estadística y algoritmos. Por ejemplo, probabilidad, álgebra lineal, cálculo, lógica, pruebas de hipótesis o estadística descriptiva.

Por otro lado, un data scientist también tiene que estar dotado para la comunicación, pues es quien pondrá al corriente a la empresa del resultado de su trabajo con informes comprensibles.

Como cualidad intrínseca, Pablo Gonzélez, data scientist en GMV, señala que lo que diferencia a un data scientist con respecto a sus compañeros: los data scientist requieren un nivel de abstracción mucho mayor. Esta es una capacidad que no puede faltar en un buen profesional.