Llamamos Citizen Data Scientists (Citizen DS) a aquellas personas cuya dedicación principal es ajena al área de analítica de datos pero que son capaces de llevar a cabo tareas de analítica avanzada con cierto nivel de sofisticación, como parte de su trabajo.
En cierto modo, los Citizen Data Scientists son como esos “power users” de Excel que puedes encontrar en cualquier área funcional, solo que ahora tienen a su disposición cantidades mucho mayores de datos.
Además, cuentan con herramientas que automatizan y simplifican tareas que, hasta hace bien poco, solo podían realizar los Data Scientists (DS) y los Data Engineers (DE).
Los Citizen Data Scientists son usuarios de negocio capaces de realizar tareas analíticas con cierto nivel de sofisticación.
Son uno de los frutos de la democratización de la ciencia de datos, tendencia imparable y ya muy asentada en algunas organizaciones.
Algo muy relevante para entender esta figura es que nadie se llama a sí mismo “Citizen Data Scientist”, igual que no existen tarjetas de visita con ese cargo. Siguen siendo quienes eran en sus departamentos, solo que el contexto de datos, la exigencia del negocio y el avance de la tecnología han avivado sus capacidades analíticas.
A menudo, el Citizen Data Scientist “se oculta” detrás de cargos como Business Analyst, Business Intelligence, Market Research… Aunque áreas como marketing o desarrollo de negocio son el hogar perfecto para estos perfiles, existen en todas las áreas: contabilidad, finanzas, logística, producción, ventas…
Por qué están en auge
Tres factores contribuyen principalmente al auge de los Citizen Data Scientists:
- La escasez de Data Scientists
- El creciente deseo (¡y necesidad!) de usar los datos con profundidad en todas las áreas del negocio
- Herramientas cada vez más avanzadas que “empoderan” al usuario de negocio para llevar a cabo tareas inalcanzables hasta ahora
Aunque la escasez de Data Scientists suele mencionarse como la principal causa para la popularización de este nuevo rol, soy de la opinión de que no debe utilizarse al Citizen DS como remedio ante la escasez de científicos de datos. Cada rol es la solución a un problema distinto, no intercambiable.
La diferencia principal entre los Data Scientists/Engineers y los Citizen Data Scientist, más allá de su formación y conocimientos, es que estos últimos realizan tareas analíticas exclusivamente relacionadas con su ámbito de trabajo principal.
Los DS y DE “puros” pueden afrontar iniciativas analíticas más ambiciosas, con impacto trasversal a muchos departamentos o relacionadas con objetivos estratégicos de toda la organización. Son también los responsables de crear la estructura analítica y de datos que permite el trabajo de los Citizen DS. Por tanto, no cabe sustituir a unos por otros.
Además, los Citizen DS se encuentran en una posición privilegiada para realizar tareas de Data/Business Translator, como nexo fundamental entre el área de analítica de datos y su área de negocio. A menudo, el valor aportado por estas personas es la clave del éxito de una iniciativa analítica.
Cómo promover la aparición de Citizen Data Scientists en una organización
En mi opinión, el Citizen Data Scientist ni nace ni se hace: se le detecta.
¿Por qué es así? Porque, en realidad, en las grandes organizaciones, el Citizen DS ya está ahí: ya está trabajando con grandes cantidades de datos, ya está usando herramientas avanzadas y ya se están tomando decisiones departamentales basadas en sus resultados. Lo que ocurre a menudo es que ni IT ni Analítica lo saben (o no lo quieren saber) y, como resultado, su trabajo es ineficiente.
Hay que detectar, como digo, a quienes ya están realizando ese rol pero, también, a quienes podrían adoptarlo con facilidad, por una mezcla de sus funciones actuales, sus capacidades y sus intereses personales.
Una vez detectado un/a Citizen Data Scientist, real o en potencia, lo que hay que hacer con ellos es potenciarlos por medio de:
- Formación en habilidades genéricas analíticas, en el uso de herramientas específicas y en mejores prácticas que eficienten su trabajo.
- Herramientas adecuadas a las peculiaridades de su rol; en este sentido, las plataformas de Machine Learning que lideran el mercado cuentan todas con características específicamente dirigidas a los Citizen DS (algunas incluso hacen de esto su principal argumento de venta).
- Un entorno de datos que facilite sus tareas analíticas; debe caracterizarse, como mínimo, por contar con un modelo de datos documentado en el que no quepan dudas sobre el significado de negocio de cada dato, así como por tener capacidades que faciliten el descubrimiento de los datos necesarios para cada iniciativa.
- Una comunidad a su alrededor que promueva la gestión y el intercambio de conocimiento, para evitar el trabajo en silos y la continua reinvención de la rueda.
- Directrices generales y mejores prácticas recomendadas en ámbitos como privacidad, seguridad o ética en el manejo de los datos y de sus conclusiones analíticas.
En un entorno en el que las compañías que toman decisiones basadas en los insights que extraen de los datos crecen por encima del 30% anual, no fomentar la aparición de Citizen Data Scientists y no potenciar sus capacidades solo puede calificarse como error estratégico.
Un gran artículo, Manuel. Es bueno encontrar artículos que no hablen de la COVID.
En mi empresa se ha hablado de nombrar a varias personas como algo parecido a «citizen data scientist». ¿Es bueno que se les dé ese nombre?
No sé, Alfonso, si tu pregunta es si es conveniente nombrarles explícitamente de alguna manera distintiva o si lo conveniente es llamarles «Citizen Data Scientists» (en lugar de por otra expresión más adecuada).
Creo que el nombre este es práctico y útil para que nos entendamos quienes pensamos sobre estas cosas y/o tenemos responsabilidades sobre su gestión. Sin embargo, yo no lo usaría como «etiqueta pública» para estas personas dentro de un programa de gestión del cambio. Principalmente, porque puede transmitir una idea distorsionada de cuál es su papel.
Soy más partidario de utilizar expresiones que guarden más relación con el rol principal de la persona. Recordemos que lo que distingue principalmente al Citizen DS es que su trabajo no es el de Data Scientist «generalista», sino que es una de las personas con mayor capacidad analítica de su área funcional.
Así que tendería más hacia nombres que representen eso bien: ¿por qué llamar a alguien «Citizen Data Scientist» pudiendo definir su trabajo mucho mejor como «Marketing Data Analyst», por ejemplo?
Al final, si nos quedamos en las etiquetas, habremos avanzado poco. Lo relevante es que esa persona tenga datasets bien curados con los que trabajar y herramientas que le permitan alcanzar conclusiones relevantes de manera ágil y eficiente. Esa es la clave, la única clave.
Que curioso, no sabía que existía eso, pero tiene toda la lógica porque hay demasiada gente que sabe de algo pero no tiene la formación reglada. Va a ser más común de lo que se piensa en el futuro.
Fíjate, Rosana, en que no es tanto una cuestión de si se tiene formación reglada o no como de que las tareas de un Citizen Data Scientist incluyen actividades que, hasta hace poco, estaban fuera de su alcance porque las herramientas existentes exigían ser un científico de datos «completo» para poder usarlas. Desde el momento en que existe tecnología que acerca esas capacidades avanzadas a roles de negocio, la barrera se ha reducido mucho.