martes, 19 de julio de 2016

Cómo definir la evolución del rol de un científico de datos

En el reporte 25 Best Jobs in America for 2016, publicado recientemente, Glassdoor hizo una lista donde los científicos de datos figuran como la carrera Nro. 1 ‐pero no fue la profesión que solo lideró la lista en tecnología. Lideró en todas las industrias. 

El reporte cita 1.736 vacantes en este campo, con un salario promedio de 115.840 dólares y un puntaje general de trabajo de 4,7, de un total de 5, que son estadísticas prometedoras para una carrera que está creciendo rápido. Pero el ritmo rápido de crecimiento de los puestos para científicos de datos se ha topado con una severa falta de candidatos calificados. Y los negocios que contratan científicos de datos no tienen idea de cómo hacer un uso efectivo de sus habilidades.

De hecho, el McKinsey Global Institute le dio un vistazo a casi todas las industrias y encontró que, desde el 2009, casi todas las compañías con más de mil empleados en Estados Unidos tenían un promedio de 200TB de datos almacenados ‐y eso fue hace seis años. El estudio de datos se ha incrementado significativamente desde el 2009. En el 2016, todas las compañías de tecnología recolectan cantidades enormes de datos acerca de sus usuarios.

El estudio también ha revelado que, para el 2018, Estados Unidos podría enfrentarse a una escasez de científicos de datos calificados que oscila entre los 140 mil a 190 mil trabajadores.

Tye Rattenbury, director de Ciencia de los Datos de Trifacta, ha visto evolucionar el rol del científico de datos mientras que las compañías intentan descifrar cómo emplear apropiadamente a estos trabajadores. En lugar de contratar a los científicos de datos y pensar en el rol después, las empresas deben introducirse en una estrategia de datos con un plan claramente desarrollado para sacar el máximo provecho de su inversión, afirmó Rattenbury.

Defina las especificaciones del puesto
No se espera que los científicos de datos se limiten a manejar datos, sino que también sepan interpretarlos y comunicarlos efectivamente a otros. Pero la mayoría de científicos de datos se encuentran atascados en una ‘modalidad de mantenimiento’ ‐es decir, organizando y ensamblando datos en lugar de emplear su tiempo para analizarlos, de acuerdo a Rattenbury. “En cuanto a todas las cosas nuevas y emocionantes, existe bastante ambigüedad respecto a qué es posible, y cuáles son en realidad las mejores prácticas. Los grandes ganadores ﴾los científicos de datos individuales y las compañías que los contratan﴿ tendrán la disciplina de ver más allá de la extravagante publicidad y afinar las actividades que añadan valor”, señaló.

Aaron Beach, científico de datos en SendGrid, afirmó que la mejor manera de construir un rol para la ciencia de los datos es hacerlo de tal manera que no se abrume a los científicos con información ‐preferiblemente, el rol debe construirse en torno a la manera en que se deben analizar los datos en beneficio de la compañía. “La estrategia debería ser definida en términos de un proceso para la forma en que se planea traducir los datos brutos en información accionable para los que toman decisiones, no en términos de qué datos brutos son útiles o no”, dijo.

Una forma en que las empresas pueden obtener más de sus científicos de datos es concentrándose en construir el área de tal forma que no solo refleje las elevadas expectativas que se tienen sobre los datos, sino que esté basada en las necesidades del negocio. Por ejemplo, antes de contratar, una empresa debería saber cuántos científicos de datos va a necesitar su negocio, pero eso no puede ser determinado sin antes tener una estrategia clara que delimite qué datos son necesarios y cómo deben traducirse.

“La ciencia de los datos es un ‘trabajo’ definido de forma vaga, diversa e inmadura. Por esta razón, es imposible decir cuántos y qué tipo de científicos de datos va a necesitar la compañía, hasta que se defina claramente el trabajo y su relación con el negocio. En SendGrid, definimos el trabajo de la ciencia de los datos y su trayectoria profesional de acuerdo con cómo se relacionan con nuestro producto y con nuestro proceso de ingeniería ‐esto ayuda a responder las preguntas de cuántos científicos de datos necesitamos y define directamente el conjunto de habilidades que esos empleados requieren”, afirmó Beach.

Un enfoque coordinado
La ciencia de los datos es un campo nuevo y probablemente la mayoría de los científicos de datos tienen experiencia en análisis estadístico, experiencia en negocios o codificación, de acuerdo a Rattenbury. Pero él también señaló que solo porque puedan hacer todo eso, no significa necesariamente que deberían hacerlo. Usted debería centrarse en crear un enfoque más coordinado, con personas de múltiples habilidades, “En la mayoría de negocios, la variedad de los datos y la variedad de las potenciales aplicaciones de datos, requerirán de esfuerzos por parte de múltiples personas, lo que se puede lograr mejor cuando las personas adoptan roles especializados”, señaló Rattenbury.

Él mencionó que existen dos lugares en donde los científicos de datos pueden sobresalir en un negocio, y dónde deberían emplear la mayoría de su tiempo y energía. El primero, según Rattenbury, es alrededor de la ingesta de datos brutos o de la creación de datos. Eso significa que sus científicos de datos deberían centrar sus habilidades en encontrar la forma más útil de utilizar datos y las mejores maneras de almacenar y administrar los datos. El segundo es ver cómo los datos pueden beneficiar a la compañía, qué presupuestos necesitan establecerse para lograr las metas del negocio usando datos para “generar procesos automatizados dentro de la compañía”, indicó Rattenbury.

No sea codicioso
Los negocios también deberían evitar la codicia con los datos ‐porque la idea de querer demasiado de algo bueno ciertamente aplica a los datos. “Ellos podrían estar recolectando más datos de los que pueden explorar y cuya utilidad no pueden evaluar. Una forma de solucionar este problema es ser más selectivos respecto a qué datos analiza”, afirmó Rattenbury.

Y debido a que los datos son un concepto tan nuevo en los negocios, Rattenbury recomiendó un enfoque flexible para la estrategia de datos ‐un enfoque que considere qué debería cambiar mientras procede junto con una nueva iniciativa de datos. De esta manera, los negocios pueden considerar qué está funcionando, qué no, quiénes son los actores clave y el valor ligado a los puntos de datos específicos. Sin embargo, priorizar los datos de esta forma no solo es una tarea para los científicos de datos, sostiene, es una tarea que necesita incluir a toda la compañía. Los científicos de datos no pueden predecir o saber qué datos necesitarán todas las áreas, así que implementar estrategias efectivas de datos tiene que ser una tarea a nivel de toda la compañía, no una responsabilidad individual.

“Cuando un negocio hace explícito lo que puede cambiar y después pide a todos sus empleados que realicen una hipótesis respecto a cómo evaluar el valor relativo de varias combinaciones de cambio, usted ha incrementado efectivamente la capacidad de análisis del negocio. Este el cimiento para construir una cultura basada en los datos”, señaló Rattenbury. Un enfoque realista Aunque es grandioso tener un enfoque coordinado preparado, también necesita ser realista ‐ sin embargo, como dijo Rattenbury, la mayoría de negocios no tienen un plan preparado para los científicos de datos que contratan.Los negocios no deberían tratar de saltarse pasos o ahorrar dinero cuando construyen una estrategia basada en datos, porque los datos son más que otra iniciativa de negocio ‐son el futuro de la industria.

Por ejemplo, si en su negocio los datos tienen peso, podría necesitar contratar personas dedicadas a administrar los datos, y otras que los analicen, en lugar de esperar que uno o dos científicos lo hagan todo ellos solos. Tendría, a fin de cuentas, que contratar a más personas de las que había anticipado, porque los datos no pueden ser administrados y analizados solo por una o dos personas. Si desea sacar el máximo provecho de sus datos, necesita presupuesto, recursos y personal.

Esto también podría implicar separar a TI de la ciencia de datos, de acuerdo a Rattenbury. Eso no significa que deberían estar completamente separados, sino que deberían trabajar como equipos coordinados en vez de hacerlo como un mismo equipo. “Hablando en general, es mejor si TI y las organizaciones dedicadas a los datos no se reportan una con la otra. Deberían ser organizaciones compañeras combinándose en una organización central que pueda coordinar su trabajo”, afirmó.

Los negocios necesitan entender que los datos no es un concepto simple. Es un concepto que requiere bastante planificación, dedicación y recursos para triunfar. “Los datos son la clave para un entendimiento más profundo. Ciertamente van a existir compañías rezagadas luchando para alcanzar a sus semejantes. El balance clave aquí es cuántos recursos emplear para evolucionar y mejorar su uso de los datos versus lo que necesita para mantenerse competitivo”, señaló Rattenbury. científico de datos