Llevo muchos años trabajando en proyectos de Business Intelligence, y me gusta, pero tengo una espinita clavada desde hace mucho tiempo, y quizás haya llegado ya el momento de hacer algo al respecto.
Cuando comencé a estudiar lo que era el Business Intelligence, un mundo nuevo en el que los datos se organizaban expresamente para facilitar y realizar de manera óptima tareas de análisis y descubrimiento de información, como parte de un proyecto típico de BI, se incluía algo llamado Data Mining, que habitualmente se planteaba como el último nivel, o la fase final, y opcional, del proyecto.
Cuando los datos ya estaban bien organizados, el Data Warehouse estaba creado, los informes operacionales por departamentos estaban operativos, y los analistas podían navegar por los datos recorriendo el modelo, o a través de informes analíticos, llegaba el momento del Data Mining. La minería de datos consistía básicamente en unas curiosas técnicas por las que gracias a herramientas que permitían aplicar sobre los datos del DWH algoritmos basados en métodos estadísticos, y algunos también de Inteligencia artificial, para crear modelos y terminar obteniendo patrones o relaciones ocultas entre los datos, o poder realizar clasificaciones y predicciones.
El Data Mining como precursor del Data Science
El Data Mining parecía algo superinteresante, y que podía aportar un gran valor a las empresas, y aprendí lo que pude sobre él, llegando incluso a hacer prácticas con herramientas como Synera, que ahora ya no existe como tal (aunque creo que la ha aprovechado otra herramienta), o Weka, que era y sigue siendo parte de la suite de Business Intelligence open source de Pentaho.
Mi ilusión era trabajar en un proyecto de BI en el que se abordara en algún momento la parte de minería de datos, pero eso no ha llegado a suceder, todos los proyectos de BI en los que he participado se han quedado siempre en el reporting, o se ha considerado que lo más sofisticado que se necesitaba hacer era un cuadro de mando, no parecía que la minería de datos interesara demasiado a las empresas, al menos en los sectores en los que yo me he movido.
El datamining se consideraba como algo demasiado específico, aplicable sólo a determinadas situaciones y determinados sectores como banca o seguros, y reservado para profesionales de perfil analista de negocio, y formación matemática o estadística.
Pero ahora todo está cambiando, parece que el Datamining resurge de sus cenizas como Data Science, un nombre que vende mejor y está despertando el interés de las empresas. Seguramente el Data Science triunfa porque la ventaja competitiva que puede aportar la información que ocultan los datos, internos y externos, es muy grande, y ahora el acceso a los datos externos es mucho más fácil y, sobretodo, porque el Data Science ya no se plantea como la última etapa de un proyecto de Business Intelligence, a la que es difícil llegar, si se llega, sino como una actividad independiente, trabajando sobre datos del Data Warehouse, o sobre datos desestructurados, internos o externos, que podemos obtener fácilmente gracias a los numerosos conectores y API’s que existen hoy en día, o utilizando técnicas de scrapping, actualmente mucho más fáciles de implementar.
El caso es que quizás haya llegado el momento de sacarme esa espinita, y formarme un poco más en Data Science, desempolvando mis antiguas prácticas de Datamining, probando a hacer algo con Weka, y como no, aprendiendo R y/o Python para Data Science, que son los lenguajes que se están llevando la palma en ‘la ciencia de los datos’. Hay muchos recursos gratuítos sobre R, o incluso cursos completos que me pueden ayudar, y con Python puedo comenzar implementando los ejemplos de algoritmos que vienen con el libro Mastering Machine Learning with scikit-learn.
Informe sobre Salarios y Competencias en Data Science y BI
Y volviendo a la pregunta inicial, si es mejor especializarse en Business Intelligence o Data Science, yo creo que todo es importante, y en mi caso creo que me puede aportar mucho valor completar mi experiencia profesional en BI con formación en Data Science, pero para alguien que comienza a encarrilar su carrera profesional la decisión de por dónde comenzar puede ser más complicada.
Un buen indicador siempre debe ser lo que demandan las empresas, lo que piden en las ofertas de trabajo, y lo que pagan en cada caso. En las ofertas de trabajo para España sigo viendo mucha más demanda de especialistas en software de BI como Cognos, MicroStrategy, SQL Server Analysis Services, Business Objects, OBI, Qlikview o Tableau, pero es cierto que ya hay muchas ofertas de trabajo en las que también se solicita como complemento conocimientos de R, o que directamente buscan perfiles de Data Science, expertos en SAS, R, Python.. y con experiencia en tratamiento de datos desestructurados y entornos o tecnología de Big Data.
Para saber lo que más valoran las empresas, y las especializaciones que mejor se pagan, puede resultar muy útil este informe sobre salarios y competencias en Data Science y BI, basado en los resultados de una encuesta a más de 3.800 profesionales IT de todo el mundo con actividades relacionadas con los datos. La mayoría son de Estados Unidos, y hay que tenerlo en cuenta con los salarios, que en cada país pueden necesitar un factor corrector importante, pero puede ser una buena ayuda a la hora de decidirse por formarse o dedicarse a un área, un software, un lenguaje de programación, o un sector empresarial.
Viendo el informe, como nota práctica en cuanto a lenguajes, para estar mejor valorado parece muy recomendable aprender Python y/o R, y no olvidarse de SQL. Aunque en el informe gana Python sobre R, yo creo que en España se utiliza más R, al menos en entornos relacionados con el Business Intelligence.
Comparativa de tendencias para Business Intelligence, Data Science y Big Data
Para terminar, hablando ya de tendencias generales, y para comprobar definitivamente si el Data Science es algo residual o minoritario como hace tiempo era el Data Mining o, por el contrario, despierta tanto interés como el BI o el Big Data, nada mejor que una comparativa de Data Science, Big Data y Business Intelligence en Google Trends, un estupendo indicador de ‘por dónde van los tiros’.
Esta comparativa de tendencias es fácil de interpretar en cuanto a interés de búsquedas, el Big Data gana de calle desde hace mucho tiempo, la tendencia ascendente ha sido arrasadora, pero parece que ha llegado a un punto de madurez y en el último año casi no ha tenido crecimiento, al contrario que el Data Science, que tiene una tendencia ascendente cada vez más pronunciada.
Tendencias de búsquedade Big Data, Business Intelligence y Data Science en todo el mundo
Tendencias de búsqueda de Big Data, Business Intelligence y Data Science en España
Tendencias de búsqueda de Big Data, Business Intelligence y Data Science en EEUU
He hecho la comparativa a nivel mundial, en Estados Unidos y en España, porque mirar hacia Estados Unidos en temas de tecnología de datos (y de otras cosas) es casi como consultar el futuro para otros países como España, y creo que esta tendencia no va a ser una excepción.
- En todas las gráficas, el Business Intelligence hace mucho tiempo fue sobrepasado en interés por el Big Data, y comenzó una tendencia decreciente, pero muy poco marcada, es decir, que no está tan de moda como antaño, pero sigue ahí.
- El Big Data ha arrasado al BI, y de media es el líder indiscutible, pero a nivel mundial ya no crece, en Estados Unidos decrece en interés, y aunque en España aún seguimos buscando mucho sobre Big Data pronto comenzaremos a buscar más sobre otras cosas ;)
- Finalmente, el Data Science es el joven aspirante a líder que a nivel mundial sobrepasó al Business Intelligence ya el año pasado, en EEUU lo hizo hace ya dos años, y en España lo acaba de alcanzar.
Lo más remarcable es que en EEUU Data Science despierta ya tanto interés en las búsquedas como Big Data, y ha acrecentado aún más su tendencia ascendente, así que lo previsible es que dentro de muy poco haya muchas más búsquedas de Data Science que de Big Data.
En España estamos aún en el punto en que Data Science alcanza a BI, pero no es difícil preveer lo que va a pasar, y puede ser una muy buena jugada entrar ahora en Data Science porque parece una apuesta ganadora, y seguramente la próxima cuestión ya no va a ser si me preparo para el Data Science o el Business Intelligence, sino si me especializo en Data Science o en Big Data.
¿Data Science o Big Data sí o sí?
Para terminar, sólo aclarar que aunque en tendencias de búsqueda el Business Intelligence parezca condenado por su tendencia decreciente, una cosa es lo que más interesa, o lo que está de moda, y otra lo que necesitan las empresas de nuestro entorno, tanto las grandes como las pymes, y no necesariamente lo que más sale en las noticias es lo que está mejor pagado o tiene más demanda. También se ha de tener en cuenta que el término Business Intelligence en muchos casos se ha convertido en Business Analytics, y que la analitica empresarial, o la visualización de datos son otros términos que habría que tener en cuenta.
Así, aunque todo ayuda como indicador, a nivel profesional siempre es recomendable informarse sobre lo que valoran las compañías que pagan los sueldos de los profesionales IT y, por supuesto, nunca olvidar los intereses personales, o lo que más nos gusta hacer, no hace falta estar en el área de los mejor pagados para estar igualmente satisfechos con nuestro trabajo.