PERFILES ANALÍTICOS EN EL MUNDO DIGITAL




El entorno de la analítica digital está en constante crecimiento. Son muchos los datos que se manejan en la red, y por eso se necesitan profesionales encargados de extraer conocimientos de las grandes bases de datos, llamadas en su conjunto Big Data. El mercado del Big Data, según estadísticas, no parará de crecer en los próximos años. Esto hace que surja la necesidad de nuevos profesionales con habilidades concretas en lo relacionado a este paradigma tecnológico.
Y es que según Ginny Romety, CEO de IBM, el Big Data “es el recurso natural del mundo para el próximo siglo”.

Según John Akred, Fundador y CTO de Silicon Valley DataScience, el Big Data se refiere a "la combinacion de un enfoque orientado a guiar la toma de decisiones, con descubrimientos analíticos que se extraen de los datos”.

El Big Data lo podemos encontrar en la Web y medios sociales, en los datos públicos, en el IoT y M2M en datos biométricos, en SaaS o aplicaciones en la nube, datos transaccionales, de la Red, documentos legales y también datos generados por humanos.

El Big Data presenta problemas como el volumen(limitada capacidad de almacenamiento de discos y dispositivos físicos), velocidad(el ritmo al que se generan las transacciones no es lo suficientemente rápido), variedad(muchos dispositivos y diferentes formatos que no se ajustan a sus características) y valor(no son suficientes los datos, es necesario analizar la información que obtenemos al interpretarlos), lo cual dificulta identificar a ciencia cierta su veracidad.

Por ello el experto en Big Data es muy demandado. Por ejemplo, según el ultimo informe de Gartner, el Big Data creará 4,4 millones de puestos de trabajo.

El Big Data se considera como una ciencia de datos, un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimientos o un mejor entendimiento de datos en sus diferentes formas, y sean estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.

Además del Big Data, también tenemos al Data scientist, que según Josh Wills, Director de Data Science de Cloudera, se define como “una persona que es mejor en estadística que cualquier ingeniero de software, y mejor en ingeniería de software que cualquier estadístico. Se ha llegado a denominar también como el “unicornio” de los datos.

En cuanto a las áreas de conocimiento de un científico de datos es la conjunción de tres grandes áreas: la programación, las matemáticas y el conocimiento del negocio.

Para el desempeño de su trabajo el experto en Big Data tiene a su disposición herramientas:
-Lenguajes para el análisis de datos: Java, R,Phyton, Scala
-Frameworks de procesamiento, como Hadoop, HDFS&MapReduce, Spark, Storm
-Herramientas de ecocistemas de Hadoop: Hbase, Hive, Impala, Drill
-Herramientas para la ingesta de información: ETL,WebScrapers, Flume, Sqoop
-Herramientas de minería de datos, machine learning:Knime, Weka, Scipy, Numpy, Scikit-learn
-Software de análisis de datos:Spss, Matlab, Sas
-NoSQL:Mongo,Db, Couchbase, Cassandra, Neo4j
-Y mucho EXCEL

Además de las matemáticas, programación y conocimientos sobre el negocio, también se añaden las soft skills o habilidades blandas:capacidad de comunicación, de contar historias, de presentación el publico...que serán de suma ayuda en el trabajo de un científico de datos.

En cuanto al los perfiles profesionales, podemos encontrar perfiles de la computación, de la gestión, matemáticos, estadísticos...

La mayor parte del tiempo lo dedican a recolectar, limpiar y organizar información.
En definitiva, el Data Scientist realiza una ingesta de datos del mundo físico, los limpia y procesa para conformar el Dataset. A continuación, explora los datos, los representa, descubre y aprende de ellos, para obtener un producto a partir del desarrollo y visualización de indicadores.

Otra profesión a tener en cuenta en el analista Web, encargado de monitorizar y analizar los datos de una forma cuantitativa y cualitativa.
El Análisis de Datos (Data Analyisis o DA) es la ciencia que examina datos en bruto con el propósito de sacar conclusiones sobre la información. Tiene dos usos principales:
-Permitir la toma de decisiones basada en datos.
-Para verificar o validar modelos de teorías existentes.

Los extractores de datos clasifican inmensos conjuntos de datos usando software sotisficado para identificar patrones no descubiertos y establecer relaciones escondidas.

La ciencia se divide en:
-Análisis exploratorio de datos (EDA) donde se descubren nuevas características de los datos.
-Análisis confirmatorio da datos (CDA) donde se prueba si las hipótesis existentes son verdaderas o falsas
-Análisis cuantitativo de datos(QDA) es usado en la ciencias sociales para sacar conclusiones de datos numéricos, como palabras fotografías o vídeos

Algunos ejemplos son:
-Procesamiento analítico en linea(OLAP)
-Análisis de datos CRM en call center
-Análisis de transacciones de tarjetas de crédito en busca de patrones de consumo y fraude.
-Análisis de patrones de navegación en sitios web para determinar la potencialidad de la compra de determinados productos.

Los niveles de analítica son:
-Descriptiva: estudia qué esta pasando.
-Diagnóstica: por qué está pasando lo que está pasando.
-Predictiva: que va a pasar.
-Prescriptiva: recomendar actuación en función a la analítica predictiva.


Es importante tener en cuenta que el mundo de la analítica es un sector de actividad muy orgánico y tenemos que buscar continuamente patrones e indicadores.
Los KPI'S(Key Performance Indicators) son indicadores clave que nos permiten representar de una forma detallada y sintetizada el rendimiento o progreso de nuestro negocio.
Las métricas son datos a que también se utilizar para el análisis de rendimiento pero no de forma tan detallada como los KPI's. Métricas básicas son:visitantes únicos, visitas,páginas vistas,páginas por visita, duración media de la visita, porcentaje de rebote, usuarios nuevos, sesiones, tiempo de permanencia en el sitio, etc., todos ellos nos ayudan a tener una visión global de la situación de la empresa.


A continuación un vídeo donde se explica de forma simplificada el concepto de Big Data.


Comentarios

Entradas populares de este blog

MÉTODO DE ANÁLISIS DE RIESGOS NIST SP 800-30

PRINCIPALES FACTORES DE RIESGO LABORAL EN LA DOCENCIA

AUTOCONTROL Y SUS BENEFICIOS EN EL TRABAJO