PERFILES ANALÍTICOS EN EL MUNDO DIGITAL
El entorno de la analítica digital está en constante crecimiento. Son muchos los datos que se manejan en la red, y por eso se necesitan profesionales encargados de extraer conocimientos de las grandes bases de datos, llamadas en su conjunto Big Data. El mercado del Big Data, según estadísticas, no parará de crecer en los próximos años. Esto hace que surja la necesidad de nuevos profesionales con habilidades concretas en lo relacionado a este paradigma tecnológico.
Y es que
según Ginny Romety, CEO de IBM, el Big Data “es el recurso
natural del mundo para el próximo siglo”.
Según
John Akred, Fundador y CTO de Silicon Valley DataScience, el Big Data
se refiere a "la combinacion de un enfoque orientado a guiar la
toma de decisiones, con descubrimientos analíticos que se extraen de
los datos”.
El Big
Data lo podemos encontrar en la Web y medios sociales, en los datos
públicos, en el IoT y M2M en datos biométricos, en SaaS o
aplicaciones en la nube, datos transaccionales, de la Red, documentos
legales y también datos generados por humanos.
El Big
Data presenta problemas como el volumen(limitada capacidad de
almacenamiento de discos y dispositivos físicos), velocidad(el ritmo
al que se generan las transacciones no es lo suficientemente rápido),
variedad(muchos dispositivos y diferentes formatos que no se ajustan
a sus características) y valor(no son suficientes los datos, es
necesario analizar la información que obtenemos al interpretarlos), lo cual dificulta identificar a ciencia cierta su veracidad.
Por
ello el experto en Big Data es muy demandado. Por ejemplo, según el
ultimo informe de Gartner, el Big Data creará 4,4 millones de puestos
de trabajo.
El
Big Data se considera como una ciencia de datos, un campo
interdisciplinario que involucra métodos científicos, procesos y
sistemas para extraer conocimientos o un mejor entendimiento de datos
en sus diferentes formas, y sean estructurados o no estructurados, lo
cual es una continuación de algunos campos de análisis de datos
como la estadística, la minería de datos, el aprendizaje automático
y la analítica predictiva.
Además
del Big Data, también tenemos al Data scientist, que según Josh
Wills, Director de Data Science de Cloudera, se define como “una
persona que es mejor en estadística que cualquier ingeniero de
software, y mejor en ingeniería de software que cualquier
estadístico. Se ha llegado a denominar también como el “unicornio”
de los datos.
En
cuanto a las áreas de conocimiento de un científico de datos es la
conjunción de tres grandes áreas: la programación, las matemáticas
y el conocimiento del negocio.
Para
el desempeño de su trabajo el experto en Big Data tiene a su
disposición herramientas:
-Lenguajes
para el análisis de datos: Java, R,Phyton, Scala
-Frameworks
de procesamiento, como Hadoop, HDFS&MapReduce, Spark, Storm
-Herramientas
de ecocistemas de Hadoop: Hbase, Hive, Impala, Drill
-Herramientas
para la ingesta de información: ETL,WebScrapers, Flume, Sqoop
-Herramientas
de minería de datos, machine learning:Knime, Weka, Scipy, Numpy,
Scikit-learn
-Software
de análisis de datos:Spss, Matlab, Sas
-NoSQL:Mongo,Db,
Couchbase, Cassandra, Neo4j
-Y
mucho EXCEL
Además
de las matemáticas, programación y conocimientos sobre el negocio,
también se añaden las soft skills o habilidades
blandas:capacidad de comunicación, de contar historias, de
presentación el publico...que serán de suma ayuda en el trabajo de
un científico de datos.
En
cuanto al los perfiles profesionales, podemos encontrar perfiles de
la computación, de la gestión, matemáticos, estadísticos...
La
mayor parte del tiempo lo dedican a recolectar, limpiar y organizar
información.
En
definitiva, el Data Scientist realiza una ingesta de datos del mundo
físico, los limpia y procesa para conformar el Dataset. A
continuación, explora los datos, los representa, descubre y aprende
de ellos, para obtener un producto a partir del desarrollo y
visualización de indicadores.
Otra
profesión a tener en cuenta en el analista Web, encargado de
monitorizar y analizar los datos de una forma cuantitativa y
cualitativa.
El
Análisis de Datos (Data Analyisis o DA) es la ciencia que examina
datos en bruto con el propósito de sacar conclusiones sobre la
información. Tiene dos usos principales:
-Permitir
la toma de decisiones basada en datos.
-Para
verificar o validar modelos de teorías existentes.
Los
extractores de datos clasifican inmensos conjuntos de datos usando
software sotisficado para identificar patrones no descubiertos y
establecer relaciones escondidas.
La
ciencia se divide en:
-Análisis
exploratorio de datos (EDA) donde se descubren nuevas características
de los datos.
-Análisis
confirmatorio da datos (CDA) donde se prueba si las hipótesis
existentes son verdaderas o falsas
-Análisis
cuantitativo de datos(QDA) es usado en la ciencias sociales para
sacar conclusiones de datos numéricos, como palabras fotografías o
vídeos
Algunos
ejemplos son:
-Procesamiento
analítico en linea(OLAP)
-Análisis
de datos CRM en call center
-Análisis
de transacciones de tarjetas de crédito en busca de patrones de
consumo y fraude.
-Análisis
de patrones de navegación en sitios web para determinar la
potencialidad de la compra de determinados productos.
Los
niveles de analítica son:
-Descriptiva:
estudia qué esta pasando.
-Diagnóstica:
por qué está pasando lo que está pasando.
-Predictiva:
que va a pasar.
-Prescriptiva: recomendar
actuación en función a la analítica predictiva.
Es
importante tener en cuenta que el mundo de la analítica es un sector
de actividad muy orgánico y tenemos que buscar continuamente
patrones e indicadores.
Los
KPI'S(Key Performance Indicators) son indicadores clave que nos
permiten representar de una forma detallada y sintetizada el
rendimiento o progreso de nuestro negocio.
Las
métricas son datos a que también se utilizar para el análisis de
rendimiento pero no de forma tan detallada como los KPI's. Métricas
básicas son:visitantes únicos, visitas,páginas vistas,páginas por
visita, duración media de la visita, porcentaje de rebote, usuarios
nuevos, sesiones, tiempo de permanencia en el sitio, etc., todos
ellos nos ayudan a tener una visión global de la situación de la
empresa.
A continuación un vídeo donde se explica de forma simplificada el concepto de Big Data.
Comentarios
Publicar un comentario