Desmitificando algunas creencias sobre Big Data

Gartner ha publicado un documento que echa por tierra muchas creencias sobre Big Data ya establecidas entre las empresas.

El 73% de las empresas están invirtiendo o tienen planes de invertir en tecnologías relacionadas con Big Data en los próximos ejercicios.

Conscientes de los beneficios que puede aportar a sus negocios, la gran mayoría de las organizaciones dedicarán parte de sus partidas presupuestarias a este fin. No obstante, Big Data es literalmente una tecnología de futuro. Gran parte de las empresas aún están en fase de experimentación y no lo han implantado en proyectos reales.

Otras muchas organizaciones, sobre todo las pymes, aún desconocen las oportunidades de la analítica y procesamiento de grandes volúmenes de datos. Gartner ha publicado un documento que arroja luz sobre los mitos y verdades de Big Data.

En primer lugar la consultora lanza un mensaje tranquilizador para aquellas empresas que aún no han implantado la tecnología. Recuerda que sólo el 13% de las empresas consultadas en una reciente encuesta ha admitido tener en marcha proyectos con esta tecnología y que casi el 20% está aún desarrollando una estrategia.

El hecho de que cada vez dispongamos de mayores volúmenes de información no significa que el impacto de la información de mala calidad con respecto al total sea menor. Más bien al contrario. La gran mayoría de datos llega de fuentes externas y en ocasiones desconocidas, lo que aumenta la probabilidad de que los datos sean de mala calidad.

Muchas empresas creen que contar con soluciones de analítica avanzadas hace que la creación de bases de datos corporativas que integran y depuran información de fuentes distintas se innecesaria. Pero la realidad es que muchos proyectos de analítica utilizan estas bases de datos durante un análisis.

Los expertos de Gartner insisten además en la importancia de estos almacenes de datos, que tienen “la capacidad de soportar a una gran variedad de usuarios de una organización” y que no reemplazarán al menos de momento, a los denominados data lakes, un almacén de datos que guarda la información en formato original hasta que es utilizada.