¿Qué es la analítica de Big Data?

La inteligencia artificial (AI), la tecnología móvil, las redes sociales y el Internet de las cosas (IoT) están disparando la complejidad de los datos y generando nuevas formas y orígenes de los mismos. La analítica de big data es el uso de técnicas de analítica avanzada en grandes conjuntos de datos diversos, que incluyen datos estructurados, semi-estructurados y no estructurados, de distintos orígenes y en distintos tamaños, desde terabytes hasta zettabytes.

Big Data es un término aplicado a conjuntos de datos cuyo tamaño o tipo tiene una capacidad superior para capturar, gestionar y procesar los datos con baja latencia, en comparación con las bases de datos relacionales. Además, cuenta con una o más de las siguientes características: gran volumen, alta velocidad o gran variedad. El big data procede de sensores, dispositivos, vídeo/audio, redes, archivos de registros, aplicaciones transaccionales, web y redes sociales - gran parte de ellos son datos generados en tiempo real y a gran escala.

El análisis del big data permite a los analistas, investigadores y usuarios de negocio mejorar y agilizar las decisiones, utilizando datos que antes eran inaccesibles o inutilizables. La aplicación de técnicas de analítica avanzada, como el análisis de texto, el machine learning, la analítica predictiva, la minería de datos, las estadísticas y el procesamiento del lenguaje natural, permite a las empresas analizar fuentes de datos que no habían sido explotados, de forma independiente o conjuntamente con sus datos empresariales existentes, para extraer nuevos conocimientos que permitan mejorar y agilizar la toma de decisiones.

Casos de uso

Data Lake Analytics

Un data lake es un entorno de datos compartidos que comprende múltiples repositorios y aplica las tecnologías de big data. Proporciona datos a una organización para una gran variedad de procesos de analítica.

IBM Data Science Experience

La ciencia de datos es un campo interdisciplinario que combina machine learning, estadística, análisis avanzado y programación. Se trata de una nueva forma, que revela conocimientos ocultos y saca partido de los datos en la era cognitiva.

Apache™ Hadoop®

IBM se ha asociado con Hortonworks para ofrecer una distribución empresarial de Apache Hadoop. Esta plataforma de almacenamiento altamente escalable se ha diseñado para procesar conjuntos de datos de gran tamaño en cientos de miles de nodos de computación operando en paralelo. Proporciona una solución de almacenamiento rentable para grandes volúmenes de datos, sin requisitos de formato.

Recursos

La evolución del almacén de datos: Una base para la excelencia de la analítica

Redescubra el mejor enfoque para la gestión de datos y cómo las empresas están priorizando tecnologías de datos para impulsar el crecimiento y la eficiencia.

Dar sentido al Big Data

Un día en la vida de un Arquitecto Empresarial.

Productos

IBM Db2 Big SQL

Facilite la consulta de datos en toda la empresa con este motor SQL híbrido para Hadoop. Permite conectarse o consultar desde orígenes de datos dispares, como HDFS, RDMS, bases de datos NoSQL, almacenes de objetos y WebHDFS. Además, ofrece soporte de baja latencia para consultas complejas y ad-hoc, alto rendimiento, seguridad, compatibilidad de SQL y funcionalidades de federación para que pueda sacar el máximo partido de su almacén de datos y SQL en Hadoop.

IBM Big Replicate

Proporciona réplica empresarial para Apache™ Hadoop® y almacenes de objetos, ofreciendo disponibilidad continua, rendimiento y una coherencia de datos garantizada. El big data se replica desde el laboratorio a producción, desde producción a sitios de recuperación tras desastre o desde cero a almacenes de objetos en cloud, controlados por los requisitos normativos y empresariales más exigentes.

IBM Analytics for Apache™ Spark™

Incremente la agilidad de la analítica con el potencial del código abierto. Procese grandes volúmenes de datos a gran velocidad en un entorno alojado, gestionado y seguro.