ojos

jueves, 12 de diciembre de 2019

Big data

¿QUÉ ES BIG DATA?
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.

LAS 3V-S DEL BIG DATA:

1- volumen:
Tradicionalmente, los datos se han venido generando de forma manual. Ahora provienen de máquinas o dispositivos y se gestan de manera automática, por lo que el volumen a analizar es masivo. Esta característica del Big Data se refiere al tamaño de las cantidades de datos que se generan actualmente

2-velocidad:
El flujo de datos es masivo y constante. En el entorno del Big Data, los datos se generan y almacenan a una velocidad sin precedentes. Este gran volumen provoca que los datos queden desfasados rápidamente y que pierdan su valor cuando aparecen otros nuevos.

3-variedad:
El origen de los datos es altamente heterogéneo. Provienen de múltiples soportes, herramientas y plataformas: cámaras, smarthpones, coches, sistemas GPS, redes sociales, registros de viajes, movimientos bancarios, etc. A diferencia de hace unos años, cuando los datos que se almacenaban se extraían, principalmente, de hojas de cálculo y bases de datos.

LAS 5V’S DEL BIG DATA:

La cuarta dimensión del Big Data sería la veracidad, que es de gran importancia para un analista de datos. La veracidad puede entenderse como el grado de confianza  que se establece sobre los datos a utilizar. La veracidad de los datos determinará la calidad de los resultados y la confianza en los mismos.Desde el punto de vista de la recolección y explotación, la dimensión valor representa el aspecto más relevante del Big Data. A medida que aumenta el volumen y complejidad de los datos, su valor marginal disminuye, debido a su dificultad de explotación.

DATA WAREHOUSE:
Se trata de un repositorio centralizado, donde la empresa depura y almacena información de diferentes fuentes. Data warehouse se comporta como un almacén central integrando de esta forma los diferentes módulos que tiene la empresa.
En data warehouse los datos son cargados mediante el método ETL (concepto fundamental que engloba a todos los ámbitos del big data) que implica la extracción, transformación y carga de los datos.-Extracción :se trata de obtener la información de las distintas fuentes, tanto internas como externas.-Transformación : es el filtrado, limpieza, depuración, homogeneización y agrupación de la información.-Carga:  sobre la organización y actualización de los datos y metadatos en la base de datos
  
DATA MINING:
La minería de datos se puede definir como un conjunto de técnicas que sirven para analizar automáticamente la información, permitiendo descubrir conocimientos interesantes o patrones en los datos.Los profesionales que comprenden data mining saben que este tipo de técnicas de extracción de datos están diseñadas para explicar o comprender el pasado o también para predecir el futuro.Indiferentemente de cual sea el objetivo de la realización de este análisis de datos su fin será apoyar la toma de decisiones basadas en hechos y no en guiarse por intuiciones.

No hay comentarios:

Publicar un comentario