ANÁLISIS DE DATOS SEMIESTRUCTURADOS CON FORMATO JSON EN EL SISTEMA DE ARCHIVOS DISTRIBUIDOS HADOOP
Palavras-chave:
Big Data, Cloudera, Hadoop, JSONResumo
El presente trabajo de investigación demuestra el proceso de tratamiento para datos semi-estructurados en formato JSON, por medio de técnicas de Big Data. Para su desarrollo se empleó como herramienta principal la distribución de Linux Cloudera, este sistema operativo contiene un entorno de trabajo para gestionar información masiva y herramientas para el procesamiento de datos estructurados y semi-estructurados. Para la demostración, se trabajó con un caso de estudio que contiene la información de contaminación del estado de México, los indicadores analizados son: ozono, dióxido de azufre, dióxido de nitrógeno, monóxido de carbono y partículas suspendidas pm10.