ANÁLISIS DE DATOS SEMIESTRUCTURADOS CON FORMATO JSON EN EL SISTEMA DE ARCHIVOS DISTRIBUIDOS HADOOP

Jimmy Josué Peña Koo, Jorge Alfredo Colli Chi, José Ildefonso Espinosa Pacho

Resumen


El presente trabajo de investigación demuestra el proceso de tratamiento para datos semi-estructurados en formato JSON, por medio de técnicas de Big Data.  Para su desarrollo se empleó como herramienta principal la distribución de Linux Cloudera, este sistema operativo contiene un entorno de trabajo para gestionar información masiva y herramientas para el procesamiento de datos estructurados y semi-estructurados.  Para la demostración, se trabajó con un caso de estudio que contiene la información de contaminación del estado de México, los indicadores analizados son: ozono, dióxido de azufre, dióxido de nitrógeno, monóxido de carbono y partículas suspendidas pm10.

 


Palabras clave


Big Data, Cloudera, Hadoop, JSON

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.


 

ISSN: 2227-2690     RNPS: 2450


hit counter

Se encuentra indexada en: