Hadoop

July 30, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Hadoop...

Description

 

Integrantes: Delvis Pool Gusmán Chacón

Emerson Jim Vásquez Sandoval Jafert Frank Rabines Escorza Roller Elias Meza Geri

Contar palabras con

 

HADOOP Hadoop es una estructura de sofware de código abierto para almacenar datos y ejecutar aplicaciones en

clústeres de hardwar hardware e comercial. Proporciona almacenamiento masivo para cualquier po de datos, enorme poder de procesamiento y la capacidad de procesar tareas o trabajos concurrentes virtualmente ilimitados.

 

Caracteríscas •Capacidad para almacenar y procesar cantidades grandes de cualquier tipo de datos, y además de forma rápida: Con volúmenes y variedades de datos en constante aumento, especialmente desde las redes sociales y el Internet de las cosas (IoT), esa es una consideración clave. •Cuenta con Poder computacional: El modelo de computación distribuida de Hadoop es capaz de procesar grandes cantidades de datos rápidamente. Cuantos más nodos de computación use, más poder de procesamiento tendrá. •Tolerante a fallos: El procesamiento de aplicaciones y datos está protegido contra fallas del hardware. Si un nodo se cae, los trabajos se redirigen de forma automática a otros nodos para asegurarse de que la informática distribuida no falle. Varias copias de todos los datos se almacenan automáticamente. •Es muy Flexible: A diferencia de las bases de datos tradicionales, no es necesario procesar previamente los datos antes de almacenarlos. Puede almacenar tantos datos como usted guste y decidir cómo usarlos más adelante. Eso incluye datos no estructurados como imágenes, textos o vídeos. •Es de bajo costo: El marco de código abierto es totalmente gratuito y utiliza hardware básico para almacenar grandes cantidades de datos. •Es escalable: Puede hacer crecer fácilmente su sistema para manejar más datos simplemente agregando nodos. Se requiere  poca administración. administración. 

 

Iniciamos los servicios

 

Consola

 

Creamos directorio Creamos un directorio en el sistema de archivos hadoop

 

Copiamos el archivo de prueba Copiamos el archivo libros.txt al Sistema de archivos archiv os de HADOOP

 

Ejecutamos el comando mapreduce

 

Archivos generados Vericamos la salida del commando anterior

 

Usando el comando hds ds -cat /user/hadoop/output/part-r-00000

Se muestra el contenido del archivo de resultados donde se verá el conteo de palabras.

Resultado

 

Archivos generados

 

Directorio de archivos

 

Archivos

 

GRACIAS

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF