Hadoop

July 30, 2022 | Author: Anonymous | Category: N/A

Share Embed Donate

Report this link

Short Description

Download Hadoop...

Description

Integrantes: Delvis Pool Gusmán Chacón

Emerson Jim Vásquez Sandoval Jafert Frank Rabines Escorza Roller Elias Meza Geri

Contar palabras con

HADOOP Hadoop es una estructura de sofware de código abierto para almacenar datos y ejecutar aplicaciones en

clústeres de hardwar hardware e comercial. Proporciona almacenamiento masivo para cualquier po de datos, enorme poder de procesamiento y la capacidad de procesar tareas o trabajos concurrentes virtualmente ilimitados.

Caracteríscas •Capacidad para almacenar y procesar cantidades grandes de cualquier tipo de datos, y además de forma rápida: Con volúmenes y variedades de datos en constante aumento, especialmente desde las redes sociales y el Internet de las cosas (IoT), esa es una consideración clave. •Cuenta con Poder computacional: El modelo de computación distribuida de Hadoop es capaz de procesar grandes cantidades de datos rápidamente. Cuantos más nodos de computación use, más poder de procesamiento tendrá. •Tolerante a fallos: El procesamiento de aplicaciones y datos está protegido contra fallas del hardware. Si un nodo se cae, los trabajos se redirigen de forma automática a otros nodos para asegurarse de que la informática distribuida no falle. Varias copias de todos los datos se almacenan automáticamente. •Es muy Flexible: A diferencia de las bases de datos tradicionales, no es necesario procesar previamente los datos antes de almacenarlos. Puede almacenar tantos datos como usted guste y decidir cómo usarlos más adelante. Eso incluye datos no estructurados como imágenes, textos o vídeos. •Es de bajo costo: El marco de código abierto es totalmente gratuito y utiliza hardware básico para almacenar grandes cantidades de datos. •Es escalable: Puede hacer crecer fácilmente su sistema para manejar más datos simplemente agregando nodos. Se requiere poca administración. administración.

Iniciamos los servicios

Consola

Creamos directorio Creamos un directorio en el sistema de archivos hadoop

Copiamos el archivo de prueba Copiamos el archivo libros.txt al Sistema de archivos archiv os de HADOOP

Ejecutamos el comando mapreduce

Archivos generados Vericamos la salida del commando anterior

Usando el comando hds ds -cat /user/hadoop/output/part-r-00000

Se muestra el contenido del archivo de resultados donde se verá el conteo de palabras.

Resultado

Archivos generados

Directorio de archivos

Archivos

GRACIAS

Hadoop

Short Description

Description

Comments

We need your help!