Emerson Jim Vásquez Sandoval Jafert Frank Rabines Escorza Roller Elias Meza Geri
Contar palabras con
HADOOP Hadoop es una estructura de sofware de código abierto para almacenar datos y ejecutar aplicaciones en
clústeres de hardwar hardware e comercial. Proporciona almacenamiento masivo para cualquier po de datos, enorme poder de procesamiento y la capacidad de procesar tareas o trabajos concurrentes virtualmente ilimitados.
Caracteríscas •Capacidad para almacenar y procesar cantidades grandes de cualquier tipo de datos, y además de forma rápida: Con volúmenes y variedades de datos en constante aumento, especialmente desde las redes sociales y el Internet de las cosas (IoT), esa es una consideración clave. •Cuenta con Poder computacional: El modelo de computación distribuida de Hadoop es capaz de procesar grandes cantidades de datos rápidamente. Cuantos más nodos de computación use, más poder de procesamiento tendrá. •Tolerante a fallos: El procesamiento de aplicaciones y datos está protegido contra fallas del hardware. Si un nodo se cae, los trabajos se redirigen de forma automática a otros nodos para asegurarse de que la informática distribuida no falle. Varias copias de todos los datos se almacenan automáticamente. •Es muy Flexible: A diferencia de las bases de datos tradicionales, no es necesario procesar previamente los datos antes de almacenarlos. Puede almacenar tantos datos como usted guste y decidir cómo usarlos más adelante. Eso incluye datos no estructurados como imágenes, textos o vídeos. •Es de bajo costo: El marco de código abierto es totalmente gratuito y utiliza hardware básico para almacenar grandes cantidades de datos. •Es escalable: Puede hacer crecer fácilmente su sistema para manejar más datos simplemente agregando nodos. Se requiere poca administración. administración.
Iniciamos los servicios
Consola
Creamos directorio Creamos un directorio en el sistema de archivos hadoop
Copiamos el archivo de prueba Copiamos el archivo libros.txt al Sistema de archivos archiv os de HADOOP
Ejecutamos el comando mapreduce
Archivos generados Vericamos la salida del commando anterior
Usando el comando hds ds -cat /user/hadoop/output/part-r-00000
Se muestra el contenido del archivo de resultados donde se verá el conteo de palabras.
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.