Tutorial de cerdoManual de estudio

Published on 2023-04-20 00:10:05 · 中文 · English · بالعربية · हिंदीName · 日本語 · Русский язык · 中文繁體

Tutorial de Apache Pig

Apache Pig 教程
El tutorial de Pig proporciona conceptos básicos y avanzados de Pig. Nuestros tutoriales de Pig están diseñados tanto para principiantes como para profesionales.
Pig es una plataforma avanzada de transmisión de datos para ejecutar el programa Map Reduce de Hadoop. Fue desarrollado por Yahoo. El idioma de Pig es el latín del cerdo.
Nuestros tutoriales de Pig cubren el uso de Apache Pig y Pig, la instalación de Pig, los modos de ejecución de Pig, los conceptos de Pig Latin, los tipos de datos de Pig, ejemplos de Pig, todos los temas para las funciones definidas por el usuario de Pig y más

Que es Apache Pig

Apache Pig es una plataforma avanzada de transmisión de datos para ejecutar el programa MapReduce de Hadoop. El idioma utilizado por Pig es el latín Pig.
El script Pig se convierte internamente en un trabajo Map Reduce y se ejecuta en datos almacenados en HDFS. Además de esto, Pig también puede realizar su trabajo en Apache Tez o Apache Spark.
Pig puede procesar cualquier tipo de datos, estructurados, semiestructurados o no estructurados, y almacenar los resultados correspondientes en un sistema de archivos de datos Hadoop. Cada tarea que se puede lograr usando PIG también se puede implementar usando el java utilizado en MapReduce.

Características del Apache Pig

Veamos los diversos usos de la tecnología porcina.

1) Fácil de programar

Escribir programas Java complejos para Map Reduce puede ser bastante difícil para los no programadores. Pig hace que este proceso sea simple. En Pig, las consultas se convierten internamente a MapReduce.

2) Optimizar oportunidades

La forma en que se codifican las tareas permite que el sistema optimice automáticamente su ejecución, lo que permite a los usuarios centrarse en la semántica en lugar de la eficiencia.

3) Escalabilidad

Las funciones definidas por el usuario se escriben en las que el usuario puede escribir la lógica para ejecutarla.

4) Flexible

Puede manejar fácilmente datos estructurados y no estructurados.

5) Operadores incorporados

Contiene varios tipos de operadores, como ordenar, filtrar y unir.

La diferencia entre Apache MapReduce y PIG

Ventajas de Apache Pig

Menos código - Pig usa menos código para hacer cualquier cosa. Reutilización: el código Pig es lo suficientemente flexible como para ser reutilizado nuevamente. Tipos de datos anidados: Pig proporciona un concepto útil de tipos de datos anidados, como tuplas, paquetes y mapas.