Tutorial de cerdoManual de estudio
Published on 2023-04-20 00:10:05 · 中文 · English · بالعربية · हिंदीName · 日本語 · Русский язык · 中文繁體
Tutorial de Apache Pig
El tutorial de Pig proporciona conceptos básicos y avanzados de Pig. Nuestros tutoriales de Pig están diseñados tanto para principiantes como para profesionales.
Pig es una plataforma avanzada de transmisión de datos para ejecutar el programa Map Reduce de Hadoop. Fue desarrollado por Yahoo. El idioma de Pig es el latín del cerdo.
Nuestros tutoriales de Pig cubren el uso de Apache Pig y Pig, la instalación de Pig, los modos de ejecución de Pig, los conceptos de Pig Latin, los tipos de datos de Pig, ejemplos de Pig, todos los temas para las funciones definidas por el usuario de Pig y más
Que es Apache Pig
Apache Pig es una plataforma avanzada de transmisión de datos para ejecutar el programa MapReduce de Hadoop. El idioma utilizado por Pig es el latín Pig.
El script Pig se convierte internamente en un trabajo Map Reduce y se ejecuta en datos almacenados en HDFS. Además de esto, Pig también puede realizar su trabajo en Apache Tez o Apache Spark.
Pig puede procesar cualquier tipo de datos, estructurados, semiestructurados o no estructurados, y almacenar los resultados correspondientes en un sistema de archivos de datos Hadoop. Cada tarea que se puede lograr usando PIG también se puede implementar usando el java utilizado en MapReduce.
Características del Apache Pig
Veamos los diversos usos de la tecnología porcina.
1) Fácil de programar
Escribir programas Java complejos para Map Reduce puede ser bastante difícil para los no programadores. Pig hace que este proceso sea simple. En Pig, las consultas se convierten internamente a MapReduce.
2) Optimizar oportunidades
La forma en que se codifican las tareas permite que el sistema optimice automáticamente su ejecución, lo que permite a los usuarios centrarse en la semántica en lugar de la eficiencia.
3) Escalabilidad
Las funciones definidas por el usuario se escriben en las que el usuario puede escribir la lógica para ejecutarla.
4) Flexible
Puede manejar fácilmente datos estructurados y no estructurados.
5) Operadores incorporados
Contiene varios tipos de operadores, como ordenar, filtrar y unir.