Apache Pig -asennus Linuxiin



Tämä blogi on vaiheittainen opas Apache Pig -asennukseen Linux-ympäristössä. Asennamme Apache Pig 0.16.0: n ja suoritamme sen eri tiloissa.

Tässä viestissä puhun Apache Pig -asennus Linuxiin . Aloitetaan Apache Pigin ja Pig Latinin perusmäärittelystä.

Apache-sika on työkalu / alusta Hadoopin kanssa käytetyn Map Reduce -ohjelman luomiseen ja suorittamiseen. Se on työkalu / alusta suurten tietojoukkojen analysointiin. Voit sanoa, että Apache Pig on abstraktio MapReducesta. Ohjelmoijat, jotka eivät ole niin hyviä Javassa, kamppailivat Hadoopin parissa, pääasiassa kirjoittamalla MapReduce-töitä.Joten, se on tärkeä aihe, jonka täytyy oppia ja hallita .Apache Pigilla on oma kielensä Sika Latinalainen mikä on hyötyä köyhille ohjelmoijille.





Pig Latin -opastuksen perusteet auttavat sinua ymmärtämään paremmin:

Apache Pig -alustalla käytettyä korkean tason menettelykieliä kutsutaan Sika Latinalainen . Apache Pig sisältää 'Pig Latin' -kielen, joka on suhteellisen yksinkertaisempi kieli, joka voi ajaa hajautettujen tietojoukkojen yli Hadoop-tiedostojärjestelmässä (HDFS). Apache Pig -sovelluksessa sinun täytyy kirjoittaa Pig-skriptejä Pig-latinankielellä, joka muunnetaan MapReduce-työhön, kun suoritat Pig-komentosarjan. Apache Pigilla on useita operaattoreita, joita käytetään tehtävien kuten lukemiseen, kirjoittamiseen ja tietojen käsittelyyn. Jos haluat oppia Apache Pig -operaattoreista, siirry blogiimme ' Operaattorit Apache Pigissa: Osa 1 - Relaatiooperaattorit ”.

Nyt kun sinulla on perustiedot Apache Pigista, aloitetaan Apache Pig -asennuksella Linuxissa.



Apache Pig -asennus Linuxiin:

Alla on Apache Pig -asennuksen vaiheet Linuxissa (ubuntu / centos / Windows käyttäen Linux VM: ää). Käytän Ubuntu 16.04 -ohjelmaa alla olevassa asennuksessa.

Vaihe 1: ladata Sika terva tiedosto.

komentoriviargumentit java-esimerkkikoodissa

Komento: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Lataa sika - sian asennus - Edureka

Vaihe 2: Pura terva tiedosto tar -komennolla. Tervan alla olevassa komennossa x tarkoittaa purkaa arkistotiedosto, kanssa tarkoittaa suodattaa arkiston gzipin kautta, f tarkoittaa arkistotiedoston tiedostonimeä.

Komento: terva -xzf sika-0.16.0.tar.gz

Komento: Ls

Vaihe 3: Muokkaa .bashrc ”Tiedosto päivittää Apache Pigin ympäristömuuttujat. Asetamme sen siten, että pääsemme sioihin mistä tahansa hakemistosta, meidän ei tarvitse mennä sikahakemistoon suorittamaan sika-komentoja. Jos jokin muu sovellus etsii Pigia, se tutustuu Apache Pigin polkuun tästä tiedostosta.

Komento: sudo gedit .bashrc

Lisää seuraava tiedoston loppuun:

# Aseta PIG_HOME

vienti PIG_HOME = / home / edureka / pig-0.16.0
vie PATH = $ PATH: /home/edureka/pig-0.16.0/bin
vie PIG_CLASSPATH = $ HADOOP_CONF_DIR

Varmista myös, että myös hadoop-polku on asetettu.

nukke kokin mahdollinen suolan vertailu

Suorita alla oleva komento, jotta muutokset päivitetään samassa terminaalissa.

Komento: lähde .bashrc

Vaihe 4: Tarkista sian versio. Tämän tarkoituksena on testata, että Apache Pig asennettiin oikein. Jos et saa Apache Pig -versiota, sinun on tarkistettava, oletko noudattanut yllä olevia ohjeita oikein.

Komento: sika-versio

Vaihe 5 :Tarkista sian ohje nähdäksesi kaikki sian komentovaihtoehdot.

Komento: sika -apu

mitä skanneri tekee java

Vaihe 6 :Käynnistä Possu aloittaaksesi murroskuoren. Grunt-kuorta käytetään Pig Latin -skriptien ajamiseen.

Komento: sika

Jos katsot yllä olevaa kuvaa oikein, Apache Pigilla on kaksi tilaa, joissa se voi toimia, ja se valitsee oletuksena MapReduce-tilan. Toinen tila, jossa voit käyttää Pigia, on Paikallinen-tila. Anna minun kertoa sinulle lisää tästä.

Suoritustilat Apache Pigissa:

  • MapReduce-tila - Tämä on oletustila, joka vaatii pääsyn Hadoop-klusteriin ja HDFS-asennukseen. Koska tämä on oletustila, -x-lippua ei tarvitse määrittää (voit suorittaa sika TAI sika -x kartanpienennä ). Tässä tilassa tulo ja lähtö ovat HDFS: llä.
  • Paikallinen tila - Kun kaikki tietokoneet ovat käytettävissä, kaikki tiedostot asennetaan ja suoritetaan paikallisen isännän ja tiedostojärjestelmän avulla. Tässä paikallinen tila määritetään käyttämällä -x-lippua ( sika -x paikallinen ). Tässä tilassa tulo ja lähtö ovat paikallisessa tiedostojärjestelmässä.

Komento: sika -x paikallinen

Voit käydä läpi alla olevan videon ja katsoa Apache Pig -asennusta Linuxissa:

Apache Pig -asennus | Sianasennus Linuxiin Edureka

Nyt kun olet suorittanut Apache Pig -asennuksen Linuxissa, seuraava askel eteenpäin on kokeilla joitain relaatio-Pig-operaattoreita Pig Grunt -kuoressa. Siksi seuraava blogi “ Operaattorit Apache Pigissa: Osa 1 - Relaatiooperaattorit ”Auttaa sinua hallitsemaan sikaoperaattoreita.

Nyt kun olet asentanut Apache Pigin Linuxiin, tutustu Edureka, luotettava verkko-oppimisyritys, jolla on yli 250 000 tyytyväisen oppijan verkosto, joka levisi ympäri maailmaa. Edureka Big Data Hadoop -sertifiointikoulutus auttaa oppijoita tulemaan HDFS-, Lanka-, MapReduce-, Pig-, Hive-, HBase-, Oozie-, Flume- ja Sqoop-asiantuntijoiksi käyttämällä reaaliaikaisia ​​käyttötapauksia vähittäiskaupan, sosiaalisen median, ilmailun, matkailun ja rahoituksen verkkotunnuksissa.

Onko sinulla kysymys meille? Mainitse se kommenttiosassa ja palaamme sinuun.