Tässä viestissä puhun Apache Pig -asennus Linuxiin . Aloitetaan Apache Pigin ja Pig Latinin perusmäärittelystä.
Apache-sika on työkalu / alusta Hadoopin kanssa käytetyn Map Reduce -ohjelman luomiseen ja suorittamiseen. Se on työkalu / alusta suurten tietojoukkojen analysointiin. Voit sanoa, että Apache Pig on abstraktio MapReducesta. Ohjelmoijat, jotka eivät ole niin hyviä Javassa, kamppailivat Hadoopin parissa, pääasiassa kirjoittamalla MapReduce-töitä.Joten, se on tärkeä aihe, jonka täytyy oppia ja hallita .Apache Pigilla on oma kielensä Sika Latinalainen mikä on hyötyä köyhille ohjelmoijille.
Pig Latin -opastuksen perusteet auttavat sinua ymmärtämään paremmin:
Apache Pig -alustalla käytettyä korkean tason menettelykieliä kutsutaan Sika Latinalainen . Apache Pig sisältää 'Pig Latin' -kielen, joka on suhteellisen yksinkertaisempi kieli, joka voi ajaa hajautettujen tietojoukkojen yli Hadoop-tiedostojärjestelmässä (HDFS). Apache Pig -sovelluksessa sinun täytyy kirjoittaa Pig-skriptejä Pig-latinankielellä, joka muunnetaan MapReduce-työhön, kun suoritat Pig-komentosarjan. Apache Pigilla on useita operaattoreita, joita käytetään tehtävien kuten lukemiseen, kirjoittamiseen ja tietojen käsittelyyn. Jos haluat oppia Apache Pig -operaattoreista, siirry blogiimme ' Operaattorit Apache Pigissa: Osa 1 - Relaatiooperaattorit ”.
Nyt kun sinulla on perustiedot Apache Pigista, aloitetaan Apache Pig -asennuksella Linuxissa.
Apache Pig -asennus Linuxiin:
Alla on Apache Pig -asennuksen vaiheet Linuxissa (ubuntu / centos / Windows käyttäen Linux VM: ää). Käytän Ubuntu 16.04 -ohjelmaa alla olevassa asennuksessa.
Vaihe 1: ladata Sika terva tiedosto.
komentoriviargumentit java-esimerkkikoodissa
Komento: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz
Vaihe 2: Pura terva tiedosto tar -komennolla. Tervan alla olevassa komennossa x tarkoittaa purkaa arkistotiedosto, kanssa tarkoittaa suodattaa arkiston gzipin kautta, f tarkoittaa arkistotiedoston tiedostonimeä.
Komento: terva -xzf sika-0.16.0.tar.gz
Komento: Ls
Vaihe 3: Muokkaa .bashrc ”Tiedosto päivittää Apache Pigin ympäristömuuttujat. Asetamme sen siten, että pääsemme sioihin mistä tahansa hakemistosta, meidän ei tarvitse mennä sikahakemistoon suorittamaan sika-komentoja. Jos jokin muu sovellus etsii Pigia, se tutustuu Apache Pigin polkuun tästä tiedostosta.
Komento: sudo gedit .bashrc
Lisää seuraava tiedoston loppuun:
# Aseta PIG_HOME
vienti PIG_HOME = / home / edureka / pig-0.16.0
vie PATH = $ PATH: /home/edureka/pig-0.16.0/bin
vie PIG_CLASSPATH = $ HADOOP_CONF_DIR
Varmista myös, että myös hadoop-polku on asetettu.
nukke kokin mahdollinen suolan vertailu
Suorita alla oleva komento, jotta muutokset päivitetään samassa terminaalissa.
Komento: lähde .bashrc
Vaihe 4: Tarkista sian versio. Tämän tarkoituksena on testata, että Apache Pig asennettiin oikein. Jos et saa Apache Pig -versiota, sinun on tarkistettava, oletko noudattanut yllä olevia ohjeita oikein.
Komento: sika-versio
Vaihe 5 :Tarkista sian ohje nähdäksesi kaikki sian komentovaihtoehdot.
Komento: sika -apu
mitä skanneri tekee java
Vaihe 6 :Käynnistä Possu aloittaaksesi murroskuoren. Grunt-kuorta käytetään Pig Latin -skriptien ajamiseen.
Komento: sika
Jos katsot yllä olevaa kuvaa oikein, Apache Pigilla on kaksi tilaa, joissa se voi toimia, ja se valitsee oletuksena MapReduce-tilan. Toinen tila, jossa voit käyttää Pigia, on Paikallinen-tila. Anna minun kertoa sinulle lisää tästä.
Suoritustilat Apache Pigissa:
- MapReduce-tila - Tämä on oletustila, joka vaatii pääsyn Hadoop-klusteriin ja HDFS-asennukseen. Koska tämä on oletustila, -x-lippua ei tarvitse määrittää (voit suorittaa sika TAI sika -x kartanpienennä ). Tässä tilassa tulo ja lähtö ovat HDFS: llä.
- Paikallinen tila - Kun kaikki tietokoneet ovat käytettävissä, kaikki tiedostot asennetaan ja suoritetaan paikallisen isännän ja tiedostojärjestelmän avulla. Tässä paikallinen tila määritetään käyttämällä -x-lippua ( sika -x paikallinen ). Tässä tilassa tulo ja lähtö ovat paikallisessa tiedostojärjestelmässä.
Komento: sika -x paikallinen
Voit käydä läpi alla olevan videon ja katsoa Apache Pig -asennusta Linuxissa:
Apache Pig -asennus | Sianasennus Linuxiin Edureka
Nyt kun olet suorittanut Apache Pig -asennuksen Linuxissa, seuraava askel eteenpäin on kokeilla joitain relaatio-Pig-operaattoreita Pig Grunt -kuoressa. Siksi seuraava blogi “ Operaattorit Apache Pigissa: Osa 1 - Relaatiooperaattorit ”Auttaa sinua hallitsemaan sikaoperaattoreita.
Nyt kun olet asentanut Apache Pigin Linuxiin, tutustu Edureka, luotettava verkko-oppimisyritys, jolla on yli 250 000 tyytyväisen oppijan verkosto, joka levisi ympäri maailmaa. Edureka Big Data Hadoop -sertifiointikoulutus auttaa oppijoita tulemaan HDFS-, Lanka-, MapReduce-, Pig-, Hive-, HBase-, Oozie-, Flume- ja Sqoop-asiantuntijoiksi käyttämällä reaaliaikaisia käyttötapauksia vähittäiskaupan, sosiaalisen median, ilmailun, matkailun ja rahoituksen verkkotunnuksissa.
Onko sinulla kysymys meille? Mainitse se kommenttiosassa ja palaamme sinuun.