Kuinka käyttää Hive-komentosarjoja?



Tämä on opetusohjelma Hive-komentosarjojen ajamisesta. Tämän komentosarjan suorittaminen vähentää aikaa ja vaivaa, joka kuluu jokaisen komennon kirjoittamiseen ja suorittamiseen manuaalisesti.

Apache Hive on Hadoopin päälle rakennettu tietovarastopaketti, jota käytetään yhä enemmän tietojen analysointiin, tiedonlouhintaan ja ennakoivaan mallintamiseen. Organisaatiot etsivät ammattilaisia, joilla on vahva pito . Tässä viestissä tarkastellaan kuinka Hive-komentosarjoja käytetään. Yleensä käytämme komentosarjoja suorittamaan joukko lauseita kerralla. Hive-skriptejä käytetään melko samalla tavalla. Se vähentää aikaa ja vaivaa, joka kuluu jokaisen komennon kirjoittamiseen ja suorittamiseen manuaalisesti.

Hive-skriptejä tuetaan Hive 0.10.0- ja uudemmissa versioissa. Koska Hive 0.90 -versio on asennettu CDH3: een, emme voi suorittaa Hive-komentosarjoja CDH3: ssa. Voit kokeilla seuraavia vaiheita CDH4: ssä, koska siihen on asennettu Hive 0.10.0 -versio. Oletko tietoinen kuinka luoda Hive-komentosarja? Jos ei, napsauta saada lisää selvennystä.





Master-Hive-Now

Katsotaan nyt, kuinka kirjoittaa komentosarjat Hiveen ja suorittaa ne CDH4: ssä:



Vaihe 1: Hive-komentosarjan kirjoittaminen.

Hive-komentosarjan kirjoittamiseksi tiedosto on tallennettava .sql-laajennuksella. Avaa pääte Cloudera CDH4 -jakelussa ja anna seuraava komento luoda Hive-komentosarja.
Komento: sudo gedit sample.sql

Suorittaessaan yllä olevan komennon se avaa tiedoston, jossa on luettelo kaikista suoritettavista Hive-komennoista.



Tässä komentosarjassa luodaan, kuvataan taulukko ja tiedot ladataan ja haetaan taulukosta.

1. Taulukon luominen pesässä:

Komento: luo taulukon tuote (productid: int, tuotenimi: merkkijono, hinta: kelluva, luokka: merkkijono) rivit muoto erotetut kentät, jotka päättyvät merkkiin

Tässä tuote on taulukon nimi ja {productid, tuotenimi, hinta, luokka} ovat tämän taulukon sarakkeita.

Kentät, joiden pääte on ”,” osoittavat, että syötetiedoston sarakkeet on erotettu symbolilla ”,”.

matriisin javascript-pituus

Oletusarvoisesti syötetiedoston tietueet erotetaan uudella rivillä.

2. Taulukon kuvaus:

Komento: kuvaa tuotetta

3. Ladataan tiedot taulukkoon.

Tietojen lataamiseksi taulukkoon on ensin luotava syötetiedosto, joka sisältää taulukkoon lisättävät tietueet.

Luodaan syötetiedosto.

Komento: sudo gedit input.txt

mikä on blockchain-kehittäjä

Muokkaa tiedoston sisältöä kuvan osoittamalla tavalla.

4. Tietojen noutaminen:

Tietojen noutamiseen käytetään select-komentoa.

Komento: Valitse tuotteesta *

Yllä olevaa komentoa käytetään kaikkien taulukossa olevien sarakkeiden arvon noutamiseen. Komentosarjan tulee olla sellainen kuin se näkyy alla olevassa kuvassa.

Nyt olemme kirjoittaneet Hive-käsikirjoituksen. Tiedosto sample.sql voidaan nyt tallentaa.

Vaihe 2: Suorituskyvyn komentosarjan suorittaminen

Seuraava on komento suorittaa Hive-komentosarja:

Komento: pesä –f /home/cloudera/sample.sql

Kun suoritat komentosarjaa, varmista, että komentosarjatiedoston sijainnin koko polku on läsnä.

Voimme nähdä, että kaikki komennot suoritetaan onnistuneesti.

Näin Hive-komentosarjat ajetaan ja suoritetaan CDH4: ssä.

Hive on kriittinen osa Hadoopia, ja asiantuntemuksesi Hivessa voi viedä sinulle parhaiten maksavia Hadoop-työpaikkoja! Edurekalla on erityisesti kuratoitu Hadoop-kurssi, joka auttaa sinua hallitsemaan konsepteja, kuten MapReduce, Lanka, Sika, Hive, HBase, Oozie, Flume ja Sqoop. Aloita napsauttamalla alla olevaa painiketta.

mikä on papu java

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

Aiheeseen liittyvät julkaisut:

Hive-komennot

Hive-tietomallit