Poraus alas Apache Drilliin, New-Age-kyselymoottoriin



Tämä Apache Drill -opetusohjelma antaa sinulle kaikki tarvittavat tiedot Apache Drill -kyselymoottorin käytön aloittamiseen, käytön Hadoopin kanssa, Big Data & Apache Spark.

Apache Drill on alan ensimmäinen skeematon SQL-moottori. Pora ei ole maailman ensimmäinen kyselymoottori, mutta se on ensimmäinen, joka löytää hienon tasapainon joustavuuden ja nopeuden välillä. Pora on suunniteltu skaalautumaan useisiin tuhansiin solmuihin ja kyselemään petatavuja dataa vuorovaikutteisilla nopeuksilla, joita BI / Analytics-ympäristöt edellyttävät.





Se voi integroida useisiin tietolähteisiin, kuten Hive, HBase, MongoDB, tiedostojärjestelmä, RDBMS. Myös syöttöformaatteja, kuten Avro, CSV, TSV, PSV, Parketti, Hadoop Sequence -tiedostoja ja monia muita, voidaan käyttää Drillissa helposti.

Miksi Apache Drill?

Apache Drillin suurin etu on, että se voi löytää mallin lennossa, kun kyselet tietoja. Lisäksi se voi toimia BI-työkaluidesi kanssa, kuten Tableau, Qlikview, MicroStrategy jne., Parempaan analytiikkaan.



Tässä on teollisuusanalyytikon lainaus, joka tiivistää Apache Drillin arvon:

'Drill ei ole vain SQL-on-Hadoop. Kyse on SQL-ohjelmasta, melkein missä tahansa, välittömästi ja ilman muodollisuuksia.

- Andrew Burst, Gigaom Research, tammikuu 2015



Drillbit on Apache Drill -demon, joka toimii kussakin klusterin solmussa. Se käyttää ZooKeeperia kaikkeen viestintään klusterissa ja ylläpitää klusterijäsenyyttä. Se vastaa asiakkaan pyyntöjen hyväksymisestä, kyselyjen käsittelystä ja tulosten palauttamisesta asiakkaalle. Asiakkaalta pyynnön vastaanottavaa porauslaitetta kutsutaan esimieheksi. Se luo toteutussuunnitelman, suoritusfragmentit lähetetään muille klusterissa käynnissä oleville porapaloille.

Drillbits-Apache-Drill

Vielä yksi etu on, että poran asennus ja asennus on melko yksinkertaista. Anna meidän oppia asentamaan Apache Drill.

Ensimmäinen vaihe on ladata porapaketti.

miten saada matriisin pituus javascriptiin

Komento: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz

Komento: tar -xvf apache-drill-1.5.0.tar.gz

Komento: Ls

Aseta seuraavaksi ympäristömuuttujat .bashrc-tiedostoon.

Komento: sudo gedit .bashrc

vie DRILL_HOME = / home / edureka / apache-drill-1.5.0

vie PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin

Tämä komento päivittää muutokset:

Komento: lähde .bashrc

Siirry nyt poraus conf-hakemistoon ja muokkaa drill-override.conf-tiedostoa klusterin tunnuksella ja zookeeper-isännällä ja -portilla. Suoritamme sen paikallisessa klusterissa.

Komento: cd apache-drill-1.5.0

Komento: sudo gedit conf / drill-override.conf

DRILL_MAX_DIRECT_MEMORY on oletusarvoisesti 8 Gt drill-env.sh-tiedostossa, ja meidän on pidettävä se käytettävissä olevan muistin mukaan.

Komento: sudo gedit conf / drill-env.sh

Voit asentaa poran vain yhteen solmuun käyttämällä upotettua tilaa, jossa se toimii paikallisesti. Se käynnistää porauspalvelun automaattisesti, kun suoritat tämän komennon.

Komento: ./alusta/porakone

Voit suorittaa asennuksen tarkistamalla yksinkertaisen kyselyn.

Komento: valitse * sys.options-kohdasta WHERE type = ’JÄRJESTELMÄ’ ja nimeä kuten ’security%’

Yhdistä lajittelu c ++ -esimerkki

Apache Drillin verkkokonsolin tarkistamiseksi meidän on mentävä verkkoselaimessa osoitteeseen localhost: 8047.

Voit suorittaa kyselyn myös Kysely-välilehdellä.

Jos haluat suorittaa porauksen hajautetussa tilassa, sinun on muokattava klusterin tunnusta ja lisättävä ZooKeeper-tiedot drill-override.conf-tiedostoon alla esitetyllä tavalla.

Sitten meidän on aloitettava ZooKeeper-palvelu jokaisessa solmussa. Sen jälkeen sinun on käynnistettävä porauspalvelu jokaisessa solmussa tällä komennolla.

Komento: ./bin/drillbit.sh alku

Komento: jps

Käynnistämme porauskuoren alla olevan komennon avulla.

Nyt voimme suorittaa kyselymme klusterissa hajautetussa tilassa.

Tämä on ensimmäinen blogikirjoitus kaksiosaisessa Apache Drill -blogisarjassa. Sarjan toinen blogi on tulossa pian.

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

Aiheeseen liittyvät julkaisut:

Apache-poran poraus alas 2. osa

Apache Spark Vs Hadoop -kartan vähennys