Apache Drill on alan ensimmäinen skeematon SQL-moottori. Pora ei ole maailman ensimmäinen kyselymoottori, mutta se on ensimmäinen, joka löytää hienon tasapainon joustavuuden ja nopeuden välillä. Pora on suunniteltu skaalautumaan useisiin tuhansiin solmuihin ja kyselemään petatavuja dataa vuorovaikutteisilla nopeuksilla, joita BI / Analytics-ympäristöt edellyttävät.
Se voi integroida useisiin tietolähteisiin, kuten Hive, HBase, MongoDB, tiedostojärjestelmä, RDBMS. Myös syöttöformaatteja, kuten Avro, CSV, TSV, PSV, Parketti, Hadoop Sequence -tiedostoja ja monia muita, voidaan käyttää Drillissa helposti.
Miksi Apache Drill?
Apache Drillin suurin etu on, että se voi löytää mallin lennossa, kun kyselet tietoja. Lisäksi se voi toimia BI-työkaluidesi kanssa, kuten Tableau, Qlikview, MicroStrategy jne., Parempaan analytiikkaan.
Tässä on teollisuusanalyytikon lainaus, joka tiivistää Apache Drillin arvon:
'Drill ei ole vain SQL-on-Hadoop. Kyse on SQL-ohjelmasta, melkein missä tahansa, välittömästi ja ilman muodollisuuksia.
- Andrew Burst, Gigaom Research, tammikuu 2015
Drillbit on Apache Drill -demon, joka toimii kussakin klusterin solmussa. Se käyttää ZooKeeperia kaikkeen viestintään klusterissa ja ylläpitää klusterijäsenyyttä. Se vastaa asiakkaan pyyntöjen hyväksymisestä, kyselyjen käsittelystä ja tulosten palauttamisesta asiakkaalle. Asiakkaalta pyynnön vastaanottavaa porauslaitetta kutsutaan esimieheksi. Se luo toteutussuunnitelman, suoritusfragmentit lähetetään muille klusterissa käynnissä oleville porapaloille.
Vielä yksi etu on, että poran asennus ja asennus on melko yksinkertaista. Anna meidän oppia asentamaan Apache Drill.
Ensimmäinen vaihe on ladata porapaketti.
miten saada matriisin pituus javascriptiin
Komento: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz
Komento: tar -xvf apache-drill-1.5.0.tar.gz
Komento: Ls
Aseta seuraavaksi ympäristömuuttujat .bashrc-tiedostoon.
Komento: sudo gedit .bashrc
vie DRILL_HOME = / home / edureka / apache-drill-1.5.0
vie PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin
Tämä komento päivittää muutokset:
Komento: lähde .bashrc
Siirry nyt poraus conf-hakemistoon ja muokkaa drill-override.conf-tiedostoa klusterin tunnuksella ja zookeeper-isännällä ja -portilla. Suoritamme sen paikallisessa klusterissa.
Komento: cd apache-drill-1.5.0
Komento: sudo gedit conf / drill-override.conf
DRILL_MAX_DIRECT_MEMORY on oletusarvoisesti 8 Gt drill-env.sh-tiedostossa, ja meidän on pidettävä se käytettävissä olevan muistin mukaan.
Komento: sudo gedit conf / drill-env.sh
Voit asentaa poran vain yhteen solmuun käyttämällä upotettua tilaa, jossa se toimii paikallisesti. Se käynnistää porauspalvelun automaattisesti, kun suoritat tämän komennon.
Komento: ./alusta/porakone
Voit suorittaa asennuksen tarkistamalla yksinkertaisen kyselyn.
Komento: valitse * sys.options-kohdasta WHERE type = ’JÄRJESTELMÄ’ ja nimeä kuten ’security%’
Yhdistä lajittelu c ++ -esimerkki
Apache Drillin verkkokonsolin tarkistamiseksi meidän on mentävä verkkoselaimessa osoitteeseen localhost: 8047.
Voit suorittaa kyselyn myös Kysely-välilehdellä.
Jos haluat suorittaa porauksen hajautetussa tilassa, sinun on muokattava klusterin tunnusta ja lisättävä ZooKeeper-tiedot drill-override.conf-tiedostoon alla esitetyllä tavalla.
Sitten meidän on aloitettava ZooKeeper-palvelu jokaisessa solmussa. Sen jälkeen sinun on käynnistettävä porauspalvelu jokaisessa solmussa tällä komennolla.
Komento: ./bin/drillbit.sh alku
Komento: jps
Käynnistämme porauskuoren alla olevan komennon avulla.
Nyt voimme suorittaa kyselymme klusterissa hajautetussa tilassa.
Tämä on ensimmäinen blogikirjoitus kaksiosaisessa Apache Drill -blogisarjassa. Sarjan toinen blogi on tulossa pian.
Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.
Aiheeseen liittyvät julkaisut: