HBase-arkkitehtuuri: HBase-tietomalli ja HBase-luku- / kirjoitusmekanismi



Tämä HBase-arkkitehtuurin blogi selittää HBase-tietomallin ja antaa käsityksen HBase-arkkitehtuurista. Se selittää myös HBasen eri mekanismit.

HBase-arkkitehtuuri

Edellisessä blogissani HBase-opetusohjelma , Selitin mikä on HBase ja sen ominaisuudet. Mainitsin myös Facebook Messengerin tapaustutkimuksen, jonka avulla voit muodostaa yhteyden paremmin. Nyt eteenpäin meidän , Selitän sinulle HBasen ja HBase-arkkitehtuurin tietomallin.Ennen kuin jatkat, sinun on myös tiedettävä, että HBase on tärkeä käsite, joka muodostaa kiinteän osan Big Data Hadoop -sertifiointiin.

Tärkeät aiheet, jotka aion käydä läpi tässä HBase-arkkitehtuuriblogissa, ovat:





Ymmärretään ensin HBasen tietomalli. Se auttaa HBasea nopeammassa lukemisessa / kirjoittamisessa ja haussa.



HBase-arkkitehtuuri: HBase-tietomalli

Kuten tiedämme, HBase on sarakekohtainen NoSQL-tietokanta. Vaikka se näyttää samanlaiselta kuin relaatiotietokanta, joka sisältää rivejä ja sarakkeita, mutta se ei ole relaatiotietokanta. Relaatiotietokannat ovat rivikeskeisiä, kun taas HBase on sarakekeskeisiä. Joten ymmärretään ensin sarake- ja rivikeskeisten tietokantojen ero:

Rivi- tai sarakekohtaiset tietokannat:

  • Rivikeskeiset tietokannat tallentavat taulukkotietueita riveihin. Sarakekohtaiset tietokannattallentaa taulukotietueet sarakkeiden sarjassa, ts. sarakkeen merkinnät tallennetaan vierekkäisiin kohtiin levyillä.

Ymmärrämme sen paremmin ottamalla esimerkin ja tarkastelemalla alla olevaa taulukkoa.



Taulukko - HBase-arkkitehtuuri - Edureka

Jos tämä taulukko on tallennettu rivikohtaiseen tietokantaan. Se tallentaa tietueet alla esitetyllä tavalla:

yksi,paul Walker,MEILLE,231,Uljas,

2, Vin Diesel,Brasilia,520,Mustang

Rivikeskeisissä tietokannoissa tiedot tallennetaan rivien tai rivien perusteella, kuten yllä voit nähdä.

Sarakekohtaiset tietokannat tallentavat nämä tiedot seuraavasti:

yksi,2, paul Walker,Vin Diesel, MEILLE,Brasilia, 231,520, Uljas,Mustang

Sarakekohtaisissa tietokannoissa kaikki sarakearvot tallennetaan yhdessä kuten ensimmäisen sarakkeen arvot yhdessä, sitten toisen sarakkeen arvot tallennetaan yhdessä ja muiden sarakkeiden tiedot tallennetaan samalla tavalla.

  • Kun datamäärä on erittäin valtava, kuten petatavuissa tai eksatavuissa, käytämme sarakekohtaista lähestymistapaa, koska yhden sarakkeen tiedot tallennetaan yhdessä ja niihin pääsee käsiksi nopeammin.
  • Vaikka rivikeskeinen lähestymistapa käsittelee verrattain vähemmän rivejä ja sarakkeita tehokkaasti, koska riviin suuntautunut tietokantavarasto data on jäsennelty muoto.
  • Kun meidän on käsiteltävä ja analysoitava suuri joukko puolirakenteisia tai jäsentämättömiä tietoja, käytämme sarakekohtaista lähestymistapaa. Kuten sovellukset, jotka käsittelevät Online-analyyttinen käsittely kuten tiedonlouhinta, tietovarastointi, sovellukset, mukaan lukien analytiikka, jne.
  • Sekä katsoo, että Online-tapahtumien käsittely kuten pankki- ja rahoitusalat, jotka käsittelevät jäsenneltyä dataa ja vaativat transaktio-ominaisuuksia (ACID-ominaisuudet), käyttävät riviin suuntautunutta lähestymistapaa.

HBase-taulukoissa on seuraavat komponentit, jotka näkyvät alla olevassa kuvassa:

  • Taulukot : Tiedot tallennetaan taulukkomuodossa HBaseen. Mutta tässä taulukot ovat sarakekohtaisessa muodossa.
  • Rivi Avain : Rivinäppäimiä käytetään hakemaan tietueita, jotka tekevät hakut nopeasti. Olisit utelias tietämään miten? Selitän sen tässä blogissa eteenpäin tulevassa arkkitehtuuriosassa.
  • Sarake Perheet : Eri sarakkeet yhdistetään sarakeperheeseen. Nämä sarakeperheet tallennetaan yhdessä, mikä tekee hakuprosessista nopeampaa, koska samaan sarakeperheeseen kuuluviin tietoihin pääsee käsiksi yhdessä hakussa.
  • Sarake Karsinnat : Jokaisen sarakkeen nimi tunnetaan sarakkeen määrittelijänä.
  • Solu : Tiedot tallennetaan soluihin. Tiedot sijoitetaan soluihin, jotka tunnistetaan erikseen rivin avaimen ja sarakkeen määrittelijöillä.
  • Aikaleima : Aikaleima on päivämäärän ja ajan yhdistelmä. Aina kun tiedot tallennetaan, ne tallennetaan aikaleimallaan. Tämän avulla tietyn tietoversion haku on helppoa.

Yksinkertaisemmalla ja ymmärtävämmällä tavalla voimme sanoa, että HBase koostuu:

  • Sarja taulukoita
  • Jokainen taulukko sarakeperheillä ja riveillä
  • Rivi-avain toimii ensisijaisena avaimena HBasessa.
  • Mikä tahansa pääsy HBase-taulukoihin käyttää tätä ensisijaista avainta
  • Jokainen HBasessa oleva sarakkeen määrittelijä tarkoittaa solussa olevaa objektia vastaavaa määritettä.

Nyt kun tiedät HBase-tietomallista, katsokaamme, kuinka tämä tietomalli sopii yhteen HBase-arkkitehtuurin kanssa ja tekee siitä sopivan suurelle tallennukselle ja nopeammalle käsittelylle.

heittää tuplan int jaavalle

HBase-arkkitehtuuri: HBase-arkkitehtuurin komponentit

HBasella on kolme pääkomponenttia, ts. HMaster-palvelin , HBase-aluepalvelin, alueet ja Eläintarhanhoitaja .

Alla oleva kuva selittää HBase-arkkitehtuurin hierarkian. Puhumme kustakin niistä erikseen.


Ennen kuin menemme HMasteriin, ymmärrämme alueet, koska kaikki nämä palvelimet (HMaster, Region Server, Zookeeper) on sijoitettu koordinoimaan ja hallitsemaan alueita ja suorittamaan erilaisia ​​toimintoja alueiden sisällä. Joten olisit utelias tietämään, mitkä ovat alueita ja miksi ne ovat niin tärkeitä?

HBase-arkkitehtuuri: Alue

Alue sisältää kaikki rivit aloitusavaimen ja kyseiselle alueelle määritetyn lopetusavaimen välillä. HBase-taulukot voidaan jakaa useisiin alueisiin siten, että kaikki sarakeperheen sarakkeet tallennetaan yhdelle alueelle. Jokainen alue sisältää rivit järjestyksessä.

Monet alueet on osoitettu a Aluepalvelin , joka vastaa luku- ja kirjoitusoperaatioiden käsittelystä, hallinnasta, suorittamisesta kyseisille alueille.

Joten lopuksi yksinkertaisemmalla tavalla:

  • Taulukko voidaan jakaa useisiin alueisiin. Alue on lajiteltu rivialue, joka tallentaa tietoja aloitusavaimen ja lopetusavaimen väliin.
  • Alueen oletuskoko on 256 Mt, joka voidaan määrittää tarpeen mukaan.
  • Aluepalvelin palvelee asiakkaita ryhmällä alueita.
  • Aluepalvelin voi palvella asiakkaalle noin 1000 aluetta.

Aloittaen hierarkian yläosasta, haluaisin ensin selittää sinulle HMaster Server -palvelimen, joka toimii samalla tavalla kuin NameNode HDFS . Sitten liikkuen hierarkiassa alas, johdatan sinut ZooKeeperin ja Region Serverin läpi.

HBase-arkkitehtuuri: HMaster

Kuten alla olevassa kuvassa, näet, että HMaster käsittelee DataNode-palvelimessa olevan kokoelman Region Server -palvelinta. Ymmärretään miten HMaster tekee niin.

  • HBase HMaster suorittaa DDL-operaatioita (luo ja poista taulukoita) ja määrittää alueita Region-palvelimille, kuten yllä olevasta kuvasta näet.
  • Se koordinoi ja hallinnoi aluepalvelinta (samanlainen kuin NameNode hallinnoi DataNodea HDFS: ssä).
  • Se määrittää alueet aluepalvelimille käynnistyksen yhteydessä ja määrittää alueet uudelleen palvelimille palautuksen ja kuormituksen tasapainottamisen aikana.
  • Se valvoo kaikkia klusterin Region Server -ilmentymiä (Zookeeperin avulla) ja suorittaa palautustoimintoja aina, kun mikä tahansa Region Server -palvelu on poissa käytöstä.
  • Se tarjoaa käyttöliittymän taulukoiden luomiseen, poistamiseen ja päivittämiseen.

HBasella on hajautettu ja valtava ympäristö, jossa HMaster yksinään ei riitä kaiken hallintaan. Joten mietit, mikä auttaa HMasteria hallitsemaan tätä valtavaa ympäristöä? Siellä ZooKeeper tulee kuvaan. Kun olemme ymmärtäneet, kuinka HMaster hallitsee HBase-ympäristöä, ymmärrämme, kuinka Zookeeper auttaa HMasteria hallitsemaan ympäristöä.

HBase-arkkitehtuuri: ZooKeeper - koordinaattori

Tämä alla oleva kuva selittää ZooKeeperin koordinointimekanismin.

  • Zookeeper toimii kuin koordinaattori HBase-hajautetussa ympäristössä. Se auttaa ylläpitämään palvelimen tilaa klusterissa kommunikoimalla istuntojen kautta.
  • Jokainen Region Server ja HMaster Server lähettävät jatkuvaa sydämenlyöntiä säännöllisin väliajoin Zookeeperille ja tarkistaa, mikä palvelin on elossa ja käytettävissä, kuten yllä olevassa kuvassa mainitaan. Se tarjoaa myös palvelinvirheilmoituksia, jotta palautustoimenpiteet voidaan suorittaa.
  • Viittaamalla yllä olevasta kuvasta näet, että on passiivinen palvelin, joka toimii aktiivisen palvelimen varmuuskopiona. Jos aktiivinen palvelin epäonnistuu, se tulee pelastamaan.
  • Aktiivinen HMaster lähettää sydämenlyöntejä Zookeeperille, kun taas passiivinen HMaster kuuntelee aktiivisen HMasterin lähettämiä ilmoituksia. Jos aktiivinen HMaster ei lähetä sykettä, istunto poistetaan ja passiivinen HMaster aktivoituu.
  • Jos Region Server ei lähetä sykettä, istunto on vanhentunut ja kaikille kuulijoille ilmoitetaan siitä. Sitten HMaster suorittaa sopivat palautustoiminnot, joista keskustelemme myöhemmin tässä blogissa.
  • Zookeeper ylläpitää myös .META-palvelimen polkua, joka auttaa kaikkia asiakkaita etsimään mitä tahansa aluetta. Asiakkaan on ensin tarkistettava .META-palvelimelta, mihin aluepalvelimeen alue kuuluu, ja se saa kyseisen aluepalvelimen polun.

Kun puhuin .META-palvelimesta, selitän ensin sinulle, mikä on .META-palvelin? Joten voit helposti yhdistää ZooKeeperin ja .META-palvelimen työn yhteen. Myöhemmin, kun selitän teille HBase-hakumekanismia tässä blogissa, selitän kuinka nämä kaksi toimivat yhteistyössä.

HBase-arkkitehtuuri: Meta-taulukko

  • META-taulukko on erityinen HBase-luettelotaulukko. Se ylläpitää luetteloa kaikista alueiden palvelimista HBase-tallennusjärjestelmässä, kuten näet yllä olevasta kuvasta.
  • Tarkasteltaessa näkyvää kuvaa .META tiedosto ylläpitää taulukkoa avainten ja arvojen muodossa. Avain edustaa alueen aloitusavainta ja sen tunnusta, kun taas arvo sisältää aluepalvelimen polun.

Kuten jo keskustelin, aluepalvelimesta ja sen toiminnoista, kun selitin teille alueita, siirrymme nyt hierarkiaa alaspäin ja keskityn aluepalvelimen komponenttiin ja niiden toimintoihin. Myöhemmin keskustelen etsinnän, lukemisen, kirjoittamisen mekanismista ja ymmärrän, miten kaikki nämä komponentit toimivat yhdessä.

HBase-arkkitehtuuri: Region Serverin komponentit

Tämä alla oleva kuva näyttää Region Server -palvelimen komponentit. Nyt keskustelen niistä erikseen.

servicenow-opas aloittelijoille pdf

Region Server ylläpitää useita alueita, jotka ovat päällä . Aluepalvelimen komponentit ovat:

  • WAL: Kuten voit päätellä yllä olevasta kuvasta, Write Ahead Log (WAL) on tiedosto, joka on liitetty jokaiseen hajautetun ympäristön aluepalvelimeen. WAL tallentaa uudet tiedot, joita ei ole säilytetty tai jotka on sidottu pysyvään tallennustilaan. Sitä käytetään, jos tietojoukkoja ei palauteta.
  • Estä välimuisti: Yllä olevasta kuvasta on selvästi nähtävissä, että lohkovälimuisti sijaitsee Region Server -palvelimen yläosassa. Se tallentaa usein luetut tiedot muistiin. Jos tietoja BlockCachessa käytetään viime aikoina, kyseiset tiedot poistetaan BlockCache-välimuistista.
  • MemStore: Se on kirjoitusvälimuisti. Se tallentaa kaikki saapuvat tiedot ennen sen ohjaamista levylle tai pysyvään muistiin. Jokaisessa alueen sarakeperheessä on yksi MemStore. Kuten kuvasta näet, alueelle on useita MemStoreja, koska jokainen alue sisältää useita sarakeperheitä. Tiedot lajitellaan leksikografisessa järjestyksessä ennen levylle lähettämistä.
  • H-tiedosto: Yllä olevasta kuvasta näet, että HFile on tallennettu HDFS: ään. Siten se tallentaa todelliset solut levylle. MemStore sitouttaa tiedot HFileen, kun MemStore-koko on suurempi.

Nyt kun tiedämme HBase-arkkitehtuurin tärkeimmät ja pienemmät komponentit, selitän mekanismin ja heidän yhteistyönsä tässä. Olipa kyse sitten lukemisesta tai kirjoittamisesta, meidän on ensin haettava mistä lukea tai mistä kirjoittaa tiedosto. Joten ymmärretään tämä hakuprosessi, koska tämä on yksi mekanismeista, jotka tekevät HBasesta erittäin suositun.

HBase-arkkitehtuuri: Kuinka haku aloitetaan HBasessa?

Kuten tiedät, Zookeeper tallentaa META-pöydän sijainnin. Aina kun asiakas lähestyy luku- tai kirjoituspyyntöjä HBaseen, tapahtuu seuraava toimenpide:

  1. Asiakas hakee META-taulukon sijainnin ZooKeeperistä.
  2. Sitten asiakas pyytää vastaavan riviavain aluepalvelimen sijaintia META-taulukosta sen käyttämiseksi. Asiakas tallentaa nämä tiedot välimuistiin META-taulukon sijainnin kanssa.
  3. Sitten se saa rivin sijainnin pyytämällä vastaavalta aluepalvelimelta.

Tulevia viitteitä varten asiakas käyttää välimuistinsa hakemaan META-taulukon sijainnin ja aiemmin lukenut riviavain Region Server. Tällöin asiakas ei viittaa META-taulukkoon, ennen kuin ja jos ei ole epäonnistumista, koska aluetta siirretään tai siirretään. Sitten se pyytää jälleen META-palvelinta ja päivittää välimuistin.

Kuten joka kerta, asiakkaat eivät tuhlaa aikaa hakea Region Serverin sijaintia META Server -palvelimelta, mikä säästää aikaa ja nopeuttaa hakuprosessia. Sallikaa minun kertoa teille, kuinka kirjoittaminen tapahtuu HBasessa. Mitkä ovat siihen liittyvät komponentit ja miten ne ovat mukana?

HBase-arkkitehtuuri: HBase-kirjoitus Mekanismi

Tämä alla oleva kuva selittää kirjoitusmekanismin HBasessa.

Kirjoitusmekanismi käy läpi seuraavan prosessin peräkkäin (katso yllä olevaa kuvaa):

Vaihe 1: Aina kun asiakkaalla on kirjoituspyyntö, asiakas kirjoittaa tiedot WAL: iin (Write Ahead Log).

  • Muokkaukset liitetään sitten WAL-tiedoston loppuun.
  • Tätä WAL-tiedostoa ylläpidetään jokaisessa Region Server -palvelimessa, ja Region Server käyttää sitä tietojen palauttamiseen, joita ei ole sidottu levylle.

Vaihe 2: Kun tiedot on kirjoitettu WAL: iin, ne kopioidaan MemStoreen.

Vaihe 3: Kun tiedot on sijoitettu MemStoreen, asiakas vastaanottaa kuittauksen.

Vaihe 4: Kun MemStore saavuttaa kynnyksen, se kaataa tai sitouttaa tiedot HF-tiedostoon.

Anna nyt sukeltaa syvälle ja ymmärtää, miten MemStore osallistuu kirjoittamiseen ja mitkä ovat sen toiminnot?

HBase-kirjoitus Mekanismi- MemStore

  • MemStore päivittää siihen tallennetut tiedot aina leksikografisessa järjestyksessä (peräkkäin sanakirjassa) lajiteltuina KeyValues-arvoina. Jokaiselle sarakeperheelle on yksi MemStore, joten päivitykset tallennetaan lajiteltuina jokaiselle sarakeperheelle.
  • Kun MemStore saavuttaa kynnyksen, se kaataa kaikki tiedot uuteen HFileen lajiteltuina. Tämä HFile on tallennettu HDFS: ään. HBase sisältää useita HF-tiedostoja kutakin sarakeperhettä varten.
  • Ajan myötä HFile-tiedostojen määrä kasvaa, kun MemStore tyhjentää tietoja.
  • MemStore tallentaa myös viimeisen kirjoitetun järjestysnumeron, joten sekä Master Server että MemStore tietävät, mitä tähän mennessä on tehty ja mistä aloittaa. Kun alue käynnistyy, viimeinen järjestysnumero luetaan, ja siitä alkaen uudet muokkaukset alkavat.

Kuten keskustelin useita kertoja, että HFile on tärkein pysyvä tallennustila HBase-arkkitehtuurissa. Viimeinkin kaikki tiedot on sidottu HFileen, joka on HBasen pysyvä tallennustila. Katsotaanpa siis HFile-ominaisuudet, mikä tekee siitä nopeamman haun lukemisen ja kirjoittamisen aikana.

ero ylikuormituksen ja ohittamisen välillä

HBase-arkkitehtuuri: HBase-kirjoitus Mekanismi- HFile

  • Kirjoitukset sijoitetaan peräkkäin levylle. Siksi levyn luku- ja kirjoituspäiden liike on hyvin vähäistä. Tämä tekee kirjoitus- ja hakumekanismista erittäin nopeaa.
  • HFile-indeksit ladataan muistiin aina, kun HFile avataan. Tämä auttaa löytämään tietueen yhdellä haulla.
  • Perävaunu on osoitin, joka osoittaa HFileen metalohkoon. Se kirjoitetaan sitoutuneen tiedoston loppuun. Se sisältää tietoa aikaleima- ja kukintasuodattimista.
  • Bloom Filter auttaa etsimään avainarvopareja, ohittaa tiedoston, joka ei sisällä vaadittua riviavainta. Aikaleima auttaa myös hakemaan tiedoston versiota, se auttaa tietojen ohittamisessa.

Tietäen kirjoitusmekanismin ja eri komponenttien roolin kirjoittamisen ja haun nopeuttamisessa. Selitän sinulle, kuinka lukumekanismi toimii HBase-arkkitehtuurin sisällä? Sitten siirrymme mekanismeihin, jotka lisäävät HBase-suorituskykyä, kuten tiivistäminen, aluejako ja palautuminen.

HBase-arkkitehtuuri: Lue mekanismi

Kuten hakumekanismeissamme todettiin, asiakas ensin hakee aluepalvelimen sijainnin .META-palvelimelta, jos asiakkaalla ei ole sitä välimuistissa. Sitten se käy läpi peräkkäiset vaiheet seuraavasti:

  • Tietojen lukemiseksi skanneri etsii ensin Rivi-solun Estä välimuisti -kohdasta. Täällä tallennetaan kaikki äskettäin luetut avainarvoparit.
  • Jos skanneri ei löydä vaadittua tulosta, se siirtyy MemStoreen, koska tiedämme, että tämä on kirjoitusvälimuisti. Sieltä se etsii viimeksi kirjoitettuja tiedostoja, joita ei ole vielä viety HFileen.
  • Viimeinkin se käyttää kukintasuodattimia ja estää välimuistin tietojen lataamiseksi HFilestä.

Toistaiseksi olen keskustellut HBasen haku-, luku- ja kirjoitusmekanismista. Nyt tarkastelemme HBase-mekanismia, joka tekee hakemisesta, lukemisesta ja kirjoittamisesta nopeaa HBasessa. Ensinnäkin ymmärrämme Tiivistys , joka on yksi näistä mekanismeista.

HBase-arkkitehtuuri: Tiivistys

HBase yhdistää HF-tiedostot vähentämään tallennustilaa ja vähentämään lukemiseen tarvittavien levyjen hakuja. Tätä prosessia kutsutaan tiivistyminen . Tiivistys valitsee joitain HF-tiedostoja alueelta ja yhdistää ne. Tiivistystä on kahta tyyppiä, kuten näet yllä olevasta kuvasta.

  1. Pieni tiivistys : HBase poimii automaattisesti pienemmät HF-tiedostot ja suosittelee ne suuremmille HF-tiedostoille yllä olevan kuvan mukaisesti. Tätä kutsutaan pieneksi tiivistämiseksi. Se suorittaa yhdistämislajittelun pienempien HF-tiedostojen sitouttamiseksi isompiin HF-tiedostoihin. Tämä auttaa tallennustilan optimoinnissa.
  2. Suurin tiivistys: Kuten yllä olevassa kuvassa on esitetty, suuressa tiivistämisessä HBase sulautuu ja asettaa alueen pienemmät H-tiedostot uudelle HF-tiedostolle. Tässä prosessissa samat sarakeperheet sijoitetaan yhteen uuteen HFileen. Se pudottaa poistetun ja vanhentuneen solun tässä prosessissa. Se lisää lukutehoa.

Mutta tämän prosessin aikana tulo-lähtö-levyt ja verkkoliikenne saattavat olla ruuhkaisia. Tämä tunnetaan nimellä kirjoitusvahvistus . Joten se on yleensä ajoitettu matalien huippukuormitusten aikana.

Nyt toinen suorituskyvyn optimointiprosessi, josta keskustelen, on Alue Split . Tämä on erittäin tärkeää kuormituksen tasapainottamiseksi.

HBase-arkkitehtuuri: Alue Split

Seuraava kuva kuvaa aluejakautumismekanismia.

Aina kun alueesta tulee suuri, se jaetaan kahteen lapsialueeseen, kuten yllä olevassa kuvassa on esitetty. Jokainen alue edustaa tarkalleen puolta emoalueesta. Sitten tästä jaosta ilmoitetaan HMasterille. Tätä hoitaa sama aluepalvelin, kunnes HMaster kohdistaa ne uudelle aluepalvelimelle kuormituksen tasapainottamista varten.

Viimeisenä, mutta ei vähäisimpänä, siirtymällä viivaa alaspäin selitän sinulle, kuinka HBase palauttaa tiedot vian jälkeen. Kuten tiedämme sen Virheiden palautus on erittäin tärkeä ominaisuus HBasessa, joten kerro meille, kuinka HBase palauttaa tietoja vian jälkeen.

HBase-arkkitehtuuri: HBase-kaatuminen ja tietojen palautus

  • Aina kun aluepalvelin epäonnistuu, ZooKeeper ilmoittaa HMasterille virheestä.
  • Sitten HMaster jakaa ja jakaa kaatuneen aluepalvelimen alueet monille aktiivisille aluepalvelimille. HMaster jakaa viallisen aluepalvelimen MemStore-tietojen palauttamiseksi WAL: n kaikille aluepalvelimille.
  • Kukin Region Server suorittaa WAL: n uudelleen rakentaakseen MemStore-palvelun kyseisen epäonnistuneen alueen sarakeperheelle.
  • Tiedot kirjoitetaan aikajärjestyksessä (ajoissa) WAL: ssa. Siksi WAL: n suorittaminen uudelleen tarkoittaa kaikkien muutosten tekemistä, jotka tehtiin ja tallennettiin MemStore-tiedostoon.
  • Joten kun kaikki aluepalvelimet ovat suorittaneet WAL: n, koko sarakeperheen MemStore-tiedot palautetaan.

Toivon, että tämä blogi olisi auttanut sinua ymmärtämään HBase-tietomallin ja HBase-arkkitehtuurin. Toivottavasti nautit siitä. Nyt voit liittyä HBasen ominaisuuksiin (jotka selitin edellisessä HBase-opetusohjelma blogi) HBase Architecture -palvelun kanssa ja ymmärrä, miten se toimii sisäisesti. Nyt kun tiedät HBasen teoreettisen osan, sinun tulisi siirtyä käytännön osaan. Pidä tämä mielessä seuraava blogimme selitetään näyte HBase POC .

Nyt kun olet ymmärtänyt HBase-arkkitehtuurin, tutustu Edureka, luotettava verkko-oppimisyritys, jolla on yli 250 000 tyytyväisen oppijan verkosto, joka levisi ympäri maailmaa. Edureka Big Data Hadoop -sertifiointikoulutus auttaa oppijoita tulemaan HDFS: n, langan, MapReduce, Pig, Hive, HBase, Oozie, Flume ja Sqoop -asiantuntijoiksi reaaliaikaisten käyttötapausten avulla vähittäiskaupan, sosiaalisen median, ilmailun, matkailun ja rahoituksen verkkotunnuksissa.

Onko sinulla kysymys meille? Mainitse se kommenttiosassa ja palaamme sinuun.