OLTP vs. OLAP



Seuraava blogi kertoo lyhyesti OLTP: stä OLAP: iin ja erilaisista käyttötapauksista.

OLTP vs. OLAP

OLTP: n sanotaan olevan enemmän online-tapahtumajärjestelmä tai tietojen tallennusjärjestelmä, jossa käyttäjä tekee paljon online-tapahtumia tietovaraston avulla. Sanotaan myös, että enemmän ad-hoc-lukemia / kirjoituksia tapahtuu reaaliajassa.





OLAP on enemmän offline-tietovarasto. Se on käytettävissäuseita kertojaoffline-tilassa. Esimerkiksi joukkolokitiedostot luetaan ja kirjoitetaan sitten takaisin datatiedostoihin. Jotkut OLAP: n yleisistä alueista ovat lokityöt, tiedonlouhintatyöt jne.

Cassandran sanotaan olevan enemmän OLTP: tä, koska se on reaaliaikainen, kun taas Hadoop on enemmän OLAP: ta, koska sitä käytetään analytiikkaan ja massakirjoituksiin.



Miksi integroida OLAP ja OLTP?

Jos etsit halvinta hintaa hotellivarauksille seuraavien 365 päivän aikana, täällä on valtava tietojoukko Cassandrasta ja haluat saada suosituksia reaaliaikaisesta tietokannasta, promo tarjotaan hinnan perusteella.

hanki matriisin pituus javascript

Tällaisessa tilanteessa meidän on toistettava kaikki tietueet ja pidettävä analyysit sen päällä, mikä on valtava offline-työ, joka on aloitettava usein. Täällä Hadoop tulee pelaamaan joukkotietojen murskaamista.

Toinen etu on, että voimme suorittaa yhden klusterin ja keskeyttää toisen Hadoop-klusterin käytön.



Kolmas etu on, että voidaan vähentää myös paljon toimintakustannuksia.

Ottaen huomioon skenaarion, jossa jos käyttäjä on perehtynyt hyvin erilaisiin Hadoop-ekosysteemeihin, kuten Hive, Pig Latin ja tarvitsee integroida siihen tietoja, täytyy liittää jokin tietolähde Cassandraan ja yrittää suorittaa Map Vähennä myös työpaikkoja.

kuinka kääntää kaksinkertainen osaksi int

OLTP: n ja OLAP: n välillä on huomattava kuvio. OLTP: ssä kirjoituksia on vähemmän, esim. Tietoa hotellista. Olettaen, että hintamuutokset tapahtuvat 5000 kertaa sekunnissa, lukuja voi olla enemmän täällä. Tällaisessa skenaariossa kirjoitus voi olla yksi sekunnissa, mutta lukemiset saattavat nousta satoihin ja tuhansiin. Joten suhde on täällä noin 1: 1000.

On mielenkiintoinen havainto, että Cassandra mahtuu helposti tähän malliin, joka sisältää malleja, joissa luku / kirjoitus on yhtä suuri. Myös OLTP: n kohdalla voidaan nähdä millisekunnin ero mahdollisten johdonmukaisten mallien ja vahvimpien yhtenäisten mallien välillä, vaikka pääset viritettävään ja vahvaan konsistenssimalliin. Siten Cassandra mahtuu OLTP: hen.

OLAPiin tullessa voidaan nähdä erilaisia ​​OLAP-malleja, mikä tarkoittaa, että useita kirjoituksia tapahtuu samanaikaisesti. OLAP: ssä tiedot viedään yhteen otokseen eli kaikki lokitiedostot laitetaan tietovarastoon ja aloitamme sitten käsittelyn. Tietomalli tai käyttömalli on täsmälleen päinvastainen kuin OLTP-tyyppinen sovellus. Tässä Hadoop tai MapReduce ovat hyödyllisiä.

esimerkki java-etämenetelmän kutsusta

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

Aiheeseen liittyvät julkaisut:

Viisi parasta syytä oppia Cassandra