Ehdottomasti! Ei ole koskaan ollut parempaa aikaa lisätä Hadoop-taitoja ansioluettelosi. Selvitetään tämä muutamalla tosiseikalla ja esimerkillä.
Oletko koskaan miettinyt, mikä on Facebookin automaattisen taggauksen ominaisuus? Entä valvontakamerat, jotka pystyvät tuottamaan moitteettomia kuvia myös hämärässä? Vastaus on Hadoop ja sen uraauurtavat kyvyt tallentaa, käsitellä ja noutaa tietoja.
miten jaettua toimintoa käytetään pythonissa
Tietojen tallentaminen on yksi asia, mutta niiden käsittely ja kysely on täysin erilainen pallopeli. Jos Big Data on rugby-joukkue, niin Hadoop on paras puolustaja, jonka löydät!
Hadoopin ansiosta Facebook pystyy tallentamaan kaikki tiedot henkilöstä ja osoittamaan toiminnan tarkan ajan ja päivämäärän hänen profiiliinsa. Kaikki henkilöä koskevat tiedot ovat Big Data ja Hadoop auttaa tekemään kaiken.
Kaikki Hadoop-tiedot tallennetaan HDFS: n (Hadoop Distributed File System) päälle, johon mahtuu sekä jäsenneltyjä että jäsentämättömiä tietoja. Hadoopin kilpailijat (kuten RDBMS ja Excel) voivat tallentaa vain jäsenneltyjä tietoja. Tämä on tärkeä tekijä, miksi Hadoop on iso isä, joka antaa perinteisille tietojenkäsittelytyökaluille rahansa. Hadoop suorittaa käsittelyn lähellä tietoja, kun taas RDBMS tarvitsee tiedon siirtämisen verkon kautta I / O: n kautta saman tiedon käsittelemiseksi.
Ajattelemisen aihetta: Voiko Hadoop ennustaa tilanteen tuloksia tietojoukon perusteella?
Tämä kaavio näyttää tietojen eksponentiaalisen kasvun vuosien varrella. Tarkastele sitä tarkemmin ja huomaat, että strukturoimattomat tiedot muodostavat 90% kaikista tiedoista maailmassa. Käytä yksinkertaisesti kysynnän ja tarjonnan periaatetta, ja voimme ymmärtää, että yhä useampi strukturoimaton data, joka kelluu ympärillä, antaa vain ammattilaisille mahdollisuuden korjata nämä tiedot. Tämä on riittävä syy henkilölle etsiä työtä, joka käsittelee jäsentämättömiä tietoja, eli Big Data. Älä epäile mitään, että tämä on oikea aika oppia Hadoop.
Kuinka tehokkaasti Hadoop on verrattuna RDBMS: ään?
Hadoop koputtaa kaikki muut tiedonkäsittelytyökalut suoraan puistosta. RDBMS ja Excel voivat olla tehokkaita hallita tietoja, jotka eivät ylitä muutama sata Excel-arkkia, mutta entä tuhat sellaista tiedostoa, jotka on ylläpidettävä? Palataan taas Facebook-esimerkkiin. Tietolokia, joka sisältää Facebook-käyttäjän aktiviteettitiedot, ei voida tallentaa Exceliin, ainakaan kaikkia käyttäjän vuosikymmenten historiatietoja. Lisäksi Hadoopissa data voi olla löyhästi jäsennelty, mutta RDBMS vaatii tietojen olevan johdonmukaisempia ja tunnistettavassa muodossa.
kuinka oppia pl sql
Katsokaa RDBMS: n ja Hadoopin vertailua ja tiedät itse, mikä hinta on parempi.
Minulla on yksi lopullinen tilasto sinulle, joka sulkee kaikki epäilyt siitä, onko Hadoop hyvä uravalintajäätä.
Tämä kaavio on esimerkki Hadoop-ammattilaisten kasvavasta kysynnästä, ja se nousee vasta seuraavina viikkoina.
Valitettavasti me ja minä emme voi vaihtaa tekniikkaa. Parhaimmillaan voimme pysyä sen mukana ja oppia kehittyviä tekniikoita ja tulla välttämättömiksi työpaikoillemme. On oikea aika oppia Hadoop ja ajaa Big Data -aalloa.
Onko sinulla kysymys meille? Mainitse se kommenttiosassa ja palaamme sinuun.
Aiheeseen liittyvät julkaisut:
php print_r-taulukko