4 käytännön syytä oppia Hadoop 2.0



Nämä neljä syytä päivittää Hadoop 2.0: een puhuvat Hadoopin työmarkkinoista ja siitä, miten se voi auttaa sinua nopeuttamaan urasi tekemällä sinut avoimeksi valtaville työmahdollisuuksille.

Kun olin nuorempi, rakastin Tähtien sota -elokuvasarjaa. Rakastin sitä niin paljon, että minulla oli nämä videokasetit jokaisesta niistä. Minulla oli tapana katsella niitä yhä uudelleen. Sitten tuli DVD-soittimien aika, ja minun piti saada nämä elokuvat uudelleen DVD: ksi. Minulla ei ollut mitään huolta ostaa koko sarja uudelleen DVD: llä, koska halusin kokea uuden tekniikan ja nauttia myös suosikkielokuvistani. Asiat olivat hienoja, kunnes uusi uusi tekniikka, Blu-ray, syntyi. Ostettuani elokuvia jo kahdesti, en odottanut ostaa niitä uudestaan. Jonkin aikaa en pyrkinyt 'päivittämään' itseäni ajattelemalla, että pärjäisin hienosti ilman tätä tekniikkaa. Ja pärjäsin hyvin. Se ei kuitenkaan vaikuttanut elämääni. Mutta näin muutoksen trendissä, enkä voinut jakaa elokuvia ystävieni kanssa, kuten he tekisivät keskenään. Tunsin todella jääneen syrjään.





Lopulta menin ulos ja hain elokuvan Blu-ray-muodossa. Muistan sen ei siksi, että rakastan elokuvaa, vaan siksi, että videon laatu oli mielenrauhaa. Ja kaiken huipuksi, sain koko elokuvasarjan yhdeksi Blu-ray-levyksi.

Tarve tai halu pysyä ajan tasalla on voimakkainta ammatissamme, koska riskit ovat suuremmat. On tullut välttämätöntä pysyä pelin kärjessä.



4 käytännön syytä oppia Hadoop 2.0:

Vaikka se on väistämätöntä, ajan tasalla pysymisestä ammatissamme on tullut tärkeä osa elämäämme. Niin kauhistuttavalta kuin se saattaa kuulostaa, ei tarvitse huolestua, koska tekniikat eivät todellakaan muutu niin nopeasti tai rajusti. Mutta puheet ja tiedot näistä tekniikoista ja asioista, joita voimme tehdä niiden kanssa, ovat yhä näkyvämpiä. Tässä on joitain syitä, miksi sinun pitäisi pysyä ajan tasalla:

# 1: Älä jää kiinni

Syitä oppia Hadoop 2.0



Jos et kiinnitä huomiota tekniikan uusimpaan päivitykseen, saatat näyttää siltä kuin ajovaloon jäänyt peura. Ei aivan loistava kuva ammattitaidostasi. Ajantasaisuus saa sinut ikäisesi arvostamaan ammattitaidostasi. Kaikkia uusia oppimiasi asioita ei ehkä tarvitse toteuttaa, mutta tietoinen päivityksistä on välttämätöntä.

Esimerkiksi, kun Hadoopissa on puhe, voit ilmoittaa ikäisillesi, että Hadoop 2.5.0: ssa on todennuksen parannuksia käytettäessä HTTP-välityspalvelinta. Ja myös Hadoopin samassa versiossa on säännös kirjoittaa suoraan grafiittiin.

On välttämätöntä olla uusimpien päivitysten päällä, kun organisaatiot ajattelevat siirtymistä Hadoopiin. Ja 'tietäminen' voi vaikuttaa valtavasti urallesi.

# 2: Kilpailullinen reuna

Alansa ammattilaisia ​​kunnioitetaan. Ja pysyminen ajan tasalla on paras tapa olla huipulla. Tarve pysyä ajan tasalla heijastaa intohimosi työhösi. Kehittämällä asiantuntemusta työstäsi ja alastasi ansaitset ympärilläsi olevien ihmisten luottamuksen ja kunnioituksen. Johtamisen näkökulmasta tämä on korvaamatonta!

Vaikka organisaatiosi työskentelee edelleen Hadoop 1.0: n kanssa, Hadoop 2: n kaikkien uusimpien ominaisuuksien tunteminen pitää sinut kurssilla, koska se on suhteellisen uusi ja ehdottomasti parempi. Se, että opit tämän ensimmäisenä, antaisi sinulle edun ikäisistäsi.

# 3: Uudet mahdollisuudet

On surullinen todellisuus, että nykyinen roolimme muuttuu jatkuvasti. Ajan myötä lisätään vastuuta ja mahdollisuuksia tehdä uusia tehtäviä. Pysymällä ajan tasalla alan trendeistä sinulla on parhaat mahdollisuudet tarttua näihin mahdollisuuksiin.

Yritykset, kuten Macy's, Lockheed Martin, California Creative Solutions, Capital One, CSpring, CACI International Inc., Oracle, Yahoo !, American Express, BlueHawk, Aetna, Lawrence Livermore National Laboratory ja monet muut etsivät ihmisiä, jotka ovat taitavia uusimpien ominaisuuksien suhteen. Hadoop 2, kuten Lanka.

mitä hyötyä on pistorasian ohjelmoinnista

# 4: Tee parempia päätöksiä

Lisätietojen avulla voit tehdä tietoon perustuvia valintoja ja parempia päätöksiä. Se auttaa sinua tunnistamaan mahdollisuudet ja lisäarvoa organisaatiosi strategiaan.

Hadoop 2: ssa on ominaisuuksia, jotka parantavat nopeutta ja vähentävät kustannuksia. Vaihtoehtojen ehdottaminen suorituskyvyn parantamiseksi ja nopeuden lisäämiseksi voi varmasti lisätä organisaation tuottavuutta. Tässä on joitain Hadoop 2: n ominaisuuksia, jotka hyödyttävät organisaatiota, ja niiden ehdottaminen lisää myös urasi.

  • Tuki Hadoopin ajamiselle Microsoft Windowsissa

  • MapReduce-binaarien yksinkertaistettu jakelu HDFS: n kautta YARN Distributed Cache -välimuistissa.

  • Parannettu tuki uusille YARN-sovelluksille Application History Server- ja Application Timeline Server -palveluilla

  • Täydellinen HTTPS-tuki HDFS: ssä

  • Kerberos-integraatio YARNin aikajanakaupalle.

  • Tuki heterogeeniselle tallennushierarkialle HDFS: ssä.

  • Muistin välimuisti HDFS-tiedoille keskitetyllä hallinnolla ja hallinnalla.

  • MapReduce-binaarien yksinkertaistettu jakelu HDFS: n kautta YARN Distributed Cache -välimuistissa.

Päivityksen pysymiselle on muutakin kuin käytännön syitä. Myös teknisistä syistä. Hadoopilla on lukuisia organisaatioille hyödyllisiä ominaisuuksia. Kun tarkastelet niitä perusteellisesti, saat selkeän kuvan siitä, mitkä ovat edullisia.

Mikä on Hadoopin viimeisin päivitys?

Jokainen tuote käy läpi useita julkaisuvaiheita ja keksii itsestään erilaisia ​​versioita. Hadoop ei ole poikkeus, ja hän on keksinyt Hadoop 2.0: n. Apache-säätiö on keksinyt seuraavat versiot Hadoopista, kuten Hadoop 2.1.0, Hadoop 2.4.0 ja saavuttanut Hadoop 2.5.1: n, joka on viimeisin versio, joka julkaistiin syyskuussa 2014.

Miksi Hadoop 2 julkaistiin?

Uuden version mukana tulee lisäominaisuuksia ja kiinteitä virheitä. Joten joka kerta, kun käytät tiettyä Hadoop-versiota ja luulet, että tietty ominaisuus voidaan lisätä tai jotkut virheet on korjattava, ilmoitat siitä Apache-säätiön kavereille. Nämä kaverit puolestaan ​​työskentelevät sen parissa ja antavat sinulle paremman tuotteen seuraavassa versiossa.

Hadoop 2 - ei vain luku

Hadoop 2 ei ole vain Hadoopin uusin versio. Yleensä se on toisen sukupolven arkkitehtuuri. Hadoopin jakelija Hortonworksin perustaja ja arkkitehti Arun Murthy vaatii, että ero on tärkeä, koska Hadoopin siirtäminen eräkäsittelyn ulkopuolelta reaaliaikaisen analytiikan maailmaan on ollut huomattavaa.

Puhutaanpa siitä, kuinka erilainen Hadoop 2.0 on edeltäjänsä Hadoop 1.0: sta. Myöhemmin julkaistu versio on tietysti parempi kuin aikaisempi versio. Seuraavat ovat neljä suurta parannusta Hadoop 2.0: een verrattuna Hadoop 1.x: ään:

  • HDFS-federaatio - NameNoden vaakasuuntainen skaalautuvuus

  • NameNode High Availability - NameNode ei ole enää yksi epäonnistumispiste

  • LANKA - Kyky käsitellä teratavuja ja petatavuja HDFS: ssä saatavilla olevaa dataa käyttämällä muita kuin MapReduce -sovelluksia, kuten MPI, GIRAPH

  • Resurssienhallinta - jakaa ylikuormitetun JobTrackerin kaksi päätoimintoa (resurssien hallinta ja työn aikataulutus / valvonta) kahteen erilliseen demoniin: globaaliin resurssienhallintaan ja sovelluskohtaiseen ApplicationMasteriin

On muita lisäominaisuuksia, kuten kapasiteettiaikataulu (Enable Multi-tenancy support in Hadoop), Data Snapshot, Windows-tuki, NFS-käyttö, mahdollistamalla Hadoopin lisääntyneen käyttöönoton teollisuudessa Big Data -ongelmien ratkaisemiseksi.

Hadoop 2.X vs. Hadoop 1.X

Tehdään pieni vertailu ja katsotaan, millä tavoin Hadoop 2.0 on parempi ja erilainen kuin Hadoop 1.0

Miksi Hadoop 2 on parempi kuin Hadoop 1.0?

Hadoop 2.0 tarjoaa suorituskyvyn parannuksia, jotka hyödyntävät Hadoop-ekosysteemin liittyviä tekniikoita. HDFS: n ja toisen sukupolven arkkitehtuurin (YARN) uraauurtavien ominaisuuksien lisäksi on vielä enemmän ja suurempia syitä Hadoop 2: n suosimiselle Hadoop 1.0: n kanssa:

  • Hadoop 2: lla ei ole enää kielirajoitusta. Tämä tarkoittaa, että laaja joukko ammattilaisia ​​voi nyt käyttää Hadoopia.

  • Hadoop 2: n avulla estetään esteet, kuten MapReduce-koodereiden puute.

  • 2 kertaa nopeampi kuin Hadoop 1.0

  • 2 kertaa ROI nykyisellä laitteistolla.

  • YARNin avulla sovellusohjelmointirajapinta on paljon avoimempi ja joustavampi.

  • Hadoop 2 laajentaa mahdollisuuksia käyttää Hadoopia Big Data -projekteissa.

    toiminnon ylikuormitus c ++: ssa
  • Hadoop 2: n avulla kehittäjät voivat nyt suorittaa valtavan monipuolisen tiedonkeruutehtävän Hadoopin aikaisemman eräkäsittelyn ulkopuolella.

  • Tarjoaa uusia mahdollisuuksia tietohallinnoille ja korjaa aiempien versioiden puutteet.

  • Tällä uudella versiolla on ainutlaatuinen ominaisuus suorittaa useita työkuormia samalla Hadoop-klusterilla.

  • Hadoop ei ole enää rajoitettu yhteen ominaisuuteen. Sen sovellus ulottuu nyt HDFS: n ja MapReducen ulkopuolelle.

Lankan tärkeimmät edut

Olemme tietoisia siitä, että YARN on toisen sukupolven arkkitehtuuri, katsotaanpa, mikä tekee siitä niin suurenmoisen.

  • Mittakaava

  • Uudet ohjelmointimallit ja palvelut

  • Parannettu klusterin käyttö

  • Ketteryys

  • Paljon enemmän kuin Java

  • Ja paljon muuta

Hadoop 2 -taitojen kysyntä

Organisaatiot ovat nyt käynnistämässä tai kokeilemassa Hadoop 2: ta. Tästä syystä tarvitaan tarve ammattilaisille, jotka ovat taitavia Hadoop 2: lle. Monet organisaatiot ovat jo alkaneet etsiä sisäisesti ihmisiä työskentelemään Hadoopin kanssa. On selkeitä viitteitä siitä, että YARN on nousussa ja lopulta korvaa MapReduce-taitojen kysynnän.

Tässä on joitain näkemyksiä Hadoop-taitojen nykyisestä ja ennakoidusta kysynnästä:

  • Gartnerin analyytikoiden mukaan Hadoop 2 on elintärkeä kehitys, kun suuryritykset ympäri maailmaa ovat havainneet Hadoopin olevan pelinvaihtaja Big Data -hallinnassaan.

  • Bloor-konserniin kuuluvan Eric Kavanaghin mukaan Hadoop 2.0 on saavuttanut vetovoiman informaatiotyöntekijöiden keskuudessa, jotka pyrkivät kiistelemään Big Dataa.

  • Hadoop 2.0: n käyttöönotto on edelleen nousussa ja on nyt siirtymässä.

  • Organisaatiot ovat tietoisia YARNin eduista ja ovat innoissaan siitä.

Tässä on tilannekuva Hadoop 2.0 / YARN in -työpaikoista Todellakin.com

miten luoda istunto Java

Kuka on siirtymässä Hadoop 2: een tai jolla jo on?

Yahoo:

Yahoo! , johtaja kaikessa, Hadoop on toteuttanut YARNin (0,23x). Murthyn mukaan Yahoon 35 000 solmun klusteri käsittelee nyt 130-150 työpaikkaa päivässä verrattuna 50-60 ennen YARNia.

Kun puhutaan tähtien suorituskyvystä, Murthy lainaa: 'Kun sinulla on 2x yli 35 000 - 40 000 solmua, se on ilmiömäistä'. Hän lisäsi myös: 'On melko vakuuttava tarina kertoa tietohallintojohtajalle, että jos päivität ohjelmiston vain Hadoop 1: stä Hadoop 2: ksi, näet kaksinkertaiset suorituskyvyn parannukset työpaikoissasi.'

eBay:

eBayssa on yksi alan suurimmista Hadoop-klustereista, missä tiedot ovat petatavuina. He ovat myös siirtäneet klusterinsa Hadoop 2: een.

Päätelmä:

Kun Hadoop 2 on kypsä ja helpompi toteuttaa, he jopa vakuuttavat skeptikot ja yhä useammat organisaatiot siirtyvät Hadoop 2.0: een. On olemassa perusteltuja syitä välttää 1.x-versioita. Mutta Hadoop 2: n kanssa jopa epäuskoiset harkitsevat sitä, koska sitä voidaan käyttää monenlaisiin käyttötarkoituksiin. Kun opit Hadoop 2.0: n ja otat sen käyttöön suorittamaan laskelmia Big Datasta, avaat portit teknisesti edistyneelle ja taloudellisesti palkitsevalle uralle.

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

Aiheeseen liittyvät julkaisut:

Kuinka välttämätöntä Hadoop-koulutus on?