Google Data Science -haastattelukysymykset: Kaikki mitä sinun on tiedettävä sen murtaamiseksi



Tässä artikkelissa on joukko Google Data Science Interview Questiosn -palvelua, haastatteluprosessi ja edellytykset hakea työpaikkaa Googlessa.

Palkkaaminen maailmanlaajuisesti tunnettuun yritykseen, kuten Google, on unelma työ monille ihmisille. Heillä on joitain lahjakkaimpia tekoälyn tutkijoita, ja maailmassa. Googlelle ei ole paljon lähteitä Haastattelukysymykset verkossa, eikä siellä ole helppoa saada työtä. Joten käsittelen seuraavia aiheita tässä artikkelissa:

Työn kuvaus ja vaatimukset

Keskipalkalla 169 067 dollaria , mukaan lukien bonus. Google Data Scientistin palkka vaihtelee 120 000 - 280 000 dollaria . Tämän korkean palkan ansiosta sinun on tiedettävä oikeat vaatimukset hakemallesi työlle. Vaikka vaatimukset vaihtelevat paikasta toiseen, alla on joitain yleisimpiä:

Vähimmäisvaatimus:



google

  • Maisterin tutkinto määrällisestä kurinalaisuudesta (tilastot, operaatiotutkimus, tietojenkäsittelytiede)
  • 2 vuoden työkokemus tietojen analysointiin liittyvällä alalla
  • Kokemus tilasto-ohjelmistoista (esim. R , , MATLAB, Pandas) ja
  • Kokemus tietokannan kielistä (esim. SQL )

Vastuut:



mikä on ero html: n ja xml: n välillä
  • Työskentele suurten, monimutkaisten tietojoukkojen kanssa. Ratkaise vaikeita, rutiininomaisia ​​analyysiongelmia soveltamalla edistyneitä analyyttisiä menetelmiä tarpeen mukaan
  • Suorita analyysi, joka sisältää tiedonkeruun ja vaatimusten määrittelyn, käsittelyn, analyysin, käynnissä olevat tuotokset ja esitykset
  • Rakenna ja prototyyppianalyysiputkistoja iteratiivisesti, jotta saat käsityksen mittakaavassa
  • Kehitä kattavaa tietoa Googlen tietorakenteista ja mittareista kannattamalla muutoksia tarvittaessa tuotekehitykseen
  • Ole vuorovaikutuksessa monialaisesti ja tee liiketoimintasuosituksia (esim. Kustannus-hyöty, ennuste, kokeiluanalyysi)
  • Tutki ja kehitä analyysi-, ennuste- ja optimointimenetelmiä Googlen käyttäjille suunnattujen tuotteiden laadun parantamiseksi

Google Data Science -haastatteluprosessi

Valintalistan tyhjentäminen on itsessään vaikea tehtävä, joka riippuu täysin sinun CV, saatekirje ja Kokea . Google Datatiede Haastattelukysymykset ovat sekoitus Brain teasereita ja teknisiä kyselyjä. Yleensä ensimmäinen prosessi on puhelinhaastattelu.

Puhelinhaastattelu:

Se koostuu pääasiassa kysymyksiin (konkreettinen ja teoreettinen) ja perustuu vahvasti . Kysymykset vaihtelevat myös niiden projektien mukaan, joissa olet työskennellyt.
  • Tapaus 1: Haastatteluissa oli kysytty ominaisuuksien poimintatekniikoista, PCA: sta (käytetty projekteissa), korrelaatioanalyysistä, joistakin käytetyistä luokitustekniikoista (SVM, GBM, hermoverkko). Miksi ei logistinen regressio, miksi GBM? - Pohjimmiltaan kysymykset, jotka pyörivät luokan erotettavuuden ympärillä.
  • Tapaus 2: Miksi käyttää ominaisuuden valintaa? Jos kaksi ennustinta korreloivat voimakkaasti, mikä on vaikutus logistisen regression kertoimiin? Mitkä ovat kertoimien luottamusvälit?
  • Tapaus 3: Levy pyörii karalla etkä tiedä levyn pyörimissuuntaa. Sinulle toimitetaan joukko nastoja. Kuinka käytät nastoja kuvaamaan, miten levy pyörii?
Puhelinhaastattelujen jälkeen se on kasvotusten ja koodauskierroksia. Joten, keskustellaan joitain yleisimpiä Google Data Science -haastattelukysymyksiä. Vaikka näitä kysymyksiä ei ehkä esitetä täsmälleen kuten alla on esitetty, olen yrittänyt käsitellä monia niistä.

Google Data Science -haastattelukysymykset

Nämä kysymykset eivät ole hämmentäviä, koska Google on lopettanut näiden kysymysten esittämisen, vaan heillä on vastaavia kysymyksiä, joita he kutsuvat Ongelmanratkaisukysymykset . Paljon koneoppimiskysymyksiä kysytään aina geneerisistä käytännön kysymyksiin. Google kattaa pohjimmiltaan aiheiden laajuuden eikä syvyyttä. Q1. Olet kasinolla ja sinulla on kaksi noppaa pelaamiseen. Voittat 10 dollaria joka kerta, kun heität 5. Jos pelaat kunnes voitat ja lopetat, mikä on odotettu voitto? Q2. Olet menossa lentokoneeseen Lontooseen, haluat tietää, onko sinun otettava mukaan sateenvarjo vai ei. Soitat kolmelle satunnaiselle ystävällesi ja jokaiselle heille, jos sataa. Todennäköisyys, että ystäväsi kertoo totuuden, on 2/3 ja todennäköisyys, että he pelaavat sinulle kepponen valehtelemalla, on 1/3. Jos kaikki kolme heistä kertovat, että sataa, niin mikä on todennäköistä, että sataa Lontoossa. Q3. Kuinka lisätään uutta Facebook jäsenet tietokantaan ja koodata heidän suhteensa muihin tietokannassa oleviin tietoihin? Q4. Kuinka testaat, että käyttäjän todennäköisyys pysyä aktiivisena kuuden kuukauden kuluttua on suurempi, kun otetaan huomioon, että käyttäjällä on nyt enemmän ystäviä? Q5. Sinulle annetaan 40 korttia, joissa on neljä eriväristä korttia - 10 vihreää, 10 punaista, 10 sinistä ja 10 keltaista. Kunkin värin kortit on numeroitu yhdestä kymmeneen. Kaksi korttia poimitaan satunnaisesti. Selvitä todennäköisyys, että valitut kortit eivät ole samaa numeroa ja samaa väriä. Q6. Luo ohjelma haluamallasi kielellä lukeaksesi tekstitiedoston useilla tweeteillä. Tuloksen tulisi olla 2 tekstitiedostoa - yksi, joka sisältää luettelon kaikista uniikeista sanoista kaikkien twiittien joukossa, sekä toistuvien sanojen määrän, ja toisen tiedoston tulisi sisältää keskimääräinen yksilöllisten sanojen määrä kaikille tweeteille. Q7. Mitä teet, jos puuttuvien arvojen poistaminen tietojoukosta aiheuttaa ennakkoluuloja? Q8. Levy pyörii karalla etkä tiedä levyn pyörimissuuntaa. Sinulle toimitetaan joukko nastoja. Kuinka käytät nastoja kuvaamaan, miten levy pyörii? Q9. Kuinka suunnittelet suositusten moottorin työpaikoille? Q10. Minkä tuotteen haluat rakentaa Googlessa? Q11. Autot istutetaan nopeusmittariin, jotta vakuutusyhtiöt voivat seurata ajotilaa. Minkälaisiin yrityskysymyksiin tämän uuden järjestelmän perusteella voidaan vastata? Q12. Kuinka voit päättää, onko yksi algoritmi parempi kuin toinen? Q13. Laatikossa on 12 punaista ja 12 mustaa korttia. Toisessa laatikossa on 24 punaista ja 24 mustaa korttia. Haluat piirtää kaksi korttia sattumanvaraisesti jostakin kahdesta laatikosta. Mistä laatikosta on todennäköisempää saada samanvärisiä kortteja ja miksi? Q14. Mitä eroa on pussitetun mallin ja tehostetun mallin välillä? Q15. Olet luomassa raporttia käyttäjien sisällön lataamisesta joka kuukausi ja havaitset latausten määrän äkillisen kasvun tammikuussa. Lähetysten kasvu on lisääntynyt erityisesti kuvien lataamisessa. Mikä luulet olevan syy tähän ja miten testaat tämän äkillisen piikin? Q16. Omistat vaatetusyrityksen ja haluat parantaa paikkasi markkinoilla. Kuinka teet sen maanpinnasta? Q17. Kuinka päätät, mitkä kahden ylijännityshinnoittelualgoritmin versiot toimivat paremmin mille tahansa lentoyhtiölle? Q18. Mikä on lason vapausaste? Q19. Mitä eroa on iteraattorin, generaattorin ja luettelon ymmärtämisen välillä Pythonissa? Q20. Kun otetaan huomioon joukko verkkosivuja ja muutoksia verkkosivustolla, miten testaat uuden verkkosivuston ominaisuuden selvittääksesi, toimiiko muutos positiivisesti? Q21. Kun jokaiselle aakkoset sisältävälle solulle annetaan MxN-ulottuvuusmatriisi, etsi onko siinä merkkijono vai ei. Q22. Kuinka rakennat välimuistijärjestelmän käyttämällä edistynyttä tietorakennetta, kuten hashmapia? Q23. Jos saisit tietoaineiston mistä tahansa kiinnostavasta aiheesta riippumatta keräysmenetelmistä tai resursseista, miltä aineisto näyttäisi ja mitä aiot tehdä sen kanssa? Q24. Mitä ovat poikkeavuuksien havaitsemismenetelmät? Q25. Kuinka välimuisti toimii ja miten käytät sitä datatieteessä? Joten kaverit, tämän kanssa olemme päässeet tämän artikkelin loppuun. Google Data Science haastattelukysymykset ovat enimmäkseen skenaariopohjainen ja vaativat, että sinulla on Ongelmanratkaisukyvyt ja lisäksi sinun on tiedettävä, miten datatiedettä voidaan soveltaa näihin tilanteisiin. Toivon, että tämä antaa sinulle mahdollisuuden valmistautua mihin tahansa Data Science -haastatteluun tulevaisuudessa. Olkoon se Google, Microsoft, Apple tai Uber. Kaikki tekniset jättiläiset esittävät samantyyppisiä kysymyksiä datatieteen suhteen, koska se on laaja ja samalla uusi ala. saa sinut tuntemaan datatieteen ammattilaisten käyttämät työkalut ja järjestelmät. Se sisältää koulutusta tilastoista, tietojenkäsittelystä, Pythonista, Apache Sparkista ja Scalasta, Tensorflow'sta ja Tableausta. Opetussuunnitelma on määritelty kattavalla tutkimuksella yli 5000 toimenkuvasta ympäri maailmaa. Jos sinulla on kysyttävää, mainitse rohkeasti alla olevassa kommenttiosassa.