Koneoppimisen tilastot: Aloittelijan opas



Tämä koneoppimisen tilastoja käsittelevä artikkeli on kattava opas tilastojen käsitteistä ja esimerkkeistä.

Tietojen ymmärtäminen ja kyky luoda niistä arvoa on vuosikymmenen taito. Koneoppiminen on yksi sellainen ydinosaaminen, joka auttaa yrityksiä täyttämään sen. Aloittamiseksi sinun on kuitenkin rakennettava perustuksesi oikein. Joten tässä artikkelissa käsittelen muutamia peruskäsitteitä ja annan sinulle ohjeita koneoppimisen aloittamiseen. Joten tässä koneoppimisen tilastoja käsittelevässä artikkelissa käsitellään seuraavia aiheita:

  1. Todennäköisyys
  2. Tilastot
  3. Lineaarialgebra

Koneoppimisen todennäköisyys ja tilastot:





Mikä on todennäköisyys?

Todennäköisyys kvantifioi tapahtuman todennäköisyyden. Esimerkiksi, jos heität kohtuullisen, puolueettoman kuoleman, niin todennäköisyys yksi ylöspäin on 1/6 . Nyt, jos mietit why? Sitten vastaus on melko yksinkertainen!

Tämä johtuu siitä, että on olemassa kuusi mahdollisuutta ja kaikki ovat yhtä todennäköisiä (oikeudenmukainen kuolema). Siksi voimme lisätä 1 + 1 + 1 + 1 + 1 + 1 = 6. Mutta koska olemme kiinnostuneita tapahtuma, johon ilmestyy 1 . On vain yhdellä tavalla tapahtuma voi tapahtua. Siksi,



Todennäköisyys 1 ylöspäin = 1/6

Samanlainen on kaikkien muiden numeroiden tapaus, koska kaikki tapahtumat ovat yhtä todennäköisiä. Yksinkertainen, eikö?

No, tämän esimerkin toistuva todennäköisyyden määritelmä kuulostaa tältä - todennäköisyys yhdelle kääntymiselle on suhde kertojen 1 lukumäärän suhdelukumäärän kokonaismäärään, jos muotti rullattiin loputtomasti ajat.Kuinka tällä on järkeä?



Tehdään siitä mielenkiintoisempi. Harkitse kahta tapausta - heitit reilun kuolla viisi kertaa. Yhdessä tapauksessa numeroiden noususekvenssi on - [1,4,2,6,4,3]. Toisessa tapauksessa saamme - [2,2,2,2,2,2]. Kumpi on mielestäsi todennäköisempi?

Molemmat ovat yhtä todennäköisiä. Näyttää oudolta?

Harkitse nyt toista tapausta, jossa kussakin tapauksessa kaikki 5 rullaa ovat riippumaton . Eli yksi rulla ei vaikuta toiseen. Ensimmäisessä tapauksessa, kun 6 ilmestyy, sillä ei ollut aavistustakaan, että 2 ilmestyi ennen sitä. Siksi kaikki 5 rullaa ovat yhtä todennäköisiä.

Vastaavasti suorat 2: t toisessa tapauksessa voidaan ymmärtää itsenäisten tapahtumien sekvenssinä. Ja kaikki nämä tapahtumat ovat yhtä todennäköisiä. Kaiken kaikkiaan, koska meillä on samat noppat, todennäköisyys tietyn luvun nousemiselle, jos yksi on sama kuin tapaus 2. Seuraavaksi ymmärrämme termi tässä koneoppimisen tilastoja käsittelevässä artikkelissa Itsenäisyys.

Itsenäisyys

Kaksi tapahtumaa A: n ja B: n sanotaan olevan riippumattomia, jos A: n esiintyminen ei vaikuta tapahtumaan B . Esimerkiksi, jos heität kolikon ja rullat muotin, muotin lopputuloksella ei ole vaikutusta siihen, näkevätkö kolikossa päät tai hännät. Myös kaksi itsenäistä tapahtumaa A ja B , todennäköisyys, että A ja B voivat esiintyä yhdessä . Joten esimerkiksi, jos haluat todennäköisyyden, että kolikko näyttää päät ja kuolla näyttää 3.

P (A ja B) = P (A) * P (B)

Siksi P = & frac12 (päiden kääntymisen todennäköisyys) * ⅙ (todennäköisyys 3 ylöspäin) = 1/12

Edellisessä esimerkissä molemmissa tapauksissa P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙.

Puhutaan nyt tapahtumista, jotka eivät ole itsenäisiä. Harkitse seuraavaa taulukkoa:

Liikalihava Ei liikalihavia
SydänongelmatNeljä viisiviisitoista
Ei sydänongelmia1030

Tutkimukseen osallistui 100 ihmistä. 60: lla oli sydänvaivoja ja 40: llä ei. 60: sta sydänvaivasta 45 oli liikalihavia. Niistä 40: stä, joilla ei ollut sydänvaivoja, 10 oli liikalihavia. Jos joku kysyy sinulta -

  1. Mikä on sydänvaivojen todennäköisyys?
  2. Mikä on todennäköisyys saada sydänvaivoja ja olla liikalihavia?

Ensimmäisiin kysymyksiin on helppo vastata - 60/100. Toisen kohdalla se olisi 15/100. Harkitse nyt kolmatta kysymystä - henkilö valittiin satunnaisesti. Hänellä todettiin olevan sydänsairaus. Mikä on todennäköisyys, että hän on liikalihava?

Ajattele nyt sinulle annettuja tietoja - tiedetään, että hänellä on sydänsairaus. Siksi hän ei voi olla 40: stä, jolla ei ole sydänsairauksia. Vaihtoehtoja on vain 60 (taulukon ylärivi). Näiden rajoitettujen mahdollisuuksien joukossa todennäköisyys hänen liikalihavuudestaan ​​on 45/60. Nyt kun tiedät, mitkä ovat itsenäiset tapahtumat, seuraavaksi tässä koneoppimisen tilastoja käsittelevässä artikkelissa, anna meidän ymmärtää ehdolliset todennäköisyydet.

Ehdolliset todennäköisyydet

Ymmärrämme ehdolliset todennäköisyydet jatkamalla keskustelua yllä olevalla esimerkillä. Liikalihavuuden tila ja sydänvaivoista kärsivien tila eivät ole riippumattomia. Jos liikalihavuus ei vaikuttanut sydänongelmiin, liikalihavien ja ei-liikalihavien tapausten määrä ihmisillä, joilla on sydänvaivoja, olisi ollut sama.

Lisäksi meille annettiin, että henkilöllä on sydänvaivoja, ja meidän piti selvittää todennäköisyys, että hän on liikalihava. Joten todennäköisyyden sanotaan tässä tapauksessa olevan riippuvainen siitä, että hänellä on sydänvaivoja. Jos tapahtuman A esiintymisen todennäköisyys on ehdollinen tapahtumalle B, edustamme sitä

hash map vs hash taulukko

P (A | B)

Nyt on lause, joka auttaa meitä laskemaan tämän ehdollisen todennäköisyyden. Sitä kutsutaan Bayesin sääntö .

P (A | B) = P (A ja B) / P (B)

Voit tarkistaa tämän lauseen liittämällä juuri käsittelemämme esimerkin. Jos olet ymmärtänyt tähän mennessä, voit aloittaa seuraavasta - Naivisti Bayes . Se käyttää ehdollisia todennäköisyyksiä luokitellakseen, onko sähköposti roskaposti vai ei. Se voi suorittaa monia muita luokitustehtäviä. Mutta pohjimmiltaan ehdollinen todennäköisyys on .

Tilastot:

Tilastot ovat käytetään yhteenvetoon ja johtopäätöksiin suuresta joukosta datapisteitä. Datatieteessä ja koneoppimisessa kohtaat usein seuraavan terminologian

  • Keskittämistoimenpiteet
  • Jakelut (erityisesti normaalit)

Keskittämistoimenpiteet ja leviämismittaukset

Tarkoittaa:

Tarkoitus on vain lukujen keskiarvo . Keskiarvon selvittämiseksi sinun on laskettava yhteen numerot ja jaettava se lukujen määrällä. Esimerkiksi [1,2,3,4,5]: n keskiarvo on 15/5 = 3.

mean-statistics-for-machine-learning

Mediaani:

Mediaani on numerojoukon keskiosa kun ne on järjestetty nousevaan järjestykseen. Esimerkiksi numerot [1,2,4,3,5] on järjestetty nousevaan järjestykseen [1,2,3,4,5]. Näiden keskimmäinen on 3. Siksi mediaani on 3. Mutta entä jos numeroiden lukumäärä on parillinen ja siksi sillä ei ole keskilukua? Siinä tapauksessa otat kahden keskimmäisen luvun keskiarvon. Jos keskiarvo on 2n numero nousevassa järjestyksessä, keskiarvo n. Ja (n + 1)thnumero mediaanin saamiseksi. Esimerkki - [1,2,3,4,5,6]: n mediaani (3 + 4) / 2 = 3,5

Tila:

Tila on yksinkertaisesti yleisimpiä numeroita joukossa . Esimerkiksi [1,2,3,3,4,5,5,5]: n tila on 5.

Varianssi:

Varianssi ei ole keskeinen mittari. Se mittaa miten tietosi jakautuvat keskiarvon ympärille . Se on kvantifioitu muodossa

xon N luvun keskiarvo. Otat pisteen, vähennät keskiarvon, otat tämän eron neliön. Tee tämä kaikille N-numeroille ja keskitä ne. Varianssin neliöjuuria kutsutaan keskihajonnaksi. Seuraavaksi tässä koneoppimisen tilastoja käsittelevässä artikkelissa ymmärretään normaali jakelu.

Normaalijakauma

Jakelu auttaa meitä ymmärtää, miten tietomme leviävät . Esimerkiksi ikäryhmässä meillä voi olla nuoria enemmän kuin vanhempia aikuisia, joten pienemmät ikäarvot ovat suurempia kuin suuremmat. Mutta miten määritellään jakauma? Harkitse alla olevaa esimerkkiä

Y-akseli edustaa tiheyttä. Tämän jakauman tila on 30, koska se on huippu ja siten yleisin. Voimme myös paikantaa mediaanin. Mediaani on x-akselin kohdassa, jossa puolet käyrän alla olevasta pinta-alasta peitetään. Pinta-ala minkä tahansa normaalijakauman alla on 1, koska kaikkien tapahtumien todennäköisyyksien summa on 1. Esimerkiksi

Mediaani edellisessä tapauksessa on noin 4. Tämä tarkoittaa, että käyrän alla oleva alue ennen 4 on sama kuin 4. jälkeen. Harkitse toista esimerkkiä

Näemme kolme normaalijakaumaa. Sinisillä ja punaisilla on sama keskiarvo. Punaisella on suurempi varianssi. Siksi se on levinnyt enemmän kuin sininen. Mutta koska alueen on oltava 1, punaisen käyrän huippu on sinistä käyrää lyhyempi, jotta alue pysyy vakiona.

Toivottavasti ymmärrät perustilastot ja normaalijakaumat. Seuraavaksi tässä koneoppimisen tilastoja käsittelevässä artikkelissa, tutustu lineaariseen algebraan.

Lineaarialgebra

Moderni tekoäly ei olisi mahdollista ilman lineaarialgebraa. Se muodostaa ytimen Syvä oppiminen ja sitä on käytetty jopa yksinkertaisissa algoritmeissa, kuten . Aloitetaan ilman viivytyksiä.

goto-toiminto c ++

Sinun on tunnettava vektorit. Ne ovat eräänlaisia ​​geometrisia esityksiä avaruudessa. Esimerkiksi vektorissa [3,4] on 3 yksikköä x-akselilla ja 4 yksikköä y-akselilla. Harkitse seuraavaa kuvaa -

Vektorilla d1 on 0,707 yksikköä x-akselilla ja 0,707 yksikköä y-akselilla. Vektorilla on 1 ulottuvuus. Sillä on välttämättä suuruus ja suunta. Esimerkiksi,

Yllä olevassa kuvassa on vektori (4,3). Sen suuruus on 5 ja se tekee 36,9 astetta x-akselin kanssa.

Mikä on matriisi? Matriisi on moniulotteinen numeroryhmä. Mihin sitä käytetään? Näemme eteenpäin. Mutta ensin katsotaanpa, miten sitä käytetään.

Matriisi

Matriisilla voi olla monia ulottuvuuksia. Tarkastellaan 2-ulotteista matriisia. Siinä on rivejä (m) ja sarakkeita (n). Siksi siinä on m * n elementtiä.

Esimerkiksi,

Tässä matriisissa on 5 riviä ja 5 saraketta. Kutsutaan sitä A: ksi. Siksi A (2,3) on merkintä toisella rivillä ja kolmannella sarakkeella, joka on 8.

Nyt, kun tiedät mikä on matriisi, anna meidän tutkia matriisin eri toimintoja.

Matriisitoiminnot

Matriisien lisääminen

Kaksi matriisia sama mitat voidaan lisätä. Lisäys tapahtuu elementtikohtaisesti.

Skalaarinen kertolasku

Matriisi voidaan kertoa skalaarimäärällä. Tällainen kertolasku johtaa siihen, että jokainen matriisin merkintä kerrotaan skalaarilla. Skalaari on vain luku

Matriisi Transponoi

Matriisin siirtäminen on yksinkertaista. Matriisille A (m, n) olkoon A ’sen transponoitava. Sitten

A '(i, j) = A (j, i)

Esimerkiksi,

Matriisikertaus

Tämä on luultavasti hieman hankalaa kuin muut toiminnot. Ennen kuin sukellamme siihen, määritellään pistetulo kahden vektorin välillä.

Harkitse vektori X = [1,4,6,0] ja vektori Y = [2,3,4,5]. Sitten pistetulo X: n ja Y: n välillä määritellään

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

miten tehdä jframe Java

Joten se on elementtikohtainen kertolasku ja summaus. Nyt,Tarkastellaan kahta matriisia A (m, n) ja B (n, k), joissa m, n, k ovat mittoja ja siten kokonaislukuja. Määritämme matriisikertoimen

Edellä olevassa esimerkissä tuotteen (44) ensimmäinen elementti saadaan vasemman matriisin ensimmäisen rivin ja oikean matriisin ensimmäisen sarakkeen pistetulolla. Vastaavasti 72 saadaan vasemman matriisin ensimmäisen rivin ja oikean matriisin toisen sarakkeen pistetulolla.

Huomaa, että vasemman matriisin sarakkeiden lukumäärän on oltava yhtä suuri kuin oikean sarakkeen rivien lukumäärä. Meidän tapauksessamme tuote AB on olemassa, mutta ei BA: ta, koska m ei ole yhtä suuri kuin k. Kahdelle matriisille A (m, n) ja B (n, k) määritetään tulo AB ja tuotteen ulottuvuus on (m, k) ((m, n), (n, k) ulkomaiset mitat )). Mutta BA: ta ei ole määritelty, ellei m = k.

Tämän avulla olemme päättäneet tämän artikkelin koneoppimisen tilastoista. Toivon, että olet ymmärtänyt joitain koneoppimisen ammattikielistä. Se ei kuitenkaan pääty tähän. Varmistaaksesi, että olet valmis teollisuuteen, voit tutustua Edurekan tietojenkäsittely- ja tekoälykursseihin. Ne löytyvät