Koneoppiminen on epäilemättä aikakauden kysytyin tekniikka! Jos olet aloittelija ja aloitat koneoppimisen, on tärkeää, että tiedät koneoppimisen edellytykset. Tämä blogi auttaa sinua ymmärtämään erilaisia käsitteitä, jotka sinun on tiedettävä ennen koneoppimisen aloittamista.
Saadaksesi syvällisen tiedon tekoälystä ja koneoppimisesta, voit ilmoittautua livenä kirjoittanut Edureka 24/7 tuella ja käyttöikällä.
Tässä on luettelo aiheista käsitelty tässä blogissa:
Koneoppimisen edellytykset
AloitaKoneoppiminen edellyttää, että tunnet seuraavat käsitteet:
Tilastot
Tilastot sisältävät työkaluja, joita voidaan käyttää tietojen saamiseksi. On kuvaavia tilastoja, joita käytetään muuttamaan raakatiedot joissakin tärkeissä tiedoissa. Päätelmällisiä tilastoja voidaan käyttää myös tärkeiden tietojen saamiseen näytteestä täydellisen tietojoukon käyttämisen sijaan.
Jos haluat lisätietoja Tilastoja voit käydä seuraavissa blogeissa:
Lineaarialgebra
Lineaarisen algebran tarjouksetvektorien, matriisien ja lineaaristen muunnosten kanssa. Se on erittäin tärkeä koneoppimisessa, koska sitä voidaan käyttää muuntamaan ja suorittamaan operaatioita tietojoukossa.
Laskin
Laskenta on tärkeä matematiikan ala ja sillä on olennainen rooli monissa koneoppimisalgoritmeissa. Tietojoukko, jolla on useita ominaisuuksia, ovatkäytetään rakentamaan koneoppimismalleja, koska ominaisuudet ovat useita monivaihtelevia laskelmia, on tärkeä rooli koneoppimismallin rakentamisessa. Integraatiot ja eriyttäminen ovat välttämättömiä.
Todennäköisyys
Todennäköisyys auttaa ennustamaan tapahtumien todennäköisyyttä, se auttaa meitä päättelemään tilanteesta, joka voi tapahtua tai ei. Koneoppimisessa todennäköisyys on a säätiö.
Saat lisätietoja todennäköisyydestä käymällä läpi tämän Blogi.
Ohjelmointikieli
On tärkeää tuntea ohjelmointikielet, kuten R ja Python, jotta koko koneoppimisprosessi voidaan toteuttaa. Python ja R tarjoavat molemmat sisäänrakennettuja kirjastoja, joiden avulla Machine Learning -algoritmien toteuttaminen on erittäin helppoa.
kuinka hälyttää javascriptillä
Sen lisäksi, että sinulla on perustiedot ohjelmoinnista, on myös tärkeää, että osaat kerätä, käsitellä ja analysoida tietoja. Tämä on yksi koneoppimisen tärkeimmistä taidoista.
Lisätietoja ohjelmoinnista koneoppimisen kielillä, voit käydä läpi seuraavat blogit:
Koneoppimisen käyttötapaus
Koneoppimisessa on kyse algoritmin luomisesta, joka voi oppia datasta ennusteen tekemiseen, kuten minkälaisia esineitä kuvassa on, tai suositusmoottoriin, parhaan yhdistelmän lääkkeisiin tietyn taudin tai roskapostisuodatuksen parantamiseksi.
Koneoppiminen perustuu matemaattisiin edellytyksiin, ja jos tiedät, miksi matematiikkaa käytetään koneoppimisessa, se tekee siitä hauskaa. Sinun on tiedettävä käyttämiesi toimintojen takana oleva matematiikka ja mikä malli sopii tiedoille ja miksi.
Joten aloitetaan mielenkiintoisella asuntojen hintojen ennustamisongelmalla, sillä meillä on tietojoukko, joka sisältää historiaa erilaisista ominaisuuksista ja hinnoista. Otamme nyt huomioon asuintilan neliöjalkoina ja hinnat.
Nyt meillä on tietojoukko, joka sisältää kaksi alla olevaa saraketta:
Näiden kahden muuttujan välillä on oltava jonkin verran korrelaatiota saadakseen selville, että meidän on rakennettava malli, joka voi ennustaa talojen hinnan. Kuinka voimme tehdä sen?
Kaaviotaan nämä tiedot ja katsotaan miltä ne näyttävät:
Tässä X-akseli on hinta neliömetriä asuintilaa ja Y-akseli on talon hinta. Jos piirrämme kaikki datapisteet, saadaan sirontakaavio, joka voidaan esittää viivalla, kuten yllä olevassa kuvassa on esitetty, ja jos syötämme joitain tietoja, se ennustaa jonkin verran lopputulosta. Ihannetapauksessa meidän on löydettävä viiva, joka leikkaa suurin datapiste.
Tässä yritämme luoda rivin, jota kutsutaan nimellä:
Y = mX + c
Tätä menetelmää kohteen (riippuvainen muuttuja) ja ennustavan muuttujan (riippumaton muuttuja) välisen lineaarisen suhteen ennustamiseksi kutsutaan lineaariseksi regressioksi. Sen avulla voimme tutkia ja tiivistää kahden muuttujan välisen suhteen.
- X = Itsenäinen muuttuja
- Y = Riippuva muuttuja
- c = y-leikkaus
- m = viivan kaltevuus
Jos tarkastelemme yhtälöä, meillä on arvot X: lle, joka on itsenäinen muuttuja, joten meidän on vain laskettava arvot m: lle ja c: lle Y: n arvon ennustamiseksi.
Joten miten löydämme nämä muuttujat?
Näiden muuttujien löytämiseksi voimme kokeilla joukkoa arvoja ja yrittää löytää linja, joka leikkaa enimmäismäärän datapisteitä. Mutta kuinka löydämme parhaiten sopivan linjan?
Joten parhaiten sopivan viivan löytämiseksi voimme käyttää pienimmän neliösumman virhetoimintoa, joka löytää virheen y: n todellisen arvon ja ennustetun arvon y` välillä.
Pienimmän neliösumman virhetoiminto voidaan esittää seuraavalla yhtälöllä:
Tämän toiminnon avulla voimme selvittää jokaisen ennustetun datapisteen virheen vertaamalla sitä datapisteen todelliseen arvoon. Ota sitten kaikkien näiden virheiden yhteenveto ja neliö ne saadaksesi selville ennusteen poikkeaman.
Jos lisäämme kolmannen akselin kaavioon, joka sisältää kaikki mahdolliset virhearvot, ja piirtämme sen kolmiulotteiseen tilaan, se näyttää tältä:
Yllä olevassa kuvassa ihanteelliset arvot olisivat mustassa alaosassa, joka ennustaa hinnat lähellä todellista datapistettä. Seuraava vaihe on löytää parhaat mahdolliset arvot m: lle ja c: lle. Tämä voidaan tehdä käyttämällä optimointitekniikkaa, jota kutsutaan gradientin laskeutumiseksi.
Gradientin laskeutuminen on iteratiivinen menetelmä, jossa aloitetaan muuttujien arvojen joukon alustaminen ja parannetaan niitä hitaasti minimoimalla virhe todellisen arvon ja ennustetun arvon välillä.
Jos luulemme käytännössä, että huoneiston hinnat eivät oikeastaan riipu vain neliöjalan hinnasta, on monia tekijöitä, kuten makuuhuoneiden, kylpyhuoneiden jne. Lukumäärä. Jos tarkastelemme myös näitä ominaisuuksia, yhtälö näyttää jotain kuten tämä
Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c
Tämä on monirivinen regressio, tämä kuuluu lineaariseen algebraan, tässä voidaan käyttää matriiseja, joiden koko on mxn, missä m ovat ominaisuuksia ja n ovat datapisteitä.
Tarkastellaan toista tilannetta, jossa voimme käyttää todennäköisyyttä talon kunnon löytämiseen luokittelemaan talo sen perusteella, onko se hyvässä kunnossa vai huonossa kunnossa. Tätä varten meidän on käytettävä tekniikkaa nimeltä Logistic Regression, joka toimii sigmoidifunktion edustamien tapahtumien todennäköisyydellä.
yksinkertainen yhdistämisen lajitteluohjelma c ++: ssa
Tässä artikkelissa käsiteltiin koneoppimisen edellytyksiä ja niiden soveltamista koneoppimiseen. Periaatteessa se koostuu tilastoista, laskennasta, lineaarisesta algebrasta ja todennäköisyysteoriasta. Laskennassa on käytetty optimointitekniikoita, lineaarisessa algebrassa on algoritmeja, jotka voivat toimia valtavien tietojoukkojen kanssa, todennäköisyydellä voimme ennustaa tapahtumien todennäköisyyden ja tilastot auttavat meitä päättelemään hyödyllisiä oivalluksia tietojoukkojen otoksesta.
Nyt kun tiedät koneoppimisen edellytykset, olet varma, että haluat oppia lisää. Tässä on muutama blogi, joiden avulla pääset alkuun Data Science -palvelun kanssa:
Jos haluat ilmoittautua koko tekoälyn ja koneoppimisen kurssille, Edurekalla on erityisesti kuratoitu joka tekee sinusta taitavan tekniikoista, kuten valvotusta oppimisesta, valvomattomasta oppimisesta ja luonnollisen kielen prosessoinnista. Se sisältää koulutuksen uusimmista kehityksistä ja teknisistä lähestymistavoista tekoälyyn ja koneoppimiseen, kuten syväoppiminen, graafiset mallit ja vahvistusoppiminen.