Mikä on hermoverkko? Johdanto keinotekoisiin hermoverkkoihin



Tämä hermoverkkoja käsittelevä blogi tutustuttaa sinut hermoverkkojen peruskäsitteisiin ja miten ne voivat ratkaista monimutkaisia ​​datalähtöisiä ongelmia.

Koneoppimisen edistyessä on ottanut suuren tien. Syvää oppimista pidetään edistyneimpänä tekniikkana, joka on rakennettu ratkaisemaan monimutkaisia ​​ongelmia, jotka käyttävät massiivisia tietojoukkoja. Tämä hermoverkkoja käsittelevä blogi tutustuttaa sinut hermoverkkojen peruskäsitteisiin ja miten ne voivat ratkaista monimutkaisia ​​datalähtöisiä ongelmia.

Saadaksesi syvällisen tiedon tekoälystä ja syvällisestä oppimisesta, voit ilmoittautua livenä kirjoittanut Edureka 24/7 tuella ja käyttöikällä.





Tässä on luettelo aiheista, joita tässä käsitellään Blogi:

  1. Mikä on hermoverkko?
  2. Mikä on syväoppiminen?
  3. Ero AI: n, ML: n ja DL: n välillä
  4. Syvällisen oppimisen tarve
  5. Syvän oppimisen käyttötapa
  6. Kuinka hermoverkot toimivat?
  7. Neuraaliverkko selitetty esimerkillä

Yksinkertainen määritelmä hermoverkosta

Ihmisen aivojen mukaisesti mallinnettu a Neuraaliverkko rakennettiin jäljittelemään ihmisen aivojen toiminnallisuutta . Ihmisen aivot ovat hermoverkko, joka koostuu useista neuroneista, samoin keinotekoinen hermoverkko (ANN) koostuu useista perceptroneista (selitetään myöhemmin).



Neuroverkko - Mikä on hermoverkko - Edureka

Neuroverkko koostuu kolmesta tärkeästä kerroksesta:

  • Syöttökerros: Kuten nimestä voi päätellä, tämä kerros hyväksyy kaikki ohjelmoijan toimittamat syötteet.
  • Piilotettu kerros: Tulo- ja lähtökerroksen välissä on joukko kerroksia, jotka tunnetaan nimellä Piilotetut tasot. Tässä kerroksessa suoritetaan laskelmat, jotka johtavat tulokseen.
  • Tulostustaso: Tulot käyvät läpi useita muunnoksia piilotetun kerroksen kautta, mikä johtaa lopulta tämän kautta toimitettuun lähtöön kerros.

Ennen kuin pääsemme hermoverkon toiminnan syvyyteen, ymmärretään, mikä on syvä oppiminen.



Mikä on syvällinen oppiminen?

Syväoppiminen on koneoppimisen edistynyt ala, joka käyttää hermoverkkojen käsitteitä ratkaisemaan erittäin laskennallisia käyttötapauksia, joihin liittyy moniulotteisen datan analyysi. Se automatisoi ominaisuuksien poimintaprosessin varmistaen, että tarvitaan hyvin vähän ihmisen toimia.

Joten mikä on syvä oppiminen?

Syvä oppiminen on edistynyt koneoppimisen osa-alue, joka käyttää aivojen rakenteen ja toiminnan innoittamia algoritmeja, nimeltään Keinotekoiset hermoverkot.

Ero tekoälyn, ML: n ja DL: n välillä (tekoäly vs koneoppiminen vs syvällinen oppiminen)

Ihmiset usein ajattelevat sitä , ja Syvä oppiminen ovat samat, koska niillä on yhteisiä sovelluksia. Esimerkiksi Siri on tekoälyn, koneoppimisen ja syvällisen oppimisen sovellus.

Joten miten nämä tekniikat liittyvät?

  • Tekoäly on tiede saada koneita jäljittelemään ihmisten käyttäytymistä.
  • Koneoppiminen on tekoälyn osajoukko, joka keskittyy saamaan koneet tekemään päätöksiä syöttämällä heille tietoja.
  • Syvä oppiminen on koneoppimisen osajoukko, joka käyttää hermoverkkojen käsitettä monimutkaisten ongelmien ratkaisemiseen.

AI: n yhteenvetona koneoppiminen ja syväoppiminen ovat toisiinsa liittyviä kenttiä. Koneoppiminen ja syvällinen oppiminen auttavat tekoälyä tarjoamalla joukon algoritmeja ja hermoverkkoja ratkaisemaan dataan perustuvat ongelmat.

Nyt kun olet perehtynyt perusasioihin, ymmärretään, mikä johti syvällisen oppimisen tarpeeseen.

Syvällisen oppimisen tarve: perinteisten koneoppimisalgoritmien ja -tekniikoiden rajoitukset

Koneoppiminen oli merkittävä läpimurto teknisessä maailmassa, se johti yksitoikkoisten ja aikaa vievien tehtävien automatisointiin, auttoi ratkaisemaan monimutkaisia ​​ongelmia ja tekemään älykkäämpiä päätöksiä. Koneoppimisessa oli kuitenkin muutamia haittoja, jotka johtivat syvän oppimisen syntymiseen.

Tässä on joitain koneoppimisen rajoituksia:

  1. Suurikokoisen datan käsittely ei onnistu: Koneoppiminen voi käsitellä vain pieniä dimensioita, jotka sisältävät pienen muuttujien joukon. Jos haluat analysoida tietoja, jotka sisältävät 100s muuttujaa, koneoppimista ei voida käyttää.
  2. Ominaisuuksien suunnittelu on manuaalista: Harkitse käyttötapausta, jossa sinulla on 100 ennustavaa muuttujaa ja sinun on rajattava vain merkittävät. Tätä varten sinun on tutkittava manuaalisesti kunkin muuttujan suhde ja selvitettävä, mitkä ovat tärkeitä tuotoksen ennustamisessa. Tämä tehtävä on erittäin työläs ja aikaa vievä kehittäjälle.
  3. Ei ihanteellinen kohteiden havaitsemiseen ja kuvankäsittelyyn: Koska kohteiden havaitseminen vaatii suuria ulottuvuuksia, koneoppimista ei voida käyttää kuvadatajoukkojen käsittelyyn, se on ihanteellinen vain tietojoukoille, joilla on rajoitettu määrä ominaisuuksia.

Ennen kuin pääsemme syvyyteen Neural Networks, tarkastellaan tosielämän käyttötapausta, jossa Deep Learning toteutetaan.

Syvän oppimisen käyttötapaus / sovellukset

Tiesitkö, että PayPal käsittelee yli 235 miljardin dollarin maksut yli miljardin asiakkaan neljän miljardin tapahtuman kautta? Se käyttää tätä valtavaa määrää tietoja mahdollisten petollisten toimien tunnistamiseen muun muassa.

DeP Learning -algoritmien avulla PayPal kaivoi tietoja asiakkaan ostohistoriasta sen lisäksi, että se tarkasteli tietokantoihinsa tallennettujen todennäköisten petosten mallia ennustamaan, onko tietty tapahtuma petollinen vai ei.

Yhtiö on luottanut syvälliseen oppimiseen ja koneoppimiseen noin 10 vuoden ajan. Aluksi petosten seurantaryhmä käytti yksinkertaisia, lineaarisia malleja. Mutta vuosien varrella yhtiö siirtyi edistyneempään koneoppimistekniikkaan nimeltä Deep Learning.

python def __init __ (itse)

PayPalin petosriskien johtaja ja datatieteilijä Ke Wang lainasi:

'Nautimme nykyaikaisemmasta, edistyneemmästä koneoppimisesta sen kyvystä kuluttaa paljon enemmän tietoa, käsitellä kerroksia ja abstraktiokerroksia ja pystyä' näkemään 'asioita, joita yksinkertaisempi tekniikka ei pystyisi näkemään, jopa ihmiset saattavat ei näe. '

Yksinkertainen lineaarinen malli pystyy kuluttamaan noin 20 muuttujaa. Deep Learning -tekniikalla voidaan kuitenkin ajaa tuhansia datapisteitä. Siksi toteuttamalla Deep Learning -tekniikka, PayPal voi vihdoin analysoida miljoonia tapahtumia petosten tunnistamiseksi toiminta.

Mennään nyt hermoverkon syvyyksiin ja ymmärretään, miten ne toimivat.

Kuinka hermoverkko toimii?

Hermoverkkojen ymmärtämiseksi meidän on hajottava se ja ymmärrettävä hermoverkon perusyksikkö eli Perceptron.

Mikä on Perceptron?

Perceptron on yksikerroksinen hermoverkko, jota käytetään luokittelemaan lineaarista dataa. Siinä on 4 tärkeää komponenttia:

  1. Tulot
  2. Painot ja ennakkoluulot
  3. Summaustoiminto
  4. Aktivointi- tai muunnostoiminto

Perceptronin peruslogiikka on seuraava:

Tulokerrokselta vastaanotetut tulot (x) kerrotaan niille osoitetuilla painoilla w. Kerrotut arvot lisätään sitten painotetun summan muodostamiseksi. Tulojen painotettu summa ja vastaava paino käytetään sitten asiaankuuluvaan aktivointitoimintoon. Aktivointitoiminto kartoittaa tulon vastaavaan lähtöön.

Painot ja ennakkoluulot syvässä oppimisessa

Miksi meidän on annettava painot jokaiselle tulolle?

Kun syöttömuuttuja syötetään verkkoon, satunnaisesti valittu arvo määritetään kyseisen syötteen painoksi. Jokaisen syöttöpisteen paino osoittaa, kuinka tärkeä tulo on tuloksen ennustamisessa.

Bias-parametri puolestaan ​​antaa sinun säätää aktivointitoiminnon käyrää siten, että saavutetaan tarkka lähtö.

Summaustoiminto

Kun syötteille on annettu jonkin verran painoa, otetaan vastaavan syötteen ja painon tulo. Kaikkien näiden tuotteiden lisääminen antaa meille painotetun summan. Tämä tapahtuu summaustoiminnolla.

Aktivointitoiminto

Aktivointitoimintojen päätavoitteena on painotetun summan kartoittaminen tulokseen. Aktivointitoiminnot, kuten tanh, ReLU, sigmoid ja niin edelleen, ovat esimerkkejä muunnosfunktioista.

Saat lisätietoja Perceptronsin toiminnoista käymällä läpi tämän Blogi.

Ennen me kääri tämä blogi, ottakaamme yksinkertainen esimerkki ymmärtääksesi, miten hermoverkko toimii.

Neuraaliverkot selitetään esimerkillä

Harkitse skenaariota, jossa aiot rakentaa keinotekoisen hermoverkon (ANN), joka luokittelee kuvat kahteen luokkaan:

  • Luokka A: Sisältää kuvia saumattomista lehdistä
  • Luokka B: Sisältää kuvia sairaista lehdistä

Joten miten luodaan hermoverkko, joka luokittelee lehdet sairaiksi ja sairaiksi viljelykasveiksi?

Prosessi alkaa aina syötteen käsittelyllä ja muuntamisella siten, että se voidaan helposti käsitellä. Meidän tapauksessamme kukin lehtikuva jaetaan pikseleiksi kuvan ulottuvuudesta riippuen.

Esimerkiksi, jos kuva koostuu 30 x 30 pikselistä, pikselien kokonaismäärä on 900. Nämä pikselit esitetään matriiseina, jotka syötetään sitten hermoverkon tulokerrokseen.

Aivan kuten aivojemme neuronit auttavat rakentamaan ja yhdistämään ajatuksia, ANN: lla on perceptroneja, jotka hyväksyvät syötteet ja käsittelevät niitä siirtämällä ne edelleen tulokerroksesta piilotettuun ja lopuksi lähtökerrokseen.

Kun tulo siirretään tulokerroksesta piilotettuun kerrokseen, jokaiselle tulolle määritetään alkuperäinen satunnaispaino. Tulot kerrotaan sitten vastaavilla painoilla ja niiden summa lähetetään tulona seuraavalle piilotetulle kerrokselle.

Tällöin kullekin perceptronille määritetään numeerinen arvo, jota kutsutaan biasiksi, joka liittyy kunkin tulon painotukseen. Lisäksi kukin perceptroni johdetaan aktivoinnin tai muunnostoiminnon kautta, joka määrittää, aktivoituuko tietty perceptroni vai ei.

kuinka pysäyttää Java-ohjelma koodissa

Aktivoitua perceptronia käytetään siirtämään tietoja seuraavalle kerrokselle. Tällä tavalla dataa levitetään (eteenpäin eteneminen) hermoverkon kautta, kunnes perceptronit saavuttavat ulostulokerroksen.

Lähtökerroksessa johdetaan todennäköisyys, joka päättää, kuuluuko tieto luokkaan A vai luokka B.

Kuulostaa yksinkertaiselta, eikö olekin? No, hermoverkkojen taustalla oleva käsite perustuu puhtaasti ihmisen aivojen toimintaan. Tarvitset syvällistä tietoa erilaisista matemaattisista käsitteistä ja algoritmeista. Tässä on luettelo blogeista, joiden avulla pääset alkuun:

  1. Mikä on syväoppiminen? Syvällisen oppimisen aloittaminen
  2. Syvä oppiminen Pythonin kanssa: Aloittelijoiden opas syvään oppimiseen

Jos pidit tämän blogin merkityksellisenä, tutustu Edureka, luotettava verkko-oppimisyritys, jolla on yli 250 000 tyytyväisen oppijan verkosto, joka levisi ympäri maailmaa. Edureka Deep Learning with TensorFlow -sertifiointikoulutuskurssi auttaa oppijoita tulemaan asiantuntijoiksi koulutuksessa ja perus- ja konvoluutio-hermoverkkojen optimoinnissa käyttämällä reaaliaikaisia ​​projekteja ja tehtäviä sekä konsepteja, kuten SoftMax-toiminto, automaattisen kooderin hermoverkot, rajoitettu Boltzmann-kone (RBM).