Tilastollinen mallinnus yritysanalyysissä R: n kanssa



Tämä blogi korostaa Business Analyticsin tilastollista mallia R: llä

Liiketoiminta-analyysi R: n kanssa

Business Analyticsin pääpaino on kehittää uusia oivalluksia liiketoiminnalle ja arvioida suorituskykyä. Business Analyticsista ja sen eri tekniikoista on puhuttu tarpeeksi. Eniten vaaditaan perusteellinen käsitys siitä, miten tilastoja sovelletaan Business Analyticsissa.





Mikä on tilastollinen mallinnus?

Tilastollinen mallinnus on muuttujien välisten suhteiden virallistaminen matemaattisten yhtälöiden muodossa. Kyse on periaatteessa muuttujan selvittämisestä. Se kuvaa kuinka yksi tai useampi muuttuja liittyy yhteen tai useampaan muuttujaan. Tällöin muuttujat eivät ole tarkasti yhteydessä toisiinsa, mutta ne voivat olla stokastisesti yhteydessä toisiinsa.

Yksinkertaisemmin sanottuna muuttuja on vain attribuutti. Määritteestä tulee henkilön pituus, paino ja ikä. Pituus ja ikä ovat luonteeltaan todennäköisiä. 30-vuotiaalla henkilöllä on suuremmat mahdollisuudet olla 4 jalkaa pitkä. Vastaavasti, kun tiedät 13-vuotiaasta henkilöstä, hänellä on suuremmat mahdollisuudet olla 6 jalkaa pitkä.



Tilastollisen mallinnuksen koko tarkoitus ei ole tutkimus, vaan loppujen lopuksi se antaa käsityksen ratkaisuista. Siihen sisältyy tietojen analysointi ja soveltaminen eri olosuhteissa. Videossa käsiteltävät aiheet ovat seuraavat:

1. Mikä on tilastollinen mallinnus
2. Mikä on regressiomallinnus
3. Analyticsin ymmärtäminen

heittää kaksinkertaisesti intiin java

Mikä on regressiomallinnus?

Kuten edellä mainituissa tilastollista mallintamista koskevissa riveissä mainittiin, tärkeä ja perustekijä tässä teoriassa on regressiomallinnus. Regressiomallinnuksessa on kyse kahden muuttujan välisen suhteen hankkimisesta. Regressio auttaa tarkemmin ymmärtämään, kuinka riippuvan muuttujan arvo muuttuu, kun jokin riippumattomista muuttujista vaihtelee, kun taas muut riippumattomat muuttujat pidetään kiinteinä. Esimerkiksi aika on itsenäinen muuttuja, kun taas myynti ja nopeus riippuvat tietyistä tekijöistä. Siksi tavoitteena on selvittää näiden kahden suhde.



Regressiomallissa on tiettyjä yhtälöitä, se on lineaarinen, monimuuttujainen ja logistinen regressio. Logistinen regressio on samanlainen kuin regressio, jossa on kaksi muuttujaa, joten luokitellaan itsensä todennäköisyystilastolliseksi malliksi. Sitä käytetään kuvaamaan kvalitatiivisen vastemallin parametreja.

Videossa mainitussa kaaviossa rivi esittelee kaksi käsitettä - toisen, joka on linjalla ja toisen, joka ei ole. Linjan ulkopuolella olevilla on virhe. Tämä on todellisen arvon (siniset pisteet) ja ennustetun arvon (musta viiva) välinen etäisyys. Mallinnuksen tavoite, riippumatta siitä, missä muodossa tahansa, on minimoida nämä virheet, eli yrittää ohittaa näiden kahden välinen kuilu. Teorian ymmärtämiseksi on muitakin tekniikoita.

Analyticsin ymmärtäminen liiketoiminnassa

Analytiikan koko toiminta jakautuu 3 yksinkertaiseen malliin - ennakoiva, kuvaava ja päätöksentekomalli. Kuten nimestä voi päätellä, se antaa ymmärtää tulevaisuuden. Esimerkiksi järjestelmän epäonnistuminen, luottokelpoisuus ja petokset kuuluvat ennustemalliin, joka on saamassa maailmanlaajuista suosiota tänään. Toisaalta on olemassa kuvaavia ja päätösmalleja, jotka ovat olleet olemassa pitkään. Kuvaavan mallin avulla voidaan luonnehtia tietoja, jolloin voidaan arvioida maan BKT ja keskimääräinen elinajanodote. Se on myös luonteeltaan tutkiva, jossa asiakas antaa tiedot ja ongelma analysoidaan. Asiakkaalle annetaan käsitys ongelmasta ja sitten käytetään päätöksentekomallia, jonka jälkeen ehdotetaan tiettyjä optimointeja. Mallilla on tavoite, joka ei ole muuta kuin optimointi.

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

Aiheeseen liittyvät julkaisut:

yksiulotteinen taulukko java