R-ohjelmointi - Aloittelijan opas R-ohjelmointikielelle

Tämä blogi R-ohjelmoinnista tutustuttaa sinut R: ään ja auttaa sinua ymmärtämään R-ohjelmoinnin eri peruskäsitteitä yksityiskohtaisesti esimerkkien avulla.

R on yksi suosituimmista analyysityökaluista. Mutta sen lisäksi, että R on analyysi, se on myös ohjelmointikieli.IT-teollisuuden kasvun myötä ammattitaitoisten tai ymmärtämällä R sekä data-analyysityökaluna että ohjelmointikielenä.Tässä blogissa autan sinua ymmärtämään R-ohjelmoinnin eri perusteita. Meidän s hurja Blogi ,olemme keskustelleet Miksi tarvitsemme Analyticsia, mikä on yritysanalytiikka, miksi ja kuka käyttää R.

Tässä blogissa ymmärrämme R-ohjelmoinnin alla olevat peruskäsitteet seuraavassa järjestyksessä:



  1. Muuttujat
  2. Tietotyypit
  3. Dataoperaattorit
  4. Ehdollinen lausuma
  5. Silmukat
  6. Toiminnot

Voit käydä läpi R-ohjelmointikielen webinaaritallennuksen, jossa ohjaajamme on selittänyt aiheet yksityiskohtaisesti esimerkkien avulla, jotka auttavat sinua ymmärtämään R-ohjelmointia paremmin.

R-ohjelmointi aloittelijoille | R Ohjelmointikielen opetusohjelma Edureka

Joten siirrytään eteenpäin ja tarkastellaan R-ohjelmoinnin ensimmäistä käsitettä - muuttujia.

R Ohjelmointi: Muuttujat

Muuttujat eivät ole muuta kuin nimi muistipaikkaan, joka sisältää arvon. Muuttuja R: ssä voi tallentaa lukuarvoja, monimutkaisia ​​arvoja, sanoja, matriiseja ja jopa taulukon. Yllättävää, eikö?

Muuttuja - R-ohjelmointi - Edureka

Kuva: Luominenmuuttujista

Yllä oleva kuva näyttää kuinka muuttujat luodaan ja miten ne tallennetaan eri muistilohkoihin. R: ssä meidän ei tarvitse ilmoittaa muuttujaa ennen kuin käytämme sitä, toisin kuin muut ohjelmointikielet, kuten Java, C, C ++ jne.

Siirrytään eteenpäin ja yritetään ymmärtää, mikä on tietotyyppi ja erilaiset tietotyypit, joita R tukee.

R-ohjelmointi: tietotyypit

R: ssä muuttujaa itsestään ei ilmoiteta mistään tietotyypistä, vaan se saa sille osoitetun R-objektin tietotyypin. Joten R: ää kutsutaan dynaamisesti kirjoitetuksi kieleksi, mikä tarkoittaa, että voimme muuttaa saman muuttujan tietotyyppiä uudestaan ​​ja uudestaan ​​käytettäessä sitä ohjelmassa.

Tietotyypit määrittelee minkä tyyppisen arvon muuttujalla on ja minkä tyyppisiä matemaattisia, relaatio- tai loogisia operaatioita voidaan käyttää siihen aiheuttamatta virhettä. R: ssä on monia tietotyyppejä, mutta alla ovat kuitenkin yleisimmin käytetyt:

Keskustelkaamme nyt jokaisesta näistä tietotyypeistä erikseen, alkaen vektorista.

Vektorit

Vektorit ovat kaikkein perustavanlaatuisimmat R-dataobjektit, ja atomivektoreita on kuusi tyyppiä. Alla on kuusi atomivektoria:

Looginen : Sitä käytetään loogisen arvon tallentamiseen TOTTA tai VÄÄRÄ .

Numeerinen : Sitä käytetään sekä positiivisten että negatiivisten lukujen tallentamiseen, mukaan lukien reaaliluku.

Esim .: 25, 7.1145, 96547

Kokonaisluku : Se sisältää kaikki kokonaisluvut eli kaikki positiiviset ja negatiiviset kokonaisluvut.

Esim .: 45.479, -856.479, 0

Monimutkainen : Nämä ovat muotoa x + yi, jossa x ja y ovat numeerisia ja i edustaa -1: n neliöjuuria.

Esim .: 4 + 3i

Merkki : Sitä käytetään joko yhden merkin, merkkiryhmän (sanojen) tai sanaryhmän tallentamiseen yhteen. Merkit voidaan määritellä joko lainausmerkeinä tai kaksoislainausmerkeinä.

Esimerkiksi: 'Edureka', 'R on hauskaa oppia'.

Yleensä vektori määritellään ja alustetaan seuraavasti:

Vtr = c (2, 5, 11, 24) Tai Vtr<- c(2, 5, 11 , 24)

Siirrytään eteenpäin ja ymmärretään muut R-tyypin tietotyypit

Lista

Luettelot ovat melko samanlaisia ​​kuin vektorit, mutta luettelot ovat R-objekteja, jotka voivat sisältää erityyppisiä elementtejä, kuten & miinus numerot, merkkijonot, vektorit ja toisen luettelon sen sisällä.

Esim:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Tuotos:

[[1]] [1] Hei 'Hei' Kuinka teetkö [[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] TOSI

Matriisi

Matriisi on R-objekti, johon elementit on järjestetty kaksiulotteiseksi suorakulmaiseksi.

Perussyntaksi matriisin luomiseksi R: ään on & miinus

 matriisi (data, nrow, ncol, byrow, dimnames) 

Missä:

  • tiedot on tulovektori, josta tulee matriisin dataelementtejä.
  • nyt on luotavien rivien määrä.
  • ncol on luotavien sarakkeiden määrä.
  • byrow on looginen vihje. Jos TOSI, niin tulovektori-elementit on järjestetty riveittäin.
  • himmeä nimi on riveille ja sarakkeille määritetyt nimet.

Esimerkki:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Tuotos:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

R-ryhmät ovat dataobjekteja, joita voidaan käyttää tietojen tallentamiseen useammassa kuin kahdessa ulottuvuudessa. Se ottaa vektorit syötteeksi ja käyttää arvoja ei parametri taulukon luomiseksi.

Taulukon luomisen perussyntakse R: ssä on & miinus

 taulukko (data, himmeä, himmeä nimi) 

Missä:

  • tiedot on tulovektori, josta tulee matriisin dataelementit.
  • ei on matriisin ulottuvuus, jossa välitetään rivien, sarakkeiden ja mainittujen ulottuvuuksien avulla luotavien matriisien määrä.
  • himmeä nimi on riveille ja sarakkeille määritetyt nimet.

Esimerkki:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Tuotos:

miten hashmap otetaan käyttöön
, , yksi [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Datakehys

Datakehys on taulukko tai kaksiulotteinen matriisimainen rakenne, jossa kukin sarake sisältää yhden muuttujan arvot ja jokainen rivi sisältää yhden joukon arvojavartenjokaisessa sarakkeessa. Alla on joitain tietokehyksen ominaisuuksia, jotka on otettava huomioon joka kerta, kun työskentelemme niiden kanssa:

  • Sarakkeiden nimien tulee olla tyhjiä.
  • Jokaisessa sarakkeessa tulisi olla sama määrä tietoalkioita.
  • Datakehykseen tallennetut tiedot voivat olla numeerisia, tekijä- tai merkityyppisiä.
  • Rivien nimien tulisi olla yksilöllisiä.

Esimerkki:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') osasto = c ('myynti', 'talous', 'markkinointi', 'HR ',' T & K ') tiedot<- data.frame(emp_id, emp_name, dept) emp.data 

Tuotos:

emp_id emp_name osasto 1100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4103 Ron HR 5 104 Gary T & K

Joten nyt, kun olemme ymmärtäneet R: n perustietotyypit, on aika sukeltaa syvälle R: ään ymmärtämällä Data Operators -konseptit.

R-ohjelmointi: dataoperaattorit

R: ssä on pääasiassa 4 dataoperaattoria, ne näkyvät alla:

Aritmeettiset operaattorit : Nämä operaattorit auttavat meitä suorittamaan aritmeettiset perustoiminnot, kuten yhteenlasku, vähennyslasku, kertolasku jne.

Harkitse seuraavaa esimerkkiä:

num1 = 15 num2 = 20 num3 = 0 #lisäys num3 = num1 + num2 num3 #substraktio num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #lattiajako num3 = num1% /% num2 num3

Tuotos:

[1] 35 [viisitoista [1] 300 [1] 0,75 [1] 15 [1] 125 [yksitoista

Suhteelliset operaattorit : Nämä operaattorit auttavat meitä suorittamaan relaatiooperaatiot, kuten tarkistamaan, onko muuttuja suurempi, pienempi tai yhtä suuri kuin toinen muuttuja. Relaatiooperaation tulos on aina looginen arvo.

Harkitse seuraavia esimerkkejä:

num1 = 15 num2 = 20 # on yhtä suuri kuin num3 = (num1 == num2) num3 # ei ole yhtä suuri kuin num3 = (num1! = num2) num3 #eroton kuin num3 = (num1 num2) num3 #less kuin yhtä suuri kuin num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Tuotos:

[1] EPÄTOSI [1] TOSI [1] TOSI [1] EPÄTOSI [1] TOSI [1] EPÄTOSI

Tehtäväoperaattorit: Näitä operaattoreita käytetään määrittämään arvot R.-muuttujille. Määritys voidaan suorittaa käyttämällä joko määritysoperaattoria(<-) tai vastaa operaattoria (=). Muuttujan arvo voidaan määrittää kahdella tavalla: vasen ja oikea.

LooginenOperaattorit: Nämä operaattorit vertailevat kahta kokonaisuutta ja niitä käytetään tyypillisesti loogisten (loogisten) arvojen, kuten ”ja”, ”tai”, kanssaja'ei'.


R-ohjelmointi: Ehdolliset lausunnot

  1. If-lausunto: If-lause auttaa sinua arvioimaan yksittäisen lausekkeen osana virtausta. Tämän arvioinnin suorittamiseksi sinun tarvitsee vain kirjoittaa If-avainsana ja sen jälkeen arvioitava lauseke. Seuraava vuokaavio antaa käsityksen siitä, kuinka If-käsky ohjaa koodin kulkua: Harkitse seuraavaa esimerkkiä:
num1 = 10 num2 = 20 if (numero1<=num2){ print('Num1 is less or equal to Num2') 

Tuotos:

[1] 'Num1 on pienempi tai yhtä suuri kuin Num2'
  • Muut If-lausunto: Else if -lauseke auttaa laajentamaan haaroja If-käskyn luomaan virtaukseen ja antaa sinulle mahdollisuuden arvioida useita ehtoja luomalla uusia virtauksen haaroja. Alla oleva vuokaavio antaa sinulle käsityksen siitä, miten muut if-lause haarautuu koodin kulkuun:

    Harkitse seuraavaa esimerkkiä:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {tulosta ('Num2 on pienempi kuin Num1')} muuta jos ('Num1 == Num2) {tulosta (' Num1 ja Num2 ovat yhtä suuret ')}

    Tuotos:

    [1] 'Num1 on pienempi kuin Num2'

  • Muu lausunto: Muut-lausetta käytetään, kun kaikki muut lausekkeet on tarkistettu ja todettu virheellisiksi. Tämä on viimeinen käsky, joka suoritetaan osana If - Else if -haaraa. Alla oleva vuokaavio antaa sinulle paremman käsityksen siitä, miten Else muuttaa koodin kulkua:

Harkitse seuraavaa esimerkkiä:

Num1 = 5 Num2 = 20 if (Num1 Num2) {tulosta ('Num2 on pienempi kuin Num1')} muuta tulosta ('Num1 ja Num2 ovat yhtä suuret')}

Tuotos:

[1] 'Num1 ja Num2 ovat yhtä suuret'

R Ohjelmointi: Silmukat

Loop-lause antaa meille mahdollisuuden suorittaa lause tai lauseryhmä useita kertoja. R: ssä on pääasiassa 3 tyyppiä silmukoita:

  1. toista silmukka : Se toistaa lauseen tai lauseryhmän, kun tietty ehto on TOSI. Toistosilmukka on paras esimerkki poistumisohjatusta silmukasta, jossa koodi suoritetaan ensin ja sitten kunto tarkistetaan sen selvittämiseksi, pitäisikö ohjauksen olla silmukan sisällä vai poistua siitä. Alla on ohjausvirta toistosilmukassa:
    Katsotaanpa alla olevaa esimerkkiä ymmärtääksemme, kuinka voimme käyttää toistosilmukkaa lisätäksesi n lukua, kunnes summa saavuttaa yli 100:

    x = 2 toista {x = x ^ 2 tulosta (x) jos (x> 100) {tauko}

    Tuotos:

    [1] 4 [1] 16 [1] 256
  2. kun silmukka : Minät auttaa toistamaan lauseen tai lauseiden ryhmän, kun tietty ehto on TOSI. Vaikka silmukka, verrattuna toistosilmukkaan, on hieman erilainen, se on esimerkki sisääntulohallitusta silmukasta, jossa ehto tarkistetaan ensin ja vain, jos ehdon todetaan olevan totta, ohjaus toimitetaan silmukan sisään koodin suorittamiseksi . Alla on ohjausvirta hetken silmukassa:
    Katsotaanpa alla olevaa esimerkkiä lisätäksesi ensimmäisten 10 numeron neliösummat ja ymmärrämme kuinka while-silmukka toimii paremmin:

    num = 1 sumn = 0 kun (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Tuotos:

    [yksitoista [viisitoista [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. joukkueelle Loop : Sitä käytetään toistamaan lauseke tai ryhmä niistä kiinteän määrän kertoja. Toisin kuin toisto- ja taas-silmukka, for-silmukkaa käytetään tilanteissa, joissa olemme tietoisia siitä, kuinka monta kertaa koodi on suoritettava etukäteen. Se on samanlainen kuin while-silmukka, jossa ehto tarkistetaan ensin ja sitten vain sisälle kirjoitettu koodi suoritetaan. Katsotaan silmukan hallinnan kulkua nyt:

Katsotaan nyt esimerkkiä, jossa käytämme for-silmukkaa tulostaaksesi ensimmäiset 10 numeroa:

mitä .trim tekee java
for (x in 1:10) {tulosta (x)}

Tuotos:

[yksitoista [1] 2 [1] 3 [1] 4 [viisitoista [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Ohjelmointi: Toiminnot

Funktio on järjestetyn, uudelleenkäytettävän koodin lohko, jota käytetään yhden, siihen liittyvän toiminnon suorittamiseen. R: ssä on pääasiassa kahdenlaisia ​​toimintoja:

Ennalta määritetyt toiminnot : Nämä ovat sisäänrakennettuja toimintoja, joita käyttäjä voi käyttää työnsä tekemiseen helppor. Esimerkiksi: mean( x) , sum( x) , sqrt ( x ), yläosa( x ), jne.

Käyttäjän määrittelemä Toiminnot: Käyttäjä luo nämä toiminnot vastaamaan käyttäjän tiettyjä vaatimuksia. Alla on syntaksin funktion luomiseenR:

 func  tion_name  <– toiminto (arg_1, arg_2 ja hellip){ // Toiminnon runko }

Harkitse seuraavaa esimerkkiä yksinkertaisesta funktiosta neliöiden summan muodostamiseksi/2 numeroa:

neliön summa<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Lähtö: [1] 25

Toivottavasti olet nauttinut tämän R-ohjelmointiblogin lukemisesta. Olemme käsittäneet kaikki R: n perusteet tässä opetusohjelmassa, joten voit aloittaa harjoituksen nyt. Tämän R-ohjelmointiblogin jälkeen aion luoda lisää blogeja R: lle Analyticsille, joten pysy kuulolla.

Nyt kun olet ymmärtänyt R: n perusteet, tutustu Edureka, luotettava verkko-oppimisyritys, jolla on yli 250 000 tyytyväisen oppijan verkosto, joka levisi ympäri maailmaa. Edurekan Data Analytics with R -koulutus auttaa sinua hankkimaan asiantuntemusta R-ohjelmoinnista, tietojen manipuloinnista, tutkivasta tietojen analysoinnista, tietojen visualisoinnista, tiedon louhinnasta, regressiosta, mielipiteen analysoinnista ja RStudion käytöstä tosielämän tapaustutkimuksissa vähittäiskaupassa, sosiaalisessa mediassa.

Onko sinulla kysymys meille? Mainitse se tämän “R-ohjelmointi” -blogin kommenttiosassa ja otamme sinuun yhteyttä mahdollisimman pian.