SQL Data Science: Yhden luukun ratkaisu aloittelijoille



Tämä SQL for Data Science -blogiviesti auttaa sinua ymmärtämään, kuinka SQL: ää voidaan käyttää tietojen tallentamiseen, käyttämiseen ja noutamiseen tietojen analysoimiseksi.

Koska Data Science on luokiteltu aikakauden lupaavimmaksi työpaikaksi, yritämme kaikki liittyä kilpailuun . Tämä SQL for Data Science -blogiviesti auttaa sinua ymmärtämään, kuinka SQL: ää voidaan käyttää tietojen tallentamiseen, käyttämiseen ja noutamiseen tietojen analysoimiseksi.

Tässä on luettelo aiheista käsitelty tässä blogissa:





    1. Miksi SQL tarvitaan datatieteeseen?
    2. Mikä on SQL?
    3. SQL: n perusteet
    4. MySQL: n asentaminen
    5. Hands-On

Miksi SQL tarvitaan datatieteeseen?

Tiesitkö, että tuotamme yli 2,5 kvintillionia tavua tietoja joka päivä? Tämä tiedonsiirtonopeus on syy muun muassa huippuluokan tekniikoiden suosioon Datatiede , , ja niin edelleen.

Hyödyllisten oivallusten johtaminen tiedoista on nimeltään Data Science. Tietotiede sisältää tonnien tietojen talteenoton, käsittelyn ja analysoinnin. Tällä hetkellä tarvitsemme joita voidaan käyttää tämän valtavan määrän tietojen tallentamiseen ja hallintaan.



Mikä on datatiede - Edureka

Täällä SQL tulee sisään.

SQL: ää voidaan käyttää valtavien tietomäärien tallentamiseen, käyttämiseen ja purkamiseen, jotta koko Data Science -prosessi voidaan suorittaa sujuvammin.



Mikä on SQL?

SQL joka tarkoittaa jäsenneltyä kyselykieltä on kyselykieli, jonka tarkoituksena on hallita relaatiotietokantoja.

Mutta mikä on relaatiotietokanta?

Relaatiotietokanta on joukko hyvin määriteltyjä taulukoita, joista tietoja voidaan käyttää, muokata, päivittää ja niin edelleen ilman, että tietokantataulukoita on muutettava. SQL on relaatiotietokantojen standardi (API).

Palataksemme SQL: ään, SQL-ohjelmointia voidaan käyttää useiden tietojen käsittelyyn, kuten tietokantatietueiden kyselyyn, lisäämiseen, päivittämiseen ja poistamiseen. Esimerkkejä relaatiotietokannoista, jotka käyttävät SQL: ää, ovat MySQL Database, Oracle jne.

Saat lisätietoja SQL: stä käymällä läpi seuraavat blogit:

  1. SQL-tietotyyppien ymmärtäminen - kaikki mitä sinun tarvitsee tietää SQL-tietotyypeistä
  2. Luo taulukko SQL: ssä - kaikki mitä sinun tarvitsee tietää taulukoiden luomisesta SQL: ssä

Ennen kuin aloitamme esittelyn SQL: ssä, tutustutaan SQL-peruskomentoihin.

SQL: n perusteet

SQL tarjoaa joukon yksinkertaisia ​​komentoja tietotaulukoiden muokkaamiseksi. Käydään läpi joitain SQL-peruskomentoja:

  • Luo tietokanta - luo uuden tietokannan
  • LUO TAULUKKO - luo uuden taulukon
  • LAITTAA SISÄÄN - lisää uusia tietoja tietokantaan
  • VALITSE - poimii tietoja tietokannasta
  • PÄIVITÄ - päivittää tietoja tietokannassa
  • POISTA - poistaa tietoja tietokannasta
  • MUUTTU TIETOKANTA - muokkaa tietokantaa
  • MUUTTOTAULUKKO - muokkaa taulukkoa
  • PUDOTUSTAULUKKO - poistaa taulukon
  • LUO HAKEMISTO - luo hakemiston elementin hakemiseksi
  • DROP INDEX - poistaa hakemisto

Ymmärrämme paremmin SQL: ää asentamalla MySQL ja katsomalla, kuinka voit pelata datalla.

MySQL: n asentaminen

MySQL: n asentaminen on yksinkertainen tehtävä. Tässä on vaiheittainen opas se auttaa asentamaan MySQL: n järjestelmääsi.

Kun asennus on valmis MySQL, seuraa alla olevaa osiota saadaksesi yksinkertaisen esittelyn, joka näyttää kuinka voit lisätä, käsitellä ja muokata tietoja.

SQL tietojenkäsittelyyn - MySQL-esittely

Tässä esittelyssä näemme kuinka luoda tietokantoja ja käsitellä niitä. Tämä on aloittelijan tason esittely, jolla pääset alkuun tietojen analysoinnilla SQL: ssä.

Joten aloitetaan!

Vaihe 1: Luo SQL-tietokanta

SQL-tietokanta on varastovarasto, johon tietoja voidaan tallentaa jäsennetyssä muodossa. Luodaan nyt tietokanta käyttämällä MySQL :

LUO DATABASE edureka KÄYTÄ edureka

Yllä olevassa koodissa on kaksi SQL-komentoa:

Huomautus : SQL-komennot määritellään isoilla kirjaimilla ja puolipistettä käytetään lopettamaan SQL-komento.

  1. Luo tietokanta: Tämä komento luo tietokannan nimeltä 'edureka'

  2. KÄYTTÖ: Tätä komentoa käytetään tietokannan aktivointiin. Tässä aktivoimme 'edureka' -tietokannan.

Vaihe 2: Luo taulukko vaadituilla dataominaisuuksilla

Taulukon luominen on yhtä helppoa kuin tietokannan luominen. Sinun tarvitsee vain määritellä muuttujat tai taulukon ominaisuudet vastaavilla tietotyypeillä. Katsotaanpa, miten tämä voidaan tehdä:

LUO PÖYTÄ-lelut (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, määrä INTEGER)

Edellä olevassa koodinpätkässä esiintyy seuraavia asioita:

  1. Luo taulukko nimeltä lelut 'Luo taulukko' -komennolla.
  2. Lelupöytä sisältää 4 ominaisuutta, nimittäin TID (tapahtuman tunnus), nimikkeen_nimi, hinta ja määrä.
  3. Jokainen muuttuja määritellään vastaavilla tietotyypeillä.
  4. TID-muuttuja ilmoitetaan ensisijaisena avaimena. Ensisijainen avain tarkoittaa periaatteessa muuttujaa, joka voi tallentaa ainutlaatuisen arvon.

Voit tarkistaa määritetyn taulukon tiedot seuraavalla komennolla:

KUVAUS leluja

Vaihe 3: Lisätään tietoja taulukkoon

Nyt kun olemme luoneet taulukon, täytetään se joillakin arvoilla. Aiemmin tässä blogissa mainitsin, kuinka voit lisätä tietoja taulukkoon vain yhdellä komennolla, eli INSERT INTO.

Katsotaanpa, miten tämä tehdään:

LISÄÄ LELUARVOIHIN (NULL, 'Juna', 550, 88) LISÄÄ LELUARVOIHIN (NULL, 'Hotwheels_car', 350, 80) LISÄÄ LELUARVOIHIN (NULL, 'Magic_Pencil', 70, 100) LISÄÄ LELUARVOIHIN ( NULL, 'Dog_house', 120, 54) ASENNA LELUARVOIHIN (NULL, 'Skateboard', 700, 42) LISÄÄ LELUARVOIHIN (NULL, 'GI Joe', 300, 120)

Yllä olevassa koodinpätkässä lisäsimme yksinkertaisesti 6 havaintoa 'lelut' -taulukkoon INSERT INTO -komennolla. Kullekin havainnolle suluissa on määritetty jokaisen muuttujan tai ominaisuuden arvo, joka määritettiin taulukon luomisen yhteydessä.

TID-muuttujaksi on asetettu NULL, koska se kasvaa automaattisesti arvosta 1.

Näytetään nyt kaikki taulukossamme olevat tiedot. Tämä voidaan tehdä käyttämällä seuraavaa komentoa:

VALITSE * LELUISTA


Vaihe 4: Muokkaa tietueita

Oletetaan, että päätit nostaa G.I. Joe, koska se saa sinut paljon asiakkaita. Kuinka päivität muuttujan hinnan tietokannassa?

Se on yksinkertaista, käytä vain seuraavaa komentoa:

PÄIVITÄ lelut SÄÄTÖ = 350, JOS TID = 6

UPDATE-komennon avulla voit muokata taulukkoon tallennettuja arvoja / muuttujia. SET-parametrin avulla voit valita tietyn ominaisuuden ja WHERE-parametria käytetään tunnistamaan muuttuja / arvo, jota haluat muuttaa. Yllä olevassa komennossa olen päivittänyt sen tietosyötteen hinnan, jonka TID on 6 (G.I. Joe).

Katsotaan nyt päivitettyä taulukkoa:

VALITSE * LELUISTA

mitä ideota jaavalle

Voit myös muokata näytettävää sisältöä viittaamalla vain tarkasteltaviin sarakkeisiin. Esimerkiksi alla oleva komento näyttää vain lelun nimen ja sen hinnan:

VALITSE Tuotteen_nimi, Hinta LELUISTA

Vaihe 5: Haetaan tietoja

Joten tietojen lisäämisen ja muokkaamisen jälkeen on vihdoin aika poimia ja hakea tietoja liiketoiminnan vaatimusten mukaisesti. Täältä voidaan hakea tietoja tietojen jatkoanalyysiä ja mallintamista varten.

Huomaa, että tämä on yksinkertainen esimerkki SQL: n käytön aloittamisesta, mutta tosielämän tilanteissa tiedot ovat paljon monimutkaisempia ja kooltaan suurempia. Tästä huolimatta SQL-komennot pysyvät edelleen ennallaan, ja juuri tästä syystä SQL on niin yksinkertainen ja ymmärrettävä. Se voi käsitellä monimutkaisia ​​tietojoukkoja yksinkertaisilla SQL-komennoilla.

Noudetaan nyt tietoja muutamalla muunnoksella. Katso alla olevaa koodia ja yritä ymmärtää, mitä se tekee katsomatta lähtöä:

VALITSE * LELUISTA RAJA 2

Sinä arvasit sen! Se näyttää taulukossa olevat kaksi ensimmäistä havaintoa.

Kokeillaan jotain mielenkiintoisempaa.

VALITSE * LELUISTA TILAA HINTA ASC

Kuten kuvassa esitetään, arvot on järjestetty hintamuuttujan nousevaan järjestykseen nähden. Jos haluat etsiä kolmea yleisimmin ostettua tuotetta, mitä tekisit?

Se on todella yksinkertaista!

VALITSE * LELUISTA TILAA MÄÄRÄ KUVAUSRAJA 3

Kokeillaan vielä yhtä.

VALITSE * LELUISTA MISSÄ Hinta> 400 TILAA HINNASTA


Tämä kysely poimi yksityiskohdat leluista, joiden hinta on yli 400, ja järjestää tuotoksen hinnan nousevaan järjestykseen.

Joten voit käsitellä tietoja SQL: n avulla. Nyt kun tiedät SQL-tietotieteen perusteet, olet varma, että haluat tietää lisää. Tässä on pari blogia aloittaaksesi:

  1. Mikä on datatiede? Aloittelijan opas tietojenkäsittelyyn
  2. MySQL-opetusohjelma - Aloittelijan opas MySQL: n oppimiseen

Jos haluat ilmoittautua koko tekoälyn ja koneoppimisen kurssille, Edurekalla on erityisesti kuratoitu joka tekee sinusta taitavan tekniikoista, kuten valvotusta oppimisesta, valvomattomasta oppimisesta ja luonnollisen kielen prosessoinnista. Se sisältää koulutuksen uusimmista kehityksistä ja teknisistä lähestymistavoista tekoälyyn ja koneoppimiseen, kuten syväoppiminen, graafiset mallit ja vahvistusoppiminen.