Nadzorovano in nenadzorovano učenje: ključne razlike

Kazalo:

Anonim

Kaj je nadzorovano strojno učenje?

Pri nadzorovanem učenju vadite stroj z uporabo podatkov, ki so dobro "označeni ". To pomeni, da so nekateri podatki že označeni s pravilnim odgovorom. Primerjamo jo z učenjem, ki poteka v prisotnosti nadzornika ali učitelja.

Nadzorovani učni algoritem se uči iz označenih podatkov o vadbi in vam pomaga napovedati rezultate za nepredvidene podatke. Uspešna gradnja, spreminjanje obsega in uvajanje natančnega nadzorovanega strojnega učenja Model podatkovne znanosti zahteva čas in tehnično znanje skupine visoko usposobljenih znanstvenikov za obdelavo podatkov. Poleg tega mora podatkovni znanstvenik znova zgraditi modele, da bo zagotovil, da dani vpogledi ostanejo resnični, dokler se podatki ne spremenijo.

V tej vadnici boste izvedeli

  • Kaj je nadzorovano strojno učenje?
  • Kaj je nenadzorovano učenje?
  • Zakaj nadzorovano učenje?
  • Zakaj nenadzorovano učenje?
  • Kako deluje nadzorovano učenje?
  • Kako deluje nenadzorovano učenje?
  • Vrste nadzorovanih tehnik strojnega učenja
  • Vrste nenadzorovanih tehnik strojnega učenja
  • Nadzirano in nenadzorovano učenje

Kaj je nenadzorovano učenje?

Nenadzorovano učenje je tehnika strojnega učenja, pri kateri vam ni treba nadzirati modela. Namesto tega morate dovoliti, da model deluje sam, da odkriva informacije. V glavnem se ukvarja z neoznačenimi podatki.

Nenadzorovani učni algoritmi omogočajo izvajanje bolj zapletenih nalog obdelave v primerjavi z nadzorovanim učenjem. Čeprav je nenadzorovano učenje lahko bolj nepredvidljivo v primerjavi z drugimi naravnimi metodami poglobljenega učenja in učnih metod.

Zakaj nadzorovano učenje?

  • Nadzorovano učenje vam omogoča zbiranje podatkov ali ustvarjanje podatkov iz prejšnjih izkušenj.
  • Pomaga vam optimizirati merila uspešnosti z uporabo izkušenj
  • Nadzorovano strojno učenje vam pomaga pri reševanju različnih vrst resničnih računskih problemov.

Zakaj nenadzorovano učenje?

Tu so glavni razlogi za uporabo nenadzorovanega učenja:

  • Nenadzorovano strojno učenje v podatkih najde vse vrste neznanih vzorcev.
  • Nenadzorovane metode vam pomagajo najti funkcije, ki so lahko koristne za kategorizacijo.
  • Poteka v realnem času, zato je treba vse vhodne podatke analizirati in označiti v prisotnosti učencev.
  • Iz računalnika je lažje dobiti neoznačene podatke kot etiketirane podatke, ki potrebujejo ročno posredovanje.

Kako deluje nadzorovano učenje?

Na primer, želite izuriti stroj, ki vam bo pomagal napovedati, kako dolgo bo trajalo, da se s svojega delovnega mesta odpeljete domov. Tu začnete z ustvarjanjem nabora označenih podatkov. Ti podatki vključujejo

  • Vremenske razmere
  • Ura dneva
  • Počitnice

Vse te podrobnosti so vaši vnosi. Rezultat je čas, potreben za vožnjo domov tistega dne.

Instinktivno veste, da če bo zunaj deževalo, bo trajalo dlje, da se odpeljete domov. Toda stroj potrebuje podatke in statistiko.

Poglejmo zdaj, kako lahko v tem primeru razvijete nadzorovani učni model, ki uporabniku pomaga določiti čas vožnje. Prva stvar, ki jo morate ustvariti, je nabor podatkov o vadbi. Ta komplet vadb bo vseboval skupni čas vožnje in ustrezne dejavnike, kot so vreme, čas itd. Na podlagi tega sklopa vadbe bo naprava morda videla, da obstaja neposredna povezava med količino dežja in časom, ki ga boste potrebovali za pot domov.

Torej ugotavlja, da bolj ko dežuje, dlje se boste vozili do svojega doma. Morda bo opazila tudi povezavo med časom, ko zapustiš službo, in časom, ko boš na poti.

Bližje kot ste 18. uri, dlje časa pridete domov. Vaša naprava lahko najde nekatere povezave z vašimi označenimi podatki.

To je začetek vašega podatkovnega modela. Začne vplivati ​​na to, kako dež vpliva na način vožnje. Prav tako se zazna, da več ljudi potuje v določenem času dneva.

Kako deluje nenadzorovano učenje?

Vzemimo primer otroka in njenega družinskega psa.

Ta psa pozna in prepozna. Nekaj ​​tednov kasneje družinski prijatelj pripelje psa in se poskuša igrati z otrokom.

Baby tega psa ni videl že prej. Toda prepozna številne lastnosti (2 ušesi, oči, hoja na 4 nogah) so kot njen hišni pes. Identificira novo žival, kot je pes. To je učenje brez nadzora, kjer vas ne učijo, vendar se učite iz podatkov (v tem primeru podatkov o psu.) Če bi bilo to nadzorovano učenje, bi družinski prijatelj otroku rekel, da gre za psa.

Vrste nadzorovanih tehnik strojnega učenja

Regresija:

Regresijska tehnika predvideva eno izhodno vrednost z uporabo podatkov o treningu.

Primer: Z regresijo lahko na podlagi podatkov o usposabljanju predvidevate ceno hiše. Vhodne spremenljivke bodo kraj, velikost hiše itd.

Razvrstitev:

Klasifikacija pomeni združevanje rezultatov znotraj razreda. Če algoritem poskuša vnos označiti v dva različna razreda, se to imenuje binarna klasifikacija. Izbira med več kot dvema razredoma se imenuje večrazredna klasifikacija.

Primer : Določitev, ali bo nekdo neplačevalec posojila ali ne.

Prednosti : Izhodi imajo vedno verjetnostno razlago in algoritem je mogoče regulirati, da se prepreči prekomerno prilagajanje.

Slabosti : Logistična regresija se lahko izkaže slabo, če obstajajo večkratne ali nelinearne meje odločanja. Ta metoda ni prilagodljiva, zato ne zajema bolj zapletenih odnosov.

Vrste nenadzorovanih tehnik strojnega učenja

Nenadzorovani učni problemi so bili nadalje razvrščeni v težave z združevanjem in združevanjem.

Grozdanje

Grozdenje je pomemben koncept, ko gre za nenadzorovano učenje. Ukvarja se predvsem z iskanjem strukture ali vzorca v zbirki nekategoriziranih podatkov. Algoritmi grozdenja bodo obdelali vaše podatke in našli naravne grozde (skupine), če ti obstajajo v podatkih. Prav tako lahko spremenite, koliko skupin naj vaši algoritmi prepoznajo. Omogoča vam prilagoditev podrobnosti teh skupin.

Združenje

Pravila povezovanja omogočajo vzpostavljanje asociacij med podatkovnimi objekti znotraj velikih baz podatkov. Ta nenadzorovana tehnika govori o odkrivanju razburljivih odnosov med spremenljivkami v velikih zbirkah podatkov. Na primer, ljudje, ki kupijo nov dom, najverjetneje kupijo novo pohištvo.

Drugi primeri:

  • Podskupina bolnikov z rakom, združenih po meritvah genske ekspresije
  • Skupine kupcev na podlagi njihove zgodovine brskanja in nakupa
  • Filmska skupina glede na oceno gledalcev

Nadzirano in nenadzorovano učenje

Parametri Nadzorovana tehnika strojnega učenja Nenadzorovana tehnika strojnega učenja
Proces V nadzorovanem učnem modelu bodo podane vhodne in izhodne spremenljivke. V nenadzorovanem učnem modelu bodo podani samo vhodni podatki
Vhodni podatki Algoritmi se učijo z uporabo označenih podatkov. Algoritmi se uporabljajo za podatke, ki niso označeni
Uporabljeni algoritmi Podporni vektorski stroj, nevronska mreža, linearna in logistična regresija, naključni gozd in klasifikacijska drevesa. Nenadzorovane algoritme lahko razdelimo v različne kategorije: na primer algoritmi grozdov, K-sredstva, hierarhično združevanje v skupine itd.
Računalniška kompleksnost Nadzorovano učenje je preprostejša metoda. Nenadzorovano učenje je računsko zapleteno
Uporaba podatkov Nadzorovani učni model uporablja podatke o usposabljanju, da se nauči povezave med vhodom in izhodom. Nenadzorovano učenje ne uporablja izhodnih podatkov.
Natančnost rezultatov Zelo natančna in zaupanja vredna metoda. Manj natančna in zaupanja vredna metoda.
Učenje v realnem času Metoda učenja poteka brez povezave. Metoda učenja poteka v realnem času.
Število razredov Število razredov je znano. Število razredov ni znano.
Glavna pomanjkljivost Razvrščanje velikih podatkov je lahko pravi izziv pri nadzorovanem učenju. Ne morete dobiti natančnih informacij v zvezi z razvrščanjem podatkov, izhodni podatki kot podatki, ki se uporabljajo pri nenadzorovanem učenju, so označeni in niso znani.

Povzetek

  • Pri nadzorovanem učenju vadite stroj z uporabo podatkov, ki so dobro "označeni".
  • Nenadzorovano učenje je tehnika strojnega učenja, pri kateri vam ni treba nadzirati modela.
  • Nadzorovano učenje vam omogoča zbiranje podatkov ali ustvarjanje podatkov iz prejšnjih izkušenj.
  • Strojno učenje brez nadzora vam pomaga najti vse vrste neznanih vzorcev v podatkih.
  • Tako boste na primer lahko določili čas, potreben za vrnitev nazaj, glede na vremenske razmere, čas dneva in praznike.
  • Na primer, Baby lahko na podlagi preteklega nadzorovanega učenja prepozna druge pse.
  • Regresija in klasifikacija sta dve vrsti nadzorovanih tehnik strojnega učenja.
  • Grozdenje in združevanje sta dve vrsti nenadzorovanega učenja.
  • V nadzorovanem učnem modelu bodo podane vhodne in izhodne spremenljivke, pri nenadzorovanem učnem modelu pa le vhodni podatki