Nyckelskillnad - Övervakad vs Ej övervakad maskininlärning
Övervakat lärande och övervakat lärande är två kärnkoncept för maskininlärning. Supervised Learning är en maskininlärningsuppgift att lära sig en funktion som kartlägger en ingång till en utgång baserat på exemplen ingångs- och utgångspar. Oövervakad inlärning är maskininlärningsuppgiften att härleda en funktion för att beskriva dold struktur från omärkta data. Huvudskillnaden mellan övervakad och oövervakad maskininlärning är att övervakad inlärning använder märkta data medan övervakad inlärning använder omärkt data.
Maskininlärning är ett fält inom datavetenskap som ger ett datorsystem möjlighet att lära av data utan att uttryckligen programmeras. Det gör det möjligt att analysera data och att förutsäga mönster i den. Det finns många tillämpningar av maskininlärning. Några av dem är ansiktsigenkänning, gestigenkänning och taligenkänning. Det finns olika algoritmer relaterade till maskininlärning. Några av dem är regression, klassificering och klustring. De vanligaste programmeringsspråken för utveckling av maskininlärningsbaserade applikationer är R och Python. Andra språk som Java, C ++ och Matlab kan också användas.
INNEHÅLL
1. Översikt och nyckelskillnad
2. Vad är övervakat lärande
3. Vad är övervakat lärande
4. Likheter mellan övervakat och övervakat maskininlärning
5. Jämförelse sida vid sida - Övervakad kontra maskinövervakning utan tillsyn i tabellform
6. Sammanfattning
Vad är övervakat lärande?
I maskininlärningsbaserade system fungerar modellen enligt en algoritm. I övervakat lärande övervakas modellen. Först krävs det att träna modellen. Med den tillförda kunskapen kan den förutsäga svar för framtida instanser. Modellen tränas med hjälp av en märkt dataset. När ett urval av data ges till systemet kan det förutsäga resultatet. Nedan följer ett litet utdrag från den populära IRIS-datasetet.
I enlighet med ovanstående tabell kallas skålens längd, skålens bredd, patellängden, patelbredden och arten attributen. Kolumnerna är kända som funktioner. En rad har data för alla attribut. Därför kallas en rad en observation. Uppgifterna kan antingen vara numeriska eller kategoriska. Modellen ges observationer med motsvarande artnamn som inmatning. När en ny observation ges bör modellen förutsäga vilken typ av art den tillhör.
I övervakat lärande finns algoritmer för klassificering och regression. Klassificering är processen för klassificering av märkta data. Modellen skapade gränser som separerade datakategorierna. När nya data tillhandahålls till modellen kan den kategoriseras utifrån var poängen finns. De K-närmaste grannarna (KNN) är en klassificeringsmodell. Beroende på k-värdet bestäms kategorin. Till exempel, när k är 5, om en viss datapunkt är nära åtta datapunkter i kategori A och sex datapunkter i kategori B, kommer datapunkten att klassificeras som A.
Regressionen är processen att förutsäga trenden med tidigare data för att förutsäga resultatet av de nya uppgifterna. I regression kan utdata bestå av en eller flera kontinuerliga variabler. Förutsägelse görs med en rad som täcker de flesta datapunkter. Den enklaste regressionsmodellen är en linjär regression. Det är snabbt och kräver ingen inställningsparametrar som i KNN. Om data visar en parabolisk trend är den linjära regressionsmodellen inte lämplig.
Det här är några exempel på övervakade inlärningsalgoritmer. Generellt är resultaten som genereras från övervakade inlärningsmetoder mer exakta och tillförlitliga eftersom indata är välkända och märkta. Därför måste maskinen bara analysera dolda mönster.
Vad är oövervakat lärande?
I icke-övervakat lärande övervakas inte modellen. Modellen fungerar på egen hand för att förutsäga resultaten. Det använder maskininlärningsalgoritmer för att komma till slutsatser om omärkta data. Generellt sett är de övervakade inlärningsalgoritmerna svårare än övervakade inlärningsalgoritmer eftersom det finns få information. Kluster är en typ av övervakat lärande. Den kan användas för att gruppera okänd data med hjälp av algoritmer. K-medelvärdet och densitetsbaserat kluster är två klusteralgoritmer.
k-medelalgoritm, placerar k centroid slumpmässigt för varje kluster. Sedan tilldelas varje datapunkt till närmaste centroid. Euklidiskt avstånd används för att beräkna avståndet från datapunkten till centroid. Datapunkterna klassificeras i grupper. Positionerna för k centroider beräknas igen. Den nya centroidpositionen bestäms av medelvärdet av alla punkter i gruppen. Återigen tilldelas varje datapunkt till närmaste centroid. Denna process upprepas tills centroiderna inte längre ändras. k-medel är en snabb klusteralgoritm, men det finns ingen specificerad initialisering av klusterpunkter. Det finns också en stor variation av klustermodeller baserat på initialisering av klusterpunkter.
En annan klusteralgoritm är densitetsbaserad kluster. Det är också känt som Density Based Spatial Clustering Applications med buller. Det fungerar genom att definiera ett kluster som den maximala uppsättningen av densitetsanslutna punkter. De är två parametrar som används för densitetsbaserad gruppering. De är Ɛ (epsilon) och minimipoäng. Ɛ är den maximala radien för grannskapet. Minimipoängen är det minsta antalet poäng i området Ɛ för att definiera ett kluster. Det här är några exempel på kluster som faller in under inlärning utan tillsyn.
Generellt är resultaten som genereras från oövervakade inlärningsalgoritmer inte mycket exakta och tillförlitliga eftersom maskinen måste definiera och märka ingångsdata innan de dolda mönster och funktioner bestäms.
Vad är likheten mellan övervakad och icke övervakad maskininlärning?
Både övervakat och övervakat lärande är typer av maskininlärning
Vad är skillnaden mellan övervakad och oövervakad maskininlärning?
Skilja artikeln mitt före bordet
Övervakad kontra maskinövervakning utan tillsyn |
|
Övervakad inlärning är maskininlärningsuppgiften att lära sig en funktion som mappar en ingång till en utgång baserat på exempelvis ingångs- och utgångspar. | Oövervakad inlärning är maskininlärningsuppgiften att härleda en funktion för att beskriva dold struktur från omärkta data. |
Huvudfunktionalitet | |
I övervakad inlärning förutsäger modellen resultatet baserat på de märkta indata. | Vid inlärning utan tillsyn förutsäger modellen resultatet utan märkt data genom att identifiera mönstren på egen hand. |
Resultatens noggrannhet | |
Resultaten från övervakade inlärningsmetoder är mer exakta och tillförlitliga. | Resultaten från inlärningsmetoder utan tillsyn är inte mycket exakta och tillförlitliga. |
Huvudalgoritmer | |
Det finns algoritmer för regression och klassificering i övervakat lärande. | Det finns algoritmer för gruppering i inlärning utan tillsyn. |
Sammanfattning - Övervakad vs Ej övervakad maskininlärning
Övervakat lärande och övervakat lärande är två typer av maskininlärning. Övervakad inlärning är maskininlärningsuppgiften att lära sig en funktion som mappar en ingång till en utgång baserat på exempelvis ingångs- och utgångspar. Oövervakad inlärning är maskininlärningsuppgiften att härleda en funktion för att beskriva dold struktur från omärkta data. Skillnaden mellan övervakad och oövervakad maskininlärning är att övervakad inlärning använder märkta data medan icke övervakad lutning använder omärkt data.