Skillnaden Mellan Data Mining Och OLAP

Skillnaden Mellan Data Mining Och OLAP
Skillnaden Mellan Data Mining Och OLAP

Video: Skillnaden Mellan Data Mining Och OLAP

Video: Skillnaden Mellan Data Mining Och OLAP
Video: OLAP-куб. Деморолик Loginom Community Edition 2024, November
Anonim

Data Mining vs OLAP

Både datautvinning och OLAP är två av de vanliga BI-teknologierna. Business intelligence avser datorbaserade metoder för att identifiera och extrahera användbar information från affärsdata. Data mining är området datavetenskap som behandlar extrahering av intressanta mönster från stora datamängder. Den kombinerar många metoder från artificiell intelligens, statistik och databashantering. OLAP (online analytisk bearbetning) som namnet antyder är en sammanställning av sätt att fråga multidimensionella databaser.

Data mining är också känt som Knowledge Discovery in data (KDD). Som nämnts ovan är det ett datavetenskapligt område som behandlar utvinning av tidigare okänd och intressant information från rådata. På grund av den exponentiella tillväxten av data, särskilt inom områden som affärer, har data mining blivit ett mycket viktigt verktyg för att konvertera denna stora mängd data till affärsinformation, eftersom manuell utvinning av mönster har blivit omöjligt under de senaste decennierna. Till exempel har den för närvarande använts för olika applikationer, såsom analys av sociala nätverk, upptäckt av bedrägerier och marknadsföring. Data mining handlar vanligtvis om följande fyra uppgifter: kluster, klassificering, regression och associering. Clustering är att identifiera liknande grupper från ostrukturerad data. Klassificering är inlärningsregler som kan tillämpas på nya data och innefattar vanligtvis följande steg: förbehandling av data, design av modellering, inlärning / val av funktioner och utvärdering / validering. Regression är att hitta funktioner med minimalt fel för modelldata. Och associering letar efter relationer mellan variabler. Data mining används vanligtvis för att svara på frågor som vilka är de viktigaste produkterna som kan hjälpa till att få hög vinst nästa år i Wal-Mart. Data mining används vanligtvis för att svara på frågor som vilka är de viktigaste produkterna som kan hjälpa till att få hög vinst nästa år i Wal-Mart. Data mining används vanligtvis för att svara på frågor som vilka är de viktigaste produkterna som kan hjälpa till att få hög vinst nästa år i Wal-Mart.

OLAP är en klass av system som ger svar på flerdimensionella frågor. OLAP används vanligtvis för marknadsföring, budgetering, prognoser och liknande applikationer. Det säger sig självt att databaserna som används för OLAP är konfigurerade för komplexa och ad hoc-frågor med en snabb prestanda i åtanke. Vanligtvis används en matris för att visa utdata från en OLAP. Raderna och kolumnerna bildas av frågan. De använder ofta metoder för aggregering i flera tabeller för att få sammanfattningar. Det kan till exempel användas för att ta reda på försäljningen i år i Wal-Mart jämfört med förra året? Vad är förutsägelsen för försäljningen under nästa kvartal? Vad kan man säga om trenden genom att titta på den procentuella förändringen?

Även om det är uppenbart att Data mining och OLAP är lika eftersom de använder data för att få intelligens, kommer den största skillnaden från hur de arbetar med data. OLAP-verktyg ger flerdimensionell dataanalys och de ger sammanfattningar av data men kontrasterande fokuserar data mining på förhållanden, mönster och influenser i datamängden. Det är en OLAP-affär med aggregering, som handlar om datadrift via "addition" men data mining motsvarar "division". En annan anmärkningsvärd skillnad är att medan data mining verktyg modellerar data och returnerar reglerbara regler, kommer OLAP att genomföra jämförelse- och kontrasttekniker längs affärsdimensionen i realtid.

Rekommenderas: