Unterschied zwischen Data Mining und Data Warehousing

Autor: Laura McKinney
Erstelldatum: 2 April 2021
Aktualisierungsdatum: 17 Kann 2024
Anonim
Database vs Data Warehouse
Video: Database vs Data Warehouse

Inhalt


Sowohl Data Mining als auch Data Warehousing dienen zur Speicherung von Business Intelligence und zur Entscheidungsfindung. Sowohl Data Mining als auch Data Warehousing haben unterschiedliche Aspekte bei der Verarbeitung von Unternehmensdaten. Einerseits die Data Warehouse ist eine Umgebung, in der die Daten eines Unternehmens aggregiert und zusammengefasst erfasst und gespeichert werden. Andererseits, Data Mining ist ein Prozess; Algorithmen anwenden, um Wissen aus den Daten zu extrahieren, von denen Sie nicht einmal wissen, dass sie in der Datenbank vorhanden sind.

Lassen Sie uns den Unterschied zwischen Data Mining und Data Warehousing anhand einer Vergleichstabelle untersuchen.

  1. Vergleichstabelle
  2. Definition
  3. Hauptunterschiede
  4. Fazit

Vergleichstabelle

VergleichsbasisData MiningData Warehousing
Basic Data Mining ist ein Prozess zum Abrufen oder Extrahieren aussagekräftiger Daten aus der Datenbank / dem Data Warehouse.Data Warehouse ist ein Repository, in dem die Informationen aus mehreren Quellen unter einem einzigen Schema gespeichert werden.


Definition von Data Mining

Data Mining ist ein Prozess zu Wissen entdecken, welche du nie erwartet zu existieren in Ihrer Datenbank. Mit dem herkömmlichen Abfragetool können Sie nur die bekannten Informationen aus den Daten abrufen. Mit Data Mining haben Sie jedoch die Möglichkeit dazu versteckte Informationen aus den Daten abrufen. Data Mining extrahiert aussagekräftige Informationen aus der Datenbank, für die es verwendet werden kann Entscheidungen fällen.

Die Wissensentdeckung in Datenbanken, bezeichnet als KDDstellt aus Beziehung und Muster. Die Beziehung kann zwischen zwei oder mehr verschiedenen Objekten bestehen, zwischen Attributen desselben Objekts. Muster ist ein weiteres Ergebnis des Data Mining, das die regelmäßige und verständliche Abfolge von Informationen anzeigt, die bei der Entscheidungsfindung helfen.


Die an KDD beteiligten Schritte, d. H. Die Wissensermittlung in Datenbanken, können wie folgt zusammengefasst werden: Auswahl des Datensatzes, für den Data Mining durchgeführt werden muss. Der nächste ist Vorverarbeitung die Entfernung inkonsistenter Daten beinhalten. Dann kommt Datentransformation Dabei werden die Daten in die für das Data Mining geeignete Form umgewandelt. Der nächste ist Data MiningHier werden die Data Mining-Algorithmen auf die Daten angewendet. Und schlussendlich, Interpretation und Bewertung Dazu gehört das Extrahieren der Beziehung oder des Musters unter den Daten.

Data Mining passt gut in die Data Warehouse-Umgebung, in der Daten aggregiert und zusammengefasst gespeichert wurden. Da wird es einfach, die Daten im Data Warehouse abzubauen

Definition von Data Warehousing

Data Warehouse ist ein zentraler Ort, an dem Informationen aus mehreren Quellen gesammelt werden unter einem einzigen einheitlichen Schema gespeichert. Die Daten werden zunächst gesammelt, verschiedene Unternehmensquellen anschließend bereinigt und transformiert und in einem Data Warehouse gespeichert. Sobald Daten in ein Data Warehouse eingegeben wurden, bleiben sie dort für eine lange Zeit und können über die Zeit hinaus abgerufen werden.

Data Warehouse ist eine perfekte Mischung aus Technologien wie Datenmodellierung, Datenerfassung, Datenverwaltung, Metadatenverwaltung, Entwicklungstools, Speicherverwaltung. Alle diese Technologien unterstützen Funktionen wie Datenextraktion, Datentransformation, Datenspeicherung, Bereitstellung von Benutzeroberflächen für den Zugriff auf die Daten.

Data Warehouse ist kein Produkt oder eine Software, sondern eine Informationsumgebung, die Informationen wie eine integrierte Ansicht eines Unternehmens bereitstellt. Sie können auf die aktuellen und historischen Daten des Unternehmens zugreifen, um Entscheidungen zu treffen. Es unterstützt Transaktionen, die zur Entscheidungsfindung getroffen werden, ohne die Betriebssysteme zu beeinflussen. Es ist eine flexible Ressource, um strategische Informationen zu erhalten.

  1. Es gibt einen grundlegenden Unterschied zwischen Data Mining und Data Warehousing: Beim Data Mining werden aussagekräftige Daten aus der großen Datenbank oder dem Data Warehouse extrahiert. Data Warehouse bietet jedoch eine Umgebung, in der die Daten in einer integrierten Form gespeichert werden, wodurch das Data Mining vereinfacht und die Daten effizienter extrahiert werden.

Fazit:

Data Mining kann nur durchgeführt werden, wenn eine gut integrierte große Datenbank vorhanden ist, d. H. Ein Data Warehouse. Daher muss das Data Warehouse vor dem Data Mining abgeschlossen sein. Data Warehouse muss über Informationen in gut integrierter Form verfügen, damit Data Mining das Wissen auf effiziente Weise extrahieren kann.