Unterschied zwischen Faktentabelle und Dimensionstabelle

Autor: Laura McKinney
Erstelldatum: 1 April 2021
Aktualisierungsdatum: 13 Kann 2024
Anonim
Data Warehouse - Star Schema
Video: Data Warehouse - Star Schema

Inhalt


Die Faktentabelle und die Dimensionstabelle sind die wesentlichen Faktoren für die Erstellung eines Schema. Der Datensatz einer Faktentabelle ist eine Kombination von Attributen aus verschiedenen Dimensionstabellen. Die Faktentabelle hilft dem Benutzer bei der Analyse der Geschäftsdimensionen, die ihm bei der Entscheidungsfindung zur Verbesserung seines Geschäfts helfen. Auf der anderen Seite helfen Dimensionstabellen der Faktentabelle, Dimensionen zu erfassen, entlang derer die Maßnahmen ergriffen werden müssen.

Der Punkt, der die Faktentabelle und die Dimensionstabelle unterscheidet, ist, dass die Maßtabelle Enthält Attribute, nach denen Maßnahmen ergriffen werden Faktentabelle. Es gibt noch einige andere Faktoren, die zu Unterschieden zwischen Faktentabelle und Dimensionstabelle führen. Werfen wir einen Blick auf die folgende Vergleichstabelle.

  1. Vergleichstabelle
  2. Definition
  3. Zahl
  4. Hauptunterschiede
  5. Fazit

Vergleichstabelle

Grundlage für den VergleichFaktentabelleDimensionstabelle
BasicDie Faktentabelle enthält die Messung entlang der Attribute einer Dimensionstabelle. Die Dimensionstabelle enthält die Attribute, anhand derer die Faktentabelle die Metrik berechnet.
Attribut & Aufzeichnungen Die Faktentabelle enthält weniger Attribute und mehr Datensätze.Die Dimensionstabelle enthält mehr Attribute und weniger Datensätze.
TischgrößeDie Faktentabelle wächst vertikal.Maßtabelle wächst horizontal.
Schlüssel Die Faktentabelle enthält einen Primärschlüssel, bei dem es sich um eine Verkettung der Primärschlüssel aller Dimensionstabellen handelt. Jede Dimensionstabelle enthält ihren Primärschlüssel.
SchaffungDie Faktentabelle kann nur erstellt werden, wenn die Dimensionstabellen vollständig sind.Dimensionstabellen müssen zuerst erstellt werden.
Schema Ein Schema enthält weniger Faktentabellen.Ein Schema enthält mehr Dimensionstabellen.
AttributeDie Faktentabelle kann sowohl numerische als auch uale Daten enthalten.Die Dimensionstabelle enthält immer Attribute im tatsächlichen Format.


Definition der Faktentabelle

Eine Faktentabelle ist eine Tabelle, die enthält Messungen entlang der Attribute von Dimensionstabellen. Es kann die Informationen auf der niedrigstmöglichen Ebene enthalten. Einige Faktentabellen enthalten nur zusammenfassende Daten, die als bezeichnet werden Aggregierte Faktentabelle. Die Faktentabelle enthält fast die Datum gestempelt Daten. Besprechen wir die Merkmale einer Faktentabelle.

Verketteter Schlüssel
Die Faktentabelle enthält den verketteten Schlüssel, der die Verkettung der Primärschlüssel aller Dimensionstabellen darstellt. Der verkettete Schlüssel der Faktentabelle muss die Zeile in einer Faktentabelle eindeutig identifizieren.

Datenkorn
Das Datenkorn zeigt, wie tief die Messungen in der Faktentabelle gespeichert wurden. Das Datenkorn muss auf dem höchstmöglichen Niveau liegen.


Additive Maßnahmen
Attribute der Faktentabelle können sein voll additiv oder semi-additive. Volladditive Kennzahlen sind solche, die sich für alle Dimensionen in der Faktentabelle leicht zusammenfassen lassen. Beispiel: Quantity_ordered ist ein Attribut, das für alle Dimensionen summiert werden kann. Genauso können wir für einen bestimmten Kunden, eine bestimmte Region, ein bestimmtes Datum, eine bestimmte Marke usw. die Gesamtmenge_Bestellung ermitteln. Semiadditive Kennzahlen sind solche, die entlang einiger Dimensionen der Faktentabelle, jedoch nicht aller Dimensionen summiert werden können. Ebenso kann der Kontostand nicht über die Zeitdimension summiert werden, da er sich über die Zeit ändert.

Spärliche Daten
Manchmal können wir die Aufzeichnungen in der Faktentabelle sehen, die hat Attribute mit null Maßnahmen. Zum Beispiel kann es sein, dass an einem Feiertag keine Bestellung vorliegt. Daher haben Attribute für dieses Datum Null-Kennzahlen. Für derartige Aufzeichnungen müssen wir keine Maße speichern, da sie keine Informationen liefern.

Degenerierte Dimensionen
Manchmal stoßen Sie auf einige Dimensionen in der Faktentabelle, die überhaupt nicht additiv sind. Zum Beispiel order_number, customer_id, können Sie diese Arten von Dimensionen nicht hinzufügen. In diesem Monat müssen Sie jedoch eine Bestellung eines bestimmten Kunden finden. Dann benötigen Sie die customer_id, um Ihre Suche in Beziehung zu setzen. Diese Typen, wenn Attribute oder Dimensionen der Faktentabelle aufgerufen werden Entartete Dimension.

Definition der Maßtabelle

Die Dimensionstabelle ist eine Schlüsselkomponente für das Startschema. Eine Dimensionstabelle enthält die Attribute, die Dimensionen darstellen, entlang derer die Messung in der Faktentabelle erfolgt. Im Folgenden werden einige Merkmale einer Dimensionstabelle erläutert.

Attribute und Schlüssel
Jede Dimensionstabelle muss ein Primärschlüssel das identifiziert eindeutig jeden Datensatz der Tabelle. Es wird allgemein beobachtet, dass die Dimensionstabelle viele Attribute enthält. Daher scheint es so zu sein breit Wenn Sie eine Dimensionstabelle erstellen, werden Sie feststellen, dass sie sich ausbreitet horizontal.

Attributwerte
Die Werte der Attribute in der Dimensionstabelle sind selten numerisch. In den meisten Fällen finden Sie die Werte in Attributen in uales Format. Zum Beispiel Produktname, Marke, Kategorie, Unterkategorie usw.

Beziehung zwischen Attributen
Häufig können Sie beobachten, dass die Attribute, auf die Sie in einer Dimensionstabelle stoßen, nicht direkt miteinander verbunden sind. Ebenso hat Product_brand nichts mit package_date zu tun, es können jedoch beide Attribute der Product-Dimensionstabelle sein.

Normalisierung
Die Maßtabelle ist nicht soll sein Normalisiert. Dies liegt daran, dass beim Normalisieren einer Tabelle viele Zwischentabellen erstellt würden. Wenn eine Abfrage ein Attribut aus der Dimensionstabelle aufnimmt und die Messungen für die Faktentabelle wiederherstellt, muss die Abfrage die Zwischentabellen durchgehen, die ineffizient werden. Daher werden Dimensionstabellen nicht normalisiert.

Drilldown, Aufrollen
Mit den Attributen der Dimensionstabelle können Sie die Details abrufen, indem Sie von einer höheren Ebene aggregierter Attribute zu einer niedrigeren Ebene übergehen. Wenn Sie beispielsweise den Gesamtumsatz in einer Region ermitteln möchten, können Sie einen Drilldown durchführen, um den Umsatz nach Bundesstaat, Stadt und Postleitzahl zu ermitteln. Sie können den Gesamtumsatz sogar nach Postleitzahl, Stadt und Bundesland aufrollen.

Multiple Hierarchie
Die Dimensionstabelle bietet häufig mehrere Hierarchien. Zum Beispiel haben wir eine Produktdimensionstabelle für ein Kaufhaus. Jetzt haben wir zwei Abteilungen Marketing und Rechnungswesen.

Die Marketingabteilung führt einen Drilldown zwischen den Attributen der Produktdimensionstabelle in einer bestimmten Hierarchie durch, um Messungen für die Faktentabelle zu erhalten.

Auf der anderen Seite durchsucht die Buchhaltung die Attribute der Produktdimensionstabelle in der unterschiedlichen Hierarchie, um Messungen für die Faktentabelle zu erhalten.

Die Dimensionstabelle muss also mehrere Hierarchien oder Aggregationsebenen von Attributen aufweisen, damit der Benutzer einen Drilldown entlang einer der mehreren Hierarchien durchführen kann.

Aufzeichnungen
Eine Dimensionstabelle enthält zwar zu viele Attribute, jedoch weniger Datensätze.

  1. Die Faktentabelle enthält Maßangaben entlang der Dimension / Attribute einer Dimensionstabelle.
  2. Die Faktentabelle enthält im Vergleich zur Dimensionstabelle mehr Datensätze und weniger Attribute, während die Dimensionstabelle mehr Attribute und weniger Datensätze enthält.
  3. Die Tabellengröße der Faktentabelle wächst vertikal, während die Tabellengröße der Dimensionstabelle horizontal wächst.
  4. Jede Dimensionstabelle enthält einen Primärschlüssel zum Identifizieren jedes Datensatzes in der Tabelle, wohingegen die Faktentabelle einen verketteten Schlüssel enthält, der eine Kombination aller Primärschlüssel aller Dimensionstabellen ist.
  5. Die Dimensionstabelle muss vor der Erstellung der Faktentabelle aufgezeichnet werden.
  6. Ein Schema enthält weniger Faktentabellen, aber mehr Dimensionstabellen.
  7. Attribute in der Faktentabelle sind sowohl numerisch als auch tatsächlich. Attribute in der Dimensionstabelle haben jedoch nur tatsächliche Attribute.

Fazit:

Beide sind für die Erstellung eines Schemas gleich wichtig, aber die Dimensionstabelle muss vor der Faktentabelle aufgezeichnet werden. Da es unmöglich ist, eine Faktentabelle ohne Dimensionen zu erstellen.