De grootste verschil tussen slice en dice in datawarehouse is dat het slice is een bewerking die één specifieke dimensie uit een gegeven gegevenskubus selecteert en een nieuwe subkubus verschaft terwijl de dobbelsteen een bewerking is die twee of meer dimensies uit een gegeven gegevenskubus selecteert en een nieuwe subkubus verschaft.
Een datawarehouse is een systeem dat wordt gebruikt voor rapportage en data-analyse, die de besluitvorming ondersteunen. Allereerst worden de gegevens uit meerdere bronnen geëxtraheerd, getransformeerd en in het magazijn geladen. Vervolgens wordt de analyse uitgevoerd met behulp van Online Analytical Processing Server (OLAP), die is gebaseerd op het multidimensionale gegevensmodel. Er zijn verschillende OLAP-bewerkingen, zoals oprollen, drill-down, slice en dice en draaien (roteren). Roll-up wordt gebruikt om te aggregeren op een gegevenskubus; drill down wordt gebruikt om de bewerking van oprollen ongedaan te maken terwijl draaipunt wordt gebruikt om de gegevensassen in het zicht te draaien om een alternatieve presentatie van gegevens te bieden. In dit artikel kijken we naar slice and dice.
1. Wat is Slice in Data Warehouse
- Definitie, functionaliteit, gebruik
2. Wat is Dice in Data Warehouse
- Definitie, functionaliteit, gebruik
3. Wat is het verschil tussen slice en dobbelsteen in Data Warehouse
- Vergelijking van belangrijke verschillen
Datawarehouse, Dice, OLAP, Slice
Een OLAP-kubus is een multidimensionale matrix van gegevens. Gegevens als een kubus met hiërarchische dimensies helpen bij het analyseren. De uitgelijnde gegevens zijn gemakkelijker te visualiseren en verbeteren de productiviteit.
Figuur 1: OLAP-slicing
Snijden selecteert één waarde voor een van de dimensies en maakt een subset van de kubus. Volgens het bovenstaande diagram worden de verkoopregio's, producten in het jaar 2005 en 2006 uit de datakubus gesneden.
Dice selecteert specifieke waarden van meerdere dimensies om een nieuwe subbuis te maken. Een voorbeeld is als volgt.
Figuur 2: OLAP Dicing
Volgens het bovenstaande diagram worden de verkoopcijfers voor een beperkt aantal productcategorieën, tijd- en regiometaten die het oorspronkelijke bereik dekken, gebruikt om de nieuwe kubus te vormen.
Segment is het selecteren van een rechthoekige subset van een kubus door een enkele waarde te kiezen voor een van zijn dimensies, waardoor een nieuwe kubus met minder dimensies wordt gemaakt. Dice is het maken van een subcube door de analist specifieke waarden van meerdere dimensies te laten kiezen. Dit beschrijft dus het belangrijkste verschil tussen slice en dice in datawarehouse.
Een ander verschil tussen slice en dice in datawarehouse is hun gebruik. Segment wordt gebruikt om een bepaalde dimensie uit een gegeven kubus te selecteren en om een nieuwe subbuis te bieden. Dobbelstenen worden gebruikt om twee of meer dimensies uit een gegeven kubus te selecteren en om een nieuwe subbuis te bieden.
Slice en dobbelstenen zijn twee bewerkingen die worden gebruikt in de OLAP-strategie in datawarehouses. Het belangrijkste verschil tussen slice en dice in het datawarehouse is dat de slice een bewerking is die een specifieke dimensie selecteert uit een gegeven-gegevenskubus en een nieuwe subcube biedt, terwijl de dobbelsteen een bewerking is die twee of meer dimensies selecteert uit een gegeven gegevenskubus en biedt een nieuwe subcube.
1. "OLAP-kubus." Wikipedia, Wikimedia Foundation, 24 september 2018, hier beschikbaar.
2. "Data Warehousing OLAP." Www.tutorialspoint.com, Tutorials Point, hier beschikbaar.
1. "OLAP-slicing" door Infopedian - Eigen werk (CC BY-SA 3.0) via Commons Wikimedia [Vertaald] 2. "OLAP dicing" door Infopedian - Eigen werk (CC BY-SA 3.0) via Commons Wikimedia [Vertaald]