De belangrijk verschil tussen classificatie en regressieboom is dat bij classificatie zijn de afhankelijke variabelen categorisch en ongeordend, terwijl bij regressie de afhankelijke variabelen continue of geordende gehele waarden zijn.
Classificatie en regressie zijn leertechnieken om voorspellingsmodellen van verzamelde gegevens te creëren. Beide technieken worden grafisch gepresenteerd als classificatie- en regressiebomen, of liever stroomdiagrammen met gegevensdelingen na elke stap, of liever "vertakking" in de boom. Dit proces wordt recursieve partitionering genoemd. Velden zoals Mining maken gebruik van deze classificatie- en regressie-leertechnieken. Dit artikel concentreert zich op de classificatiestructuur en regressieboom.
1. Overzicht en belangrijkste verschil
2. Wat is classificatie
3. Wat is regressie
4. Vergelijking zij aan zij - Classificatie versus regressie in tabelvorm
5. Samenvatting
Classificatie is een techniek die wordt gebruikt om tot een schema te komen dat de organisatie van gegevens toont die beginnen met een precursorvariabele. De afhankelijke variabelen zijn wat de gegevens classificeren.
Figuur 01: Data Mining
De classificatieboom begint met de onafhankelijke variabele, die vertakt in twee groepen zoals bepaald door de bestaande afhankelijke variabelen. Het is bedoeld om de antwoorden op te helderen in de vorm van categorisering veroorzaakt door de afhankelijke variabelen.
Regressie is een voorspellingsmethode die is gebaseerd op een veronderstelde of bekende numerieke uitvoerwaarde. Deze uitvoerwaarde is het resultaat van een reeks recursieve partitionering, waarbij elke stap een numerieke waarde heeft en een andere groep afhankelijke variabelen die vertakken naar een ander paar zoals dit..
De regressieboom begint met een of meer precursorvariabelen en eindigt met een laatste uitvoervariabele. De afhankelijke variabelen zijn ofwel continue ofwel discrete numerieke variabelen.
Classificatie versus regressie | |
Een boommodel waarbij de doelvariabele een afzonderlijke reeks waarden kan aannemen. | Een boommodel waarbij de doelvariabele continue waarden kan aannemen, meestal reële getallen. |
Afhankelijke variabele | |
Voor de classificatiestructuur zijn de afhankelijke variabelen categorisch. | Voor regressieboom zijn de afhankelijke variabelen numeriek. |
waarden | |
Heeft een bepaald aantal ongeordende waarden. | Heeft ofwel discrete maar toch geordende waarden of indiscrete waarden. |
Doel van de bouw | |
Het doel van het construeren van de regressieboom is om een regressiesysteem aan te passen aan elke determinant branch op een manier dat de verwachte outputwaarde naar boven komt. | Een classificatiestructuur vertakt zich zoals bepaald door een afhankelijke variabele afgeleid van het vorige knooppunt. |
Regressie- en classificatiebomen zijn nuttige technieken om het proces in kaart te brengen dat verwijst naar een bestudeerd resultaat, hetzij in classificatie of in een enkele numerieke waarde. Het verschil tussen de classificatieboom en de regressieboom is hun afhankelijke variabele. Classificatiebomen hebben afhankelijke variabelen die categorisch en ongeordend zijn. Regressiebomen hebben afhankelijke variabelen die continue waarden zijn of geordende gehele waarden.
1. "Decision Tree Learning." Wikipedia, Wikimedia Foundation, 13 mei 2018. Beschikbaar Hier
1.'Data Mining'door Arbeck - Eigen werk, (CC BY 3.0) vIA Commons Wikimedia