Übung Decision Trees II
Modul 3: Klassische ML Algorithmen I
Kapitel 2: Decision Trees
Bearbeitungszeit: ca. 30 min
Aufgabenstellung:
Entwickeln Sie anhand der Daten den vollständigen Decision Tree.
(Hinweis: Da wir „Alter > 45 Jahre“ als Wurzelknoten haben, und die Gini-Impurity für den Fall „True“ den Wert 0 beträgt, brauchen wir diesen Knoten nicht weiterverfolgen. Ein kleinere Gini-Impurity als 0 können wir nicht erreichen. Weiter unten auf der Seite finden Sie eine Excel-Tabelle mit dem Datensatz.)
Gehen Sie dabei wie folgt vor:
- Finden Sie zuerst die beiden Gini-Impurities heraus für die Fälle in denen die Personen jünger als 45 sind und:
- verheiratet sind.
- ein Brutto-Einkommen von über 50.000€ / Jahr haben.
- Vergleichen Sie die beiden Gini-Impurities mit der Gini-Impurity der Kategorie „Alter > 45 Jahre“. Kann eine der beiden Kategorien einen Mehrwert liefern? Falls ja welche ist es und bei welchen Zweigen können /sollten weiter berechnet werden?
- Falls möglich, versuchen Sie auch noch zu errechnen ob bei dem Decision Tree eine weitere Verzweigung mit der dritten Kategorie Sinn macht.
- Zeichnen Sie den vollständigen Decision Tree und bewerteb Sie die Gesamt-Impurity. Haben wir einen guten Wert erreicht oder nicht? Wie kann es zu dem jeweiligen Ergebnis kommen?

Folgen Sie uns auf Social Media: