No items found.

No items found.

Übung Decision Trees II

Modul 3: Klassische ML Algorithmen I
Kapitel 2: Decision Trees
Bearbeitungszeit: ca. 30 min

Aufgabenstellung:

Entwickeln Sie anhand der Daten den vollständigen Decision Tree.

(Hinweis: Da wir „Alter > 45 Jahre“ als Wurzelknoten haben, und die Gini-Impurity für den Fall „True“ den Wert 0 beträgt, brauchen wir diesen Knoten nicht weiterverfolgen. Ein kleinere Gini-Impurity als 0 können wir nicht erreichen. Weiter unten auf der Seite finden Sie eine Excel-Tabelle mit dem Datensatz.)

Gehen Sie dabei wie folgt vor:

  1. Finden Sie zuerst die beiden Gini-Impurities heraus für die Fälle in denen die Personen jünger als 45 sind und:
  • verheiratet sind.
  • ein Brutto-Einkommen von über 50.000€ / Jahr haben.
  1. Vergleichen Sie die beiden Gini-Impurities mit der Gini-Impurity der Kategorie „Alter > 45 Jahre“. Kann eine der beiden Kategorien einen Mehrwert liefern? Falls ja welche ist es und bei welchen Zweigen können /sollten weiter berechnet werden?
  2. Falls möglich, versuchen Sie auch noch zu errechnen ob bei dem Decision Tree eine weitere Verzweigung mit der dritten Kategorie Sinn macht.
  3. Zeichnen Sie den vollständigen Decision Tree und bewerteb Sie die Gesamt-Impurity. Haben wir einen guten Wert erreicht oder nicht? Wie kann es zu dem jeweiligen Ergebnis kommen?

Hier geht's zum Download