No items found.

No items found.

Übung Logistische Regression I - Lösung

Modul 3: Klassische ML Algorithmen I
Kapitel 7: Logistische Regression
Bearbeitungszeit: ca. 30 min

(Hinweis: Am Ende dieser Seite finden Sie eine Excel-Mappe in der für jede Teilaufgabe eine eigene Tabelle hinterlegt ist.) 

Lösungen:

a) Frage:
Identifizieren Sie, welche Variable in der cost-Formel für welchen Wert aus der Aufgabe steht.

Antwort:

  • N: Anzahl der Datensets (für alle drei Funktionen ist dieser Wert 50. In dem Erklärungsvideo zuvor wurde dieser Wert mit „m“ betitelt)
  • i: Startindex
  • y: Das Alter aus unserem Datensatz (bspw. beträgt dieser Wert für i=1 54)
  • h_θ (x): Die Hypothese für x. Diese wird berechnet durch die sigmoid-Funktion
  • e: Die Eulersche Zahl
  • w: Die Steigung in unserer Funktion (für Funktion 1 beträgt diese 0,07. In dem Erklärungsvideo zuvor wurde dieser Wert mit „m“ betitelt)
  • x:  Die Entscheidung aus unserem Datensatz (bspw. beträgt dieser Wert für i=1 1)
  • b:  Der Schnittpunkt unserer Funktion (für alle drei Funktionen -3. In dem Erklärungsvideo zuvor wurde dieser Wert mit „w“ betitelt)

b) Frage:
Ermitteln Sie für Funktion 1 die Hypothesen(sigmoid(x)) für die Altersangaben aus dem Datensatz.

Antwort:

Beispiel für Formel 1 und i=1:

Diese Vorgehensweise muss für Funktion 1 für jeden „Alters“-Wert aus unserem Datensatz so angewendet werden.

     

c) Frage:
Ermitteln Sie für Funktion 1 den Wert aus der cost-Funktion, der innerhalb der Klammern des Summenzeichens steht (für jede Altersangabe aus dem Datensatz).

 Antwort:

Beispiel für Formel 1 und i=1:

Diese Vorgehensweise muss für Funktion 1 für jeden „Alters“-Wert aus unserem Datensatz so angewendet werden.

d) Frage:
Ermitteln Sie für Funktion 1 den Wert der cost-Function.

 Antwort:

Diese Vorgehensweise muss für Funktion 1 für jeden „Ausbildungszeit“-Wert aus unserem Datensatz so angewendet werden.

e) Frage:
Wiederholen Sie Aufgabe a bis e für die Funktionen 2 und 3. Welche der Funktionen eignet sich am besten um das logistische Problem zu beschreiben?

 Antwort:

Wenn Sie die Schritte a-d für die Funktionen 2 & 3 anwenden erhalten Sie Folgende Fehler:

  • Fehler Funktion1: 0,1773
  • Fehler Funktion2: 0,1738
  • Fehler Funktion3: 0,1829

Auch wenn die drei Ergebnisse der cost-Funktionen sehr nah beieinander liegen ist zu erkennen, dass der Fehler bei Funktion 2 am geringsten ist. Von den drei angebotenen Funktionen beschreibt also Funktion 2 unser Datensatz am besten.

Hier geht's zum Download