Übung Logistische Regression I - Lösung
Modul 3: Klassische ML Algorithmen I
Kapitel 7: Logistische Regression
Bearbeitungszeit: ca. 30 min
(Hinweis: Am Ende dieser Seite finden Sie eine Excel-Mappe in der für jede Teilaufgabe eine eigene Tabelle hinterlegt ist.)
Lösungen:
a) Frage:
Identifizieren Sie, welche Variable in der cost-Formel für welchen Wert aus der Aufgabe steht.
Antwort:
- N: Anzahl der Datensets (für alle drei Funktionen ist dieser Wert 50. In dem Erklärungsvideo zuvor wurde dieser Wert mit „m“ betitelt)
- i: Startindex
- y: Das Alter aus unserem Datensatz (bspw. beträgt dieser Wert für i=1 54)
- h_θ (x): Die Hypothese für x. Diese wird berechnet durch die sigmoid-Funktion
- e: Die Eulersche Zahl
- w: Die Steigung in unserer Funktion (für Funktion 1 beträgt diese 0,07. In dem Erklärungsvideo zuvor wurde dieser Wert mit „m“ betitelt)
- x: Die Entscheidung aus unserem Datensatz (bspw. beträgt dieser Wert für i=1 1)
- b: Der Schnittpunkt unserer Funktion (für alle drei Funktionen -3. In dem Erklärungsvideo zuvor wurde dieser Wert mit „w“ betitelt)
b) Frage:
Ermitteln Sie für Funktion 1 die Hypothesen(sigmoid(x)) für die Altersangaben aus dem Datensatz.
Antwort:
Beispiel für Formel 1 und i=1:
Diese Vorgehensweise muss für Funktion 1 für jeden „Alters“-Wert aus unserem Datensatz so angewendet werden.
c) Frage:
Ermitteln Sie für Funktion 1 den Wert aus der cost-Funktion, der innerhalb der Klammern des Summenzeichens steht (für jede Altersangabe aus dem Datensatz).
Antwort:
Beispiel für Formel 1 und i=1:
Diese Vorgehensweise muss für Funktion 1 für jeden „Alters“-Wert aus unserem Datensatz so angewendet werden.
d) Frage:
Ermitteln Sie für Funktion 1 den Wert der cost-Function.
Antwort:
Diese Vorgehensweise muss für Funktion 1 für jeden „Ausbildungszeit“-Wert aus unserem Datensatz so angewendet werden.
e) Frage:
Wiederholen Sie Aufgabe a bis e für die Funktionen 2 und 3. Welche der Funktionen eignet sich am besten um das logistische Problem zu beschreiben?
Antwort:
Wenn Sie die Schritte a-d für die Funktionen 2 & 3 anwenden erhalten Sie Folgende Fehler:
- Fehler Funktion1: 0,1773
- Fehler Funktion2: 0,1738
- Fehler Funktion3: 0,1829
Auch wenn die drei Ergebnisse der cost-Funktionen sehr nah beieinander liegen ist zu erkennen, dass der Fehler bei Funktion 2 am geringsten ist. Von den drei angebotenen Funktionen beschreibt also Funktion 2 unser Datensatz am besten.
Folgen Sie uns auf Social Media: