Übung lineare Regression I - Lösung
Modul 3: Klassische ML Algorithmen I
Kapitel 6: lineare Regression
Bearbeitungszeit: ca. 30 min
(Hinweis: Am Ende dieser Seite finden Sie eine Excel-Mappe in der für jede Teilaufgabe eine eigene Tabelle hinterlegt ist.)
Lösungen:
a) Frage:
Identifizieren Sie, welche Variable in der error-Formel für welchen Wert aus der Aufgabe steht.
Antwort:
- N: Anzahl der Datensets (für alle drei Funktionen ist dieser Wert 30)
- i: Startindex
- y: Das Einkommen aus unserem Datensatz(bspw. beträgt dieser Wert für i=1 56.386,60 €)
- w: Die Steigung in unserer Funktion(für Funktion 1 beträgt diese 7875,00 €/Jahr)
- x: Die Ausbildungsjahre aus unserem Datensatz (bspw. beträgt dieser Wert für i=1 4,4)
- b: Der Schnittpunkt unserer Funktion mit der y-Achse (für alle drei Funktionen 30.000€)
b) Frage:
Ermitteln Sie für Funktion 1 die vorhergesagten Einkommenswerte für die Ausbildungsjahre aus unserem Datensatz.
Antwort:
Beispiel für Formel 1 und i=1:
Diese Vorgehensweise muss für Funktion 1 für jeden „Ausbildungszeit“-Wert aus unserem Datensatz so angewendet werden.
c) Frage:
Ermitteln Sie für Funktion 1 die Differenzen zwischen den vorhergesagten Einkommenswerten aus Aufgabe b und den tatsächlichen Einkommenswerten aus unserem Datensatz.
Antwort:
Diese Vorgehensweisemuss für Funktion 1 für jeden „Ausbildungszeit“-Wert aus unserem Datensatz so angewendet werden.
d) Frage:
Ermitteln Sie für Funktion 1 die quadratischen Abweichungen.
Antwort:
Diese Vorgehensweisemuss für Funktion 1 für jeden „Ausbildungszeit“-Wert aus unserem Datensatz so angewendet werden.
e) Frage:
Summieren Sie die quadratischen Abweichungen von Funktion 1 auf und dividieren Sie diesen Wert durch die Anzahl unserer Trainingsparameter.
Antwort:
f) Frage:
Wiederholen Sie Aufgabe a bis e für die Funktionen 2 und 3. Welche der Funktionen weist die geringste Differenz auf?
Antwort:
Wenn Sie die Schritte a-e für die Funktionen 2 & 3 anwenden erhalten Sie Folgende Fehler:
- Fehler Funktion 1: 154.923.720,01 €
- Fehler Funktion 2: 153.919.944,68 €
- Fehler Funktion 3: 154.009.127,69 €
Auch wenn die drei Fehler sehr nah beieinander liegen ist zu erkennen, dass der Fehler bei Funktion 2 am geringsten ist. Von den drei angebotenen linearen Funktionen beschreibt also Funktion 2 unser Datensatz am besten.
Sie haben in der vorherigen Übung drei beispielhafte lineare Funktionen miteinander verglichen und herausgefunden, welche der drei Funktionen das lineare Problem am besten beschreibt. Die Parameter der drei Funktionen haben wir in der Aufgabenstellung vorgegeben.
Folgen Sie uns auf Social Media: