No items found.

No items found.

Übung lineare Regression I

Modul 3: Klassische ML Algorithmen I
Kapitel 6: lineare Regression
Bearbeitungszeit: ca. 90 min

In der künstlichen Intelligenz geht es bei einer linearen Regression darum, die Parameter für eine lineare Funktion zu bestimmen (Steigung, Schnittpunkt mit der y-Achse). Dies wird über das Gradientenabstiegsverfahren gelöst. Wie Sie in den vorherigen Videos gelernt haben werden bei dem Gradientenabstiegsverfahren viele Rechenoperationen häufig nacheinander ausgeführt. Dies werden wir in Modul 6 bearbeiten, wenn wir die Grundlagen der Programmierung behandelt haben. Die Ermittlung der Parameter behandeln wir in diesem Modul erstmal nur theoretisch in den Videos und wenden es in dieser Übung nicht an.

In dieser Übung befassen wir uns damit, wie gut eine vorgegebene lineare Gleichung einen Datensatz repräsentiert. Sie werden in der Folgenden Übung drei beispielhafte lineare Funktionen miteinander vergleichen und herausfinden, welche der drei Funktionen das lineare Problem am besten beschreibt.

Aufgabenstellung:

Im Folgenden sehen Sie einen Datensatz, der das Verhältnis zwischen den Ausbildungsjahren einer Person und dem späteren Einkommen dieser Person beschreibt. Rechts in dem Diagramm sind die Werte aus dem Datensatz eingetragen (blaue Punkte). Neben dem Datensatz finden Sie in dem Diagramm noch drei lineare Funktionen (schwarz /rot /gelb). Die Kennwerte dieser linearen Funktionen finden Sie am Ende dieser Seite.

Finden Sie im Folgenden heraus, welche dieser drei Funktionen am ehesten die Werte aus dem Datensatz repräsentiert. Hierfür ermitteln wir, welche der Funktionen die geringste Abweichung erzeugt. Dafür nutzen wir die Formel:

Gehen Sie dabei wie folgt vor:

a) Frage: 

Identifizieren Sie, welche Variable in der error-Formel für welchen Wert aus der Aufgabe steht.

b) Frage: 

Ermitteln Sie für Funktion 1 die vorhergesagten Einkommenswerte für die Ausbildungsjahre aus unserem Datensatz.

c) Frage: 

Ermitteln Sie für Funktion 1 die Differenzen zwischen den vorhergesagten Einkommenswerten aus Aufgabe b und den tatsächlichen Einkommenswerten aus unserem Datensatz.

d) Frage: 

Ermitteln Sie für Funktion 1 die quadratischen Abweichungen.

e) Frage: 

Summieren Sie die quadratischen Abweichungen von Funktion 1 auf und dividieren Sie diesen Wert durch die Anzahl unserer Trainingsparameter.

f) Frage: 

Wiederholen Sie die Teilaufgaben 1 bis 5 für die Funktionen 2 und 3. Welche der Funktionen weist die geringste Differenz auf?

  • Funktion 1: Steigung = 7875,00 €/Jahr; Schnittpunkt mit der y-Achse = 30.000 €
  • Funktion 2: Steigung = 8125,00 €/Jahr; Schnittpunkt mit der y-Achse = 30.000 €
  • Funktion 3: Steigung = 8375,00 €/Jahr; Schnittpunkt mit der y-Achse = 30.000 €

(Hinweis: Es biete sich an die Aufgabe mit Hilfe von Excel zu lösen. Die Trainingsdaten finden sie hier zum Download.)

Hier geht's zum Download