No items found.

No items found.

Übung Nearest Neighbor I

Modul 3: Klassische ML Algorithmen I
Kapitel 1: Nearest Neighbor
Bearbeitungszeit: ca. 30 min

Der vorherige Blog-Beitrag hat den k-Nearest-Neighbor Algorithmus vorgestellt. Fassen wir diesen einmal in wenigen Stichunkten zusammen:

  • Beim k-Nearest-Neighbor Algorithmus bringt man die Trainings-Daten in eine gemeinsame Matrix.
  • Um das Ergebnis für ein neues Datenpaar vorherzusagen, betrachtet man die Ergebnisse der Datenpaare, die in der Matrix dem neuen Datenpaar am nächsten liegen.  Hierfür wird der Abstand zwischen den Datenpaaren berechnet.
  • Der k-Wert gibt an, wie viele benachbarte Datenpaare betrachtet werden.
  • Die Vorhersage für das neue Datenpaar ergibt sich letztendlich daraus, welche Ergebnisse die Mehrzahl der benachbarten Datenpaare haben.  

Hier ein weiteres Beispiel, welches sich an dem vorherigen Beitrag orientiert:

Aufgabe:

Zwei Freunde verabreden sich häufig zum gemeinsamen Joggen gehen. In dem folgenden Datenset wird für 15 verschiedene Tage angegeben wie das Wetter (Temperatur und Luftfeuchte) an den jeweiligen Tagen war. In der letzten Spalte ist angegeben, ob sich die Freunde an den Tagen zum Joggen gehen getroffen haben oder nicht.

Fragestellung:

An Tag 16 beträgt die Lufttemperatur 16 °C und die relative Luftfeuchte 60 %. Finden Sie auf Grundlage der Trainingsdaten heraus, ob die zwei Freunde sich zum Joggen verabreden würden oder nicht. Nehmen Sie als k-Wert 3 an.
(Hinweis: Es biete sich an die Aufgabe mit Hilfe von Excel zu lösen. Die Trainingsdaten finden sie unten zum Download.)

Vorgehensweise:

  1. Berechnen Sie für alle 15 Tage die euklidische Distanz zu Tag 16.
  2. Identifizieren Sie die drei (k-Wert=3) geringsten Abstände.
  3. Entscheiden Sie auf Grundlage der Trainingsdaten, ob die beiden Freunde sich zum Joggen verabreden oder nicht.

Hier geht's zum Download

[1] Trainingsparameter: Technische Universität Darmstadt - Maschinelles Lernen: Symbolische Ansätze WS 13/14 Übungsblatt 7