No items found.

No items found.

Übung Naive Bays I

Modul 3: Klassische ML Algorithmen I
Kapitel 5: Naive Bays
Bearbeitungszeit: ca. 90 min

Aufgabenstellung:

Die Parameter und das Szenario dieser Übung werden Ihnen eventuell bekannt vorkommen. In dem Artikel zu „Decision Trees“ haben wir mit ähnlichen Parametern gearbeitet. Im Folgenden sehen Sie einen Auszug von einem Datenset welches Sie unten auf der Seite als Excel-Datei finden. Wir werden in dieser Übung ein Beispiel rechnen welches ein wenig Komplexer ist als das in dem zuvor gezeigten Video. Mit Hilfe von Excel-Formeln ist aber auch diese Übung zu meistern.

Berechnen Sie mit Hilfe des Naive Bays Klassifikators und des vorhandenen Datensatzes die Wahrscheinlichkeit, dass eine Pumpe die Kavitation ausgesetzt ist, eine Lagertemperatur > 80°C hat und sich von der Anzahl der Betriebsstunden in Kategorie „l“ bewegt, einen Defekt haben wird. In dem Excel-Datensatz finden Sie die Übung aus dem Video als Excel-Tabelle inklusiver der notwendigen Formeln. Wenn Sie bei der Übung Probleme haben können Sie diese Tabelle gerne als Leitfaden nutzen.

Gehen Sie für die Berechnung der Wahrscheinlichkeiten wie folgt vor:

  1. Bestimmen Sie die Anzahl der Pumpen die einen Defekt hatten und die Anzahl der Pumpen die keinen Defekt hatten.
  2. Bestimmen Sie die Anzahl der Pumpen, die einen Defekt hatte während diese in der Laufzeit-Kategorie „l“ (zwischen 3.000 und 5.000 Stunden) war. (Hinweis: Hier können Sie in Excel gut mit einer verschachteltem WENN-Abfrage arbeiten. Der Wahrheitstest besteht dann aus einer UND-Funktion)
  3. Bestimmen Sie mit einer ähnlichen Vorgehensweise wie in Schritt 2 die Summen für Folgende Kategorien:
    a: Wenn Defekt und durchschnittliche Lagertemperatur > 80 °C  
    b: Wenn Defekt und Kavitation
    c: Wenn kein Defekt und Laufzeit = l
    d: Wenn kein defekt und durchschnittliche Lagertemperatur > 80 °C
    e: Wenn kein defekt und Kavitation
  4. Berechnen Sie die Teilergebnisse, die beiden Produkte (Zwei Multiplikationen der vier Teilergebnisse) und die Summe. (Hinweis: Mit „Teilergebnisse“ meinen wir die Werte, die in dem Beispiel des Videos die jeweiligen Bruchzahlen waren. Hierfür verweisen wir gerne nochmal auf die Excel-Tabelle „Beispiel YouTube-Video“. Hier können Sie die Bruchzahlen aus dem Video in Form von Dezimalzahlen wiederfinden.)
  5. Berechnen Sie die Wahrscheinlichkeit dafür, dass die Pumpe unter den besagten Bedingungen „Kavitation, Lagertemperatur > 80°C und Anzahl der Betriebsstunden in Kategorie l“ einen Defekt haben wird.
  6. Im Idealfall haben Sie jetzt eine Excel-Maske die sich dafür eignet mit kleinen Änderungen neue Vorhersagen möglich zu machen. Berechnen Sie noch die Wahrscheinlichkeiten für zwei neue Fälle:
    a: Fall 2: Keine Kavitation und Lagertemperatur > 80°C und Betriebsstunden in Kategorie m
    b: Fall 3: Kavitation und Lagertemperatur < 80°C und Betriebsstunden in Kategorie s
Hier geht's zum Download