Übung Naive Bays I - Lösung
Modul 3: Klassische ML Algorithmen I
Kapitel 5: Naive Bays
Bearbeitungszeit: ca. 15 min
Sie können die ausführlichen Lösungswege am besten über die unten angefügt Excel-Tabelle nachvollziehen. Wir werden Ihnen hier in den einzelnen Lösungsschritten aufzeigen welche Werte Sie für die jeweiligen Aufgaben erhalten sollten und wie eine beispielhafte Excel-Funktion aussehen kann.
1) Frage:
Bestimmen Sie die Anzahl der Pumpen die einen Defekt hatten und die Anzahl der Pumpen die keinen Defekt hatten.
Antwort:
Anzahl defekter Pumpen: 15
Anzahl Pumpen ohne Defekt: 15
Summe aller Pumpen: 30 (In der Aufgabenstellung wurde dies nicht gefragt. Für die weiteren Berechnungen ist dieser Wert aber wichtig!)
Excel-Formel:
Da in der Spalte D „Defekt“ die diskreten Werte 1 oder 0 eingetragen sind bietet sich hier die Excel-Funktion „ZÄHLENWENN“ an.
2) Frage:
Bestimmen Sie die Anzahl der Pumpen, die einen Defekt hatte während diese in der Laufzeit-Kategorie „l“ (zwischen 3.000 und 5.000 Stunden) war. (Hinweis: Hier können Sie in Excel gut mit einer verschachteltem WENN-Abfrage arbeiten. Der Wahrheitstest besteht dann aus einer UND-Funktion)
Antwort:
Anzahl Pumpen: 6
Excel-Formel:
In der Musterlösung haben wir eine eigene Spalte zum zählen dieses Parameters angelegt. Im ersten Schritt haben wir für alle 30 Pumpen in der neuen Spalte die „WENN“ Funktion genutzt. Der Wahrheitstest dieser „WENN“ Funktion besteht dann wiederum aus einer „UND“ Funktion die prüft ob die Laufzeit zwischen 3.000 und 5.000 liegt und ein Defekt vorliegt. Ist die „WENN“ Funktion wahr, dann wurde für die Spalte eine „1“ eingetragen. Sonst eine „0“. Am Ende der Spalte haben wir dann alle „1“-sen aufsummiert.
3) Frage:
Bestimmen Sie mit einer ähnlichen Vorgehensweise wie in Schritt 2 die Summen für Folgende Kategorien:
- a: Wenn Defekt und durchschnittliche Lagertemperatur > 80 °C
- b: Wenn Defekt und Kavitation
- c: Wenn kein Defekt und Laufzeit = l
- d: Wenn kein defekt und durchschnittliche Lagertemperatur > 80 °C
- e: Wenn kein defekt und Kavitation
Antwort:
- a: Anzahl Pumpen mit Defekt und einer durchschnittlichen Lagertemperatur > 80 °C: 9
- b: Anzahl Pumpen mit Defekt und Kavitation: 12
- c: Anzahl Pumpen ohne Defekt und einer Laufzeit = „l“: 4
- d: Anzahl Pumpen mit Defekt und einer durchschnittlichen Lagertemperatur > 80 °C: 2
- e: Anzahl Pumpen mit Defekt und einer durchschnittlichen Lagertemperatur > 80 °C: 4
Excel-Formel:
Die Lösung funktioniert hier analog zu Schritt 2. Es muss nur die Wahrheitsbedingung gemäß der Abfrage angepasst werden.
4) Frage:
Berechnen Sie die Teilergebnisse, die beiden Produkte (Zwei Multiplikationen der vier Teilergebnisse) und die Summe. (Hinweis: Mit „Teilergebnisse“ meinen wir die Werte, die in dem Beispiel des Videos die jeweiligen Bruchzahlen waren. Hierfür verweisen wir gerne nochmal auf die Excel-Tabelle „Beispiel YouTube-Video“. Hier können Sie die Bruchzahlen aus dem Video in Form von Dezimalzahlen wiederfinden.)
Antwort:
Formeln und Berechnung:
Excel-Formel:
In der Musterlösung.
5) Frage:
Berechnen Sie die Wahrscheinlichkeit dafür, dass die Pumpe unter den besagten Bedingungen „Kavitation, Lagertemperatur > 80°C und Anzahl der Betriebsstunden in Kategorie l“ einen Defekt haben wird.
Antwort:
Formeln und Berechnung:
6) Frage:
Im Idealfall haben Sie jetzt eine Excel-Maske die sich dafür eignet mit kleinen Änderungen neue Vorhersagen möglich zu machen. Berechnen Sie noch die Wahrscheinlichkeiten für zwei neue Fälle:
- a: Fall 2: Keine Kavitation und Lagertemperatur > 80°C und Betriebsstunden in Kategorie m
- b: Fall 3: Kavitation und Lagertemperatur < 80°C und Betriebsstunden in Kategorie s
Antwort:
Fall 2:
Fall 3:
Folgen Sie uns auf Social Media: