Anomalieerkennung – Übersicht

Die Anomalieerkennung ist ein Data-Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Datensatz ermitteln können. Wenn sich die Rücksenderate für ein bestimmtes Produkt beispielsweise deutlich über dem Normalwert für dieses Produkt erhöht, kann das auf einen Produktfehler oder potenziellen Betrug hinweisen. Mithilfe der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.

Eine Herausforderung bei der Anomalieerkennung besteht darin, zu bestimmen, was als anormale Daten gilt. Wenn Sie Daten mit Labels haben, anhand derer Anomalien identifiziert werden, können Sie die Anomalieerkennung mit der Funktion ML.PREDICT und einem der folgenden beaufsichtigten Modelle für maschinelles Lernen durchführen:

Wenn Sie sich nicht sicher sind, was als anormale Daten gilt, oder keine mit Labels versehenen Daten zum Trainieren eines Modells haben, können Sie die Anomalieerkennung mit unbeaufsichtigtem maschinellem Lernen durchführen. Verwenden Sie die ML.DETECT_ANOMALIES-Funktion mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Auslieferungsdaten zu erkennen:

Datentyp Modelltypen Aufgabe von ML.DETECT_ANOMALIES
Zeitreihe ARIMA_PLUS Anomalien in der Zeitreihe erkennen.
ARIMA_PLUS_XREG Erkennen Sie Anomalien in der Zeitreihe mit externen Regressoren.
Unabhängige und identisch verteilte Zufallsvariablen (IID) K-means Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie in der K-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES.
Autoencoder Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS. Die Funktion ML.RECONSTRUCTION_LOSS kann alle Arten von Rekonstruktionsverlusten abrufen.
PCA Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen.