Panoramica del rilevamento di anomalie

Il rilevamento di anomalie è una tecnica di data mining che puoi utilizzare per identificare i dati deviazioni in un determinato insieme di dati. Ad esempio, se il tasso di reso di un determinato prodotto aumenta notevolmente rispetto al valore di riferimento, potrebbe indicare un difetto del prodotto o una potenziale attività fraudolenta. Puoi utilizzare il rilevamento di anomalie rilevare incidenti critici, come problemi tecnici o opportunità, come cambiamenti nel comportamento dei consumatori.

Un problema quando si usa il rilevamento di anomalie è determinare cosa viene considerato come di dati anomali. Se disponi di dati etichettati che identificano anomalie, puoi eseguire il rilevamento di anomalie utilizzando la funzione ML.PREDICT con uno dei seguenti modelli di machine learning supervisionati:

Se non sei sicuro di cosa viene conteggiato come dati anomali o se non hai etichettato di addestramento su cui addestrare un modello, puoi usare il machine learning non supervisionato rilevamento di anomalie. Utilizza la Funzione ML.DETECT_ANOMALIES con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nuovi per la gestione dei dati:

Tipo di dati Tipi di modello Che cosa fa ML.DETECT_ANOMALIES
Serie temporale ARIMA_PLUS Rileva le anomalie nelle serie temporali.
ARIMA_PLUS_XREG Rilevare le anomalie nelle serie temporali con i regressori esterni.
Variabili casuali indipendenti e con distribuzione identica (IID) K-means Rileva le anomalie in base alla distanza più breve tra i valori distanze dai dati di input a ciascun centroide del cluster. Per la definizione di distanze normalizzate, consulta l'output del modello K-means per la funzione ML.DETECT_ANOMALIES..
Codificatore automatico Rileva le anomalie in base alla perdita di ricostruzione in termini di media al quadrato. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può recuperare tutti i tipi di perdita di ricostruzione.
PCA Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio.