Dal corso: I Big Data nell'era dell'IA

Sblocca questo corso con una prova gratuita

Iscriviti adesso per accedere a oltre 23.200 corsi tenuti da esperti del settore.

Problemi con la preparazione dei dati

Problemi con la preparazione dei dati

- [Narratore] Il salmone può essere allevato o può essere catturato allo stato selvatico. Ma in entrambi i casi ci vuole una discreta quantità di lavoro prima che vengano trasformati in questo. Tutti sanno che la preparazione del cibo è una parte importante anche se dispendiosa in termini di tempo e spesso noiosa della cottura. C'è un principio simile in qualsiasi progetto di big data. La regola empirica è che circa l'80% del tempo dedicato a un progetto big data viene speso per preparare i dati. E questa è stata la mia esperienza. Ora ci sono diversi motivi per cui questo potrebbe essere il caso. Include cose come come vengono inseriti i dati? Se stai usando dati catturati selvaggiamente, ovvero dati che hai scoperto là fuori nel mondo e che forse sono stati inseriti con testo libero. Devi guardare cose come i nomi dei luoghi. Ecco quattro modi diversi per indicare la California. Puoi scriverlo, puoi usare varie abbreviazioni e l'inclusione di un punto. Almeno per impostazione…

Contenuti