Analisi del contenuto

L'analisi del contenuto è un insieme ampio ed eterogeneo di tecniche manuali o assistite da computer di interpretazione contestualizzata di documenti provenienti da processi di comunicazione in senso proprio (testi) o di significazione (tracce e manufatti), aventi come obiettivo finale la produzione di inferenze valide e attendibili"^[1].

La locuzione «analisi del contenuto» è storicamente controversa e ancora oggi viene associata a un insieme piuttosto ampio ed eterogeneo di definizioni, metodi, pratiche e strumenti"^[2]. Ad un elevato livello di generalizzazione, l'analisi del contenuto (dall'inglese content analysis) è una famiglia di tecniche appartenenti al dominio delle scienze sociali orientate allo studio del contenuto di quei tipi di documentazione empirica che, con Hodder, possiamo definire "documenti silenziosi" (mute evidence), ossia testi e artefatti^[3]. Più nello specifico, tenuto conto degli sviluppi più recenti della letteratura di riferimento, la documentazione empirica tipicamente sottoposta a scrutinio con l'analisi del contenuto proviene o da processi di comunicazione strictiore sensu (ovvero processi in cui esiste un'emittente che attiva il processo comunicativo e un codice sufficientemente condiviso tra emittente e destinatario) o da processi che, in semiotica, sono di solito chiamati di significazione (assenza dell'emittente e di un codice condiviso, la semiosi si sviluppa per abduzione)^[4]^[5]. In accordo a quanto detto, possono essere propriamente definiti testi (scritti, audiovisivi, iconici, multimediali, ecc.) i documenti che provengono da processi di comunicazione in senso stretto; quelli che derivano da processi di significazione si dividono in tracce e manufatti^[6].

A partire dagli anni novanta la crescente diffusione dei software per l'analisi dei testi ha impresso una notevole accelerazione all'uso dei documenti nella ricerca sociale (impiegati anche in ambiti diversi da quello delle comunicazioni di massa), determinando la crescita esponenziale di applicazioni e soluzioni.

La preparazione del testo e i programmi per l'analisi del contenuto

Una volta definito l'insieme dei testi da analizzare, è necessario curarne l'organizzazione interna e la trascrizione, prestando attenzione soprattutto ai seguenti requisiti:

a) la comparabilità dei testi;

b) la disponibilità di una o più caratteristiche da associare a ciascun frammento (ad esempio il genere o l'età dell'autore o la data o la testata di un articolo di giornale);

c) le dimensioni del testo: è necessario disporre di testi sufficientemente lunghi (minimo 20.000 parole o occorrenze) che rendano vantaggioso il ricorso a tecniche automatiche di analisi.

I programmi per l'analisi del contenuto possono essere distinti in due gruppi:

a) i software del tipo CAQDAS (Computer-aided qualitative data analysis software) che consentono di etichettare manualmente porzioni di testo con codici alfanumerici riferiti ai concetti che i ricercatori desiderano evidenziarvi (i più noti sono The Ethnograph, NUD.IST, Atlas, e Nvivo);

b) i software finalizzati all'analisi semi-automatica mediante tecniche statistiche e lessicali (i più noti sono SPAD, Sphinx, Alceste, Lexico, Wordmapper, Taltac e Tlab).

I software del primo gruppo sono utilissimi per navigare il testo ma all'aumentare delle dimensioni dei testi da analizzare il lavoro di codifica diventa molto oneroso. I software del secondo gruppo si basano invece sull'analisi delle parole e delle loro relazioni all'interno del testo e sono particolarmente appropriati per l'analisi sistematica di testi di ampie dimensioni.

Operazioni di analisi

In genere il punto di partenza è l'analisi delle parole diverse che compongono il corpus, ordinate per valori decrescenti di frequenza (vocabolario). Tra le parole ad alta frequenza di un vocabolario, oltre a quelle di contenuto strumentale (di, e, che, per, etc.), poco informative e generalmente presenti in tutti i testi, ci si imbatte subito nelle cosiddette “parole tema”, che proprio per via della loro elevata frequenza consentono di cogliere immediatamente gli argomenti principali del testo.

I passi di analisi che consentono di descrivere in modo semi automatico il contenuto di un testo sono i seguenti:

analisi dei segmenti ripetuti;
analisi delle co-occorrenze;
analisi delle parole caratteristiche;
analisi del linguaggio peculiare;
analisi delle parole con caratteristiche grammaticali omogenee;
analisi delle concordanze;
analisi delle corrispondenze lessicali.

I segmenti ripetuti sono quelle forme composte, costituite da parole che compaiono nel corpus con la stessa sequenza. Alcuni di essi sono particolarmente rilevanti dal punto di vista semantico, poiché consentono di delimitare i significati delle parole presenti nel testo (ad esempio: carta di credito, Capo dello Stato, politica economica, guardia di finanza). L'insieme dei segmenti ripetuti significativi di un testo aiuta a fornire una rappresentazione sintetica dei contenuti del corpus e a individuare rapidamente attori, oggetti e azioni su cui è strutturato il testo.

L'analisi delle co-occorrenze consente di studiare le associazioni tra parole, individuando quelle parole che compaiono più spesso vicine tra loro.

L'analisi delle parole caratteristiche (o specifiche) consente di differenziare le diverse parti di un testo evidenziando quelle parole che sono sovrarappresentate nel linguaggio di una categoria di autori (per esempio le donne, gli articoli di una determinata testata, etc.). In questo modo è possibile caratterizzare il linguaggio, o più semplicemente i riferimenti tematici sovra-rappresentati in determinati gruppi di individui.

Per l'analisi del linguaggio peculiare è necessario disporre di una particolare risorsa linguistica, i lessici di frequenza, generalmente costruiti per rappresentare il linguaggio comune di una determinata comunità linguistica. In queste liste composte da milioni di occorrenze e derivate da fonti diverse (stampa, linguaggio parlato, letteratura, etc.), a ciascuna parola è associata una frequenza, che serve a indicare l'uso atteso di ogni parola nella comunità linguistica a cui il lessico è riferito. Se si confronta il vocabolario del testo in esame con quello del lessico di frequenza prescelto è possibile ottenere una lista di parole sovra-rappresentate che corrispondono al linguaggio peculiare del testo stesso.

Anche l'insieme delle parole con caratteristiche grammaticali omogenee può essere utile per l'analisi: ad esempio l'insieme dei verbi ricondotti al lemma può fornire una graduatoria delle azioni menzionate nel testo, l'insieme degli aggettivi fornisce elementi per valutare il tono di un testo, oppure l'insieme e il tipo di pronomi può dar conto del tipo di interazione presente tra soggetti che caratterizza il testo.

Per ritornare al testo originario è molto utile l'analisi delle concordanze (Key word in context), tecnica che consente di analizzare il contesto d'uso di una parola di interesse (o di gruppi di parole con la stessa radice) visualizzando le n parole precedenti e le n successive alla parola in analisi, tutte le volte che questa compare nel corpus. L'analisi delle concordanze è indispensabile sia per risolvere alcune delle ambiguità semantiche, sia per ricostruire per ogni parola i riferimenti tematici a cui questa rinvia, tracciando una mappa concettuale tra parole e temi affrontati.

L'analisi delle corrispondenze lessicali è una tecnica multivariata che consente di sintetizzare l'informazione contenuta in una grossa matrice di dati testuali, visualizzando sul piano fattoriale l'associazione tra le forme (parole) all'interno del testo in analisi, cercando la migliore rappresentazione simultanea degli elementi di riga e colonna, in modo da studiare l'interdipendenza tra caratteri. Gli assi possono essere interpretati in qualità di dimensioni semantiche attraverso cui leggere il corpus: la vicinanza tra parole sul piano fattoriale rinvia infatti a una loro combinazione o associazione nel testo, e l'esplorazione delle associazioni tra le parole contribuisce alla lettura/descrizione del corpus.

Note

^ G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, p. 42, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).
^ G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, p. 31, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).
^ I. Hodder, The interpretation of documents and material culture, Thousand Oaks etc., Sage, 1994, p. 155, ISBN 0-7619-2687-9.
^ G. Tipaldo, Santangelo A., Handbook of TV quality assessment, Preston, UK, UCLan Publishing, 2013, p. 29, ISBN 978-0-9926349-1-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 12 febbraio 2014).
^ G. Tipaldo, L'analisi del contenuto e i mass media, Bologna, IT, Il Mulino, 2014, pp. 29-30, ISBN 978-88-15-24832-9 (archiviato dall'url originale il 26 febbraio 2014).
^ G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, pp. 25-30, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).

Bibliografia

Bolasco Sergio, Analisi multidimensionale dei dati. Metodi, strategie e criteri d'interpretazione, 1999, Roma, Carocci, (6^ ristampa, 2014), ISBN 88-430-1401-3.
Bolasco Sergio, L'analisi automatica dei testi. Fare ricerca con il text mining, 2013, Roma, Carocci, ISBN 978-88-430-7018-3.
Della Ratta-Rinaldi Francesca, L'interpretazione sistematica del materiale derivante da focus group attraverso l'analisi testuale, in “Sociologia e Ricerca Sociale”, 2005, XXVI (76-77), pp. 91-104.
Jenny Jacques, Méthodes et pratiques formalisées d'analyse de contenu et de discours dans la recherche sociologique française contemporaine. Etat des lieux et essai de classification, in “Bulletin de Méthodologie Sociologique”, 1997, 54, pp.64-112.
Krippendorff Klaus, Analisi del contenuto. Introduzione metodologica, 1983, Torino: ERI.
Losito Gianni, L'analisi del contenuto nella ricerca sociale, 2007, Milano, Franco Angeli.
Giuliano Luca, La Rocca Gevisa, L'analisi automatica e semi-automatica dei dati testuali, 2008, Milano, LED Edizioni Universitarie, ISBN 978-88-7916-382-8
Lebart Ludovic, Salem André, Analyse statistique des données textuelles. Question ouverte et lexicométrie, 1988, Paris, Dunod, ISBN 2-10-002239-3.
Nobile Stefano, La credibilità dell'analisi del contenuto, 1997, Milano, Franco Angeli, ISBN: 9788846403070
Santangelo Antonio e Tipaldo Giuseppe, "Handbook of TV Quality Assessment: A socio-semiotic approach for Prix Italia jurors", 2013, UCLan Publishing, Preston, UK, ISBN 978-0-9926349-1-9.
Silverman David, Come fare ricerca qualitativa, 2002, Roma, Carocci, ISBN 88-430-2139-7.
Tipaldo Giuseppe, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti", 2014, Bologna, Il Mulino, ISBN 978-88-15-24832-9.
Tuzzi Arjuna, L'analisi del contenuto. Introduzione ai metodi e alle tecniche di ricerca, 2003, Roma, Carocci.

Voci correlate

Altri progetti

Wikimedia Commons contiene immagini o altri file su analisi del contenuto

Collegamenti esterni

(EN) content analysis, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
Definizione da One Minute Dictionary, dizionario in video di BitMAT

Controllo di autorità	Thesaurus BNCF 48824 · LCCN (EN) sh85031537 · GND (DE) 4027005-1 · BNE (ES) XX533799 (data) · BNF (FR) cb11940319x (data) · J9U (EN, HE) 987007557969405171 · NDL (EN, JA) 00576822

Portale Letteratura

Portale Linguistica

[1] G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, p. 42, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).

[2] G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, p. 31, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).

[3] I. Hodder, The interpretation of documents and material culture, Thousand Oaks etc., Sage, 1994, p. 155, ISBN 0-7619-2687-9.

[4] G. Tipaldo, Santangelo A., Handbook of TV quality assessment, Preston, UK, UCLan Publishing, 2013, p. 29, ISBN 978-0-9926349-1-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 12 febbraio 2014).

[5] G. Tipaldo, L'analisi del contenuto e i mass media, Bologna, IT, Il Mulino, 2014, pp. 29-30, ISBN 978-88-15-24832-9 (archiviato dall'url originale il 26 febbraio 2014).

[6] G Tipaldo, L'analisi del contenuto e i mass media. Oggetti, metodi e strumenti, Bologna, Il Mulino, 2014, pp. 25-30, ISBN 978-88-15-24832-9. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 15 febbraio 2014).

[1]

[2]

[3]

[4]

[5]

[6]