GIGO
En informatique, GIGO (garbage in, garbage out) est l'idée selon laquelle des données d'entrée défectueuses ou absurdes produisent des sorties absurdes ou « déchets ». Au Royaume-Uni, le terme parfois utilisé est « rubbish in, rubbish out » (RIRO)[1],[2].
Le principe s'applique également de manière plus générale à toute analyse et logique, en ce sens que les arguments ne sont pas valables si leurs prémisses sont erronées.
Historique
[modifier | modifier le code]L'expression est populaire dès la naissance de l'informatique, et s'applique encore plus aujourd'hui puisque les ordinateurs récents peuvent produire de plus grandes quantités de données ou d'informations erronées en peu de temps. La première utilisation de ce terme remonte à un article du de l'agence de presse The Times of Northwest Indiana portant sur les mathématiciens de l'armée américaine et leur travail avec les premiers ordinateurs[3]. William D. Mellin y décrit que les ordinateurs ne peuvent pas penser par eux-mêmes et que des entrées « mal programmées » conduisent inévitablement à des résultats incorrects. Une remarque similaire est notée par un des précurseurs de l'informatique :
« On two occasions I have been asked, “Pray, Mr. Babbage, if you put into the machine wrong figures, will the right answers come out?” ... I am not able rightly to apprehend the kind of confusion of ideas that could provoke such a question. »
« À deux reprises on m'a demandé, “Dites-nous, Mr. Babbage, si vous mettez dans la machine des chiffres erronés, est-ce que des bonnes réponses en sortiront ?”... Je ne suis pas en mesure d'imaginer correctement le type de confusion d'idées qui pourrait provoquer une telle question. »
Plus récemment, la Marine Accident Investigation Branch parvient à une conclusion similaire :
« A loading computer is an effective and useful tool for the safe running of a ship. However, its output can only be as accurate as the information entered into it. »
« Un ordinateur est un outil efficace et utile pour le bon fonctionnement d'un navire. Toutefois, ses résultats ne peuvent être qu'aussi justes que les informations qui y sont entrées. »
Le terme pourrait être dérivé de Last in, first out (LIFO) ou first in, first out (FIFO)[6].
« Decision-makers increasingly face computer-generated information and analysis that could be collected and analyzed in no other way. Precisely for that reason, going behind that output is out of the question, even if one has good cause to be suspicious. In short, the computer analysis becomes a credible references point although based on poor data. »
« Les décideurs sont de plus en plus confrontés à des informations et des analyses générées par ordinateur qui ne pourraient être ni collectées ni analysées autrement. C'est précisément pour cette raison qu'il est hors de question d'aller au-delà de ces résultats, même si l'on a de bonnes raisons d'être méfiant. En bref, l'analyse informatique devient un point de référence crédible bien qu'elle soit basée sur des données médiocres. »
Usage
[modifier | modifier le code]GIGO est couramment utilisé pour décrire des erreurs dans la prise de décision, dues à des données erronées, incomplètes ou imprécises.
Ce terme peut également être utilisé pour décrire un fichier audio ou vidéo numérique de mauvaise qualité [réf. souhaitée]. Bien que la numérisation puisse être la première étape du nettoyage d'un signal analogique, elle n'améliore pas la qualité du fichier : les défauts originels seront toujours enregistrés, mais pourront être identifiés et éliminés lors d'une étape ultérieure par le traitement numérique du signal.
GIGO était aussi le nom d'un programme passerelle de Usenet vers FidoNet, MAUSnet, entre autres[8].
En statistique
[modifier | modifier le code]Une analyse statistique est toujours possible avec des données incorrectes. Même si elles peuvent empêcher une analyse correcte[9], les données peuvent toujours être traitées. D'où l'importance de connaître les conditions de récupération de l'échantillon.
Le proverbe « une horloge cassée a raison deux fois par jour » en est un exemple : ce « résultat » peut être défini comme partiellement correct, en notant que certains réglages de l'heure ne sont corrects que deux fois par jour, lorsque l'observation coïncide avec le résultat attendu par accident.
Voir aussi
[modifier | modifier le code]- Biais algorithmique
- Computer says no (en)
- Premier entré, jamais sorti (en)
- Erreur standard
- Comportement indéfini (en)
Références
[modifier | modifier le code]- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Garbage in, garbage out » (voir la liste des auteurs).
- (en-GB) « Machine learning collaborations accelerate materials discovery », sur Physics World, (consulté le ).
- (en) John Adair, The Art of Creative Thinking: How to be Innovative and Develop Great Ideas, Kogan Page Publishers, (ISBN 978-0-7494-6008-2, lire en ligne)
- « Clipped From The Times », The Times, , p. 65 (lire en ligne, consulté le )
- (en) Charles Babbage et Green, Longman, Roberts and Green Longman, Passages from the life of a philosopher, (OCLC 258982, lire en ligne)
- (en) MAIB, « Hoegh Osaka: Listing, flooding and grounding on 3 January 2015 », sur gov.uk, .
- (en-GB) « World Wide Words: Garbage in, garbage out », sur World Wide Words (consulté le ).
- (en) Daniel T. Brooks, Computer Applications in Particular Industries: Securities, Computers & The Law, American Bar Association, Section of Science and Technology, , 3e éd., p. 250, 253
- (en) jfesler, « GIGO History · GIGO », sur gigo.com, (consulté le ).
- (en-US) « How Anomalies Can Wreck Your Data (Garbage In, Garbage Out) », sur Heap, (consulté le ).
- Cet article se base sur le contenu du Free On-line Dictionary of Computing datant du et incorporé sous les termes de la GFDL, version 1.3 ou ultérieure.