Discussion:Analyse des données
- Admissibilité
- Neutralité
- Droit d'auteur
- Article de qualité
- Bon article
- Lumière sur
- À faire
- Archives
- Commons
Type de remarque | À vérifier | Explication détaillée | Fait ? |
---|---|---|---|
Accessibilité | Les pratiques facilitant la lecture par les logiciels pour malvoyants ou pour non-voyants sont prises en compte dans la mesure du possible (un gadget peut être activé pour y aider). | Wikipédia:Atelier accessibilité/Bonnes pratiques | |
Conventions bibliographiques | Il existe sur Wikipédia des conventions bibliographiques, à respecter tant dans les références que dans la partie « Bibliographie » et dans les renvois bibliographiques. | Wikipédia:Conventions bibliographiques. Et voir les modèles {{ouvrage}}, {{chapitre}}, {{article}} et {{lien web}} | |
Guillemets | Si l'article contient des guillemets anglais : " ", il faut les remplacer par ceux-ci : « »[1]. | Wikipédia:Conventions typographiques#Guillemets | |
Images | Les images n'ont pas de taille fixée, les schémas de plus de 350 px sont centrés, les photographies avec un ratio autre que 4/3 ou 3/4 sont réglées avec un « upright » ou « redresse » (équivalent) adéquat. Les images non indispensables sont supprimées, et les pages sur Commons sont liées. Les descriptions des fichiers des images (Commons inclus) devraient disposer d'une version en français. | Wikipédia:Mise en forme des images | |
Italique | L'italique est à réserver à un nombre de cas limités, comme l'emploi de termes étrangers et les titres d'œuvres (livres, albums musicaux, titres de chansons, etc.) | Wikipédia:Conventions typographiques#Italique | |
Langue des références | Les références en langue(s) étrangère(s) sont précédées du modèle l'annonçant : Anglais > {{en}} > (en), Allemand > {{de}} > (de), etc. Le paramètre langue= est à préférer pour les références utilisant des modèles bibliographiques. |
Catégorie:Modèle d'indication de langue | |
Liens externes dans le corps du texte | Un lien externe ne doit pas figurer dans le corps de l'article mais doit être transféré en référence. | Wikipédia:Liens externes | |
Liens internes dans les titres | Les liens internes sont à éviter dans les titres des sections et les sous-sections de l'article. | Wikipédia:Liens internes#Accessibilité | |
Ligatures | L'article parle d'« oeuvre » (ou « Oeuvre ») et de « soeur » ? Il faut écrire « œuvre » (ou « Œuvre ») et « sœur »[1]. | Wikipédia:Fautes d'orthographe/Courantes#Ligature | |
Majuscules | Une lettre normalement accentuée doit l'être également quand elle apparaît sous la forme d'une majuscule[1]. | Wikipédia:Conventions typographiques#Accentuation | |
Nombre | La syntaxe formatnum ({{formatnum:123456789}}) permet de mettre en forme les chiffres isolés. {{Unité}} ou {{nobr}} est indispensable pour les chiffres suivis ou précédés d'une unité ou d'un nom. | Wikipédia:Conventions typographiques#Nombres et espaces | |
Note à appels multiples | Si deux passages de l'article sont sourcés par exactement la même référence, on utilisera <ref name=..> ou mieux {{Note|...}} ou {{sfn|...}}. | Aide:Note (aide détaillée)#Notes à appels multiples | |
Points | Mettre un point final à la fin de chaque phrase, verbale ou non ; en particulier, les légendes d'illustrations, les notes, les références de sources, etc. | Wikipédia:Conventions typographiques#Points | |
Ponctuation | Mettre une espace avant et après les ponctuations doubles (point-virgule, double point, point d'interrogation, point d'exclamation) ; une espace après les ponctuations simples[1]. | Wikipédia:Conventions typographiques#Signes de ponctuation | |
Références et ponctuation | Les références précèdent la ponctuation et collent au dernier mot[1]. Lorsque plusieurs références se suivent, elles sont séparées par {{,}}. | Aide:Note#Règles relatives à la ponctuation | |
Traduction | Lors d'une traduction, l'apposition du modèle {{Traduction/Référence}} sur l'article est obligatoire si un résumé de modification ne fournit pas l'information complète nécessaire. | Aide:Crédit d'auteurs#Modèles de crédit des auteurs |
- Une façon simple de vérifier ce point est d'utiliser la fonction « recherche sur cette page » de votre navigateur, en mode lecture ou édition (Ctrl F sur la plupart des navigateurs).
Titre de l'article
[modifier le code]Celui-ci est actuellement "Analyse des données (statistiques)" où rien ne justifie la parenthèse ("Analyse des données" redirige ici). Le changement de sens de la redirection me semble évident, mais nécessite l'usage des outils d'administrateur (coup de bol, j'ai). Si personne n'émet de réserves dans un temps raisonnable, disons une semaine, je changerai donc le titre de l'article en un simple "Analyse des données". Touriste ✉ 21 janvier 2009 à 17:43 (CET)
Quelques remarques
[modifier le code]Tout d'abord, je tiens à féliciter Jackverr pour son excellent travail. Voici quelques remarques :
- L'utilisation des abréviations ACP, ACM, etc dans les titres de parties me gêne. Même si ces abréviations sont usuelles dans cette littérature, elles ne le sont pas pour un lecteur néophyte et je pense qu'il serait plus avisé de mettre les noms entiers dans les titres de parties.
- Plus fondamentalement, l'article fait référence à un certain nombre de sources qui sont simplement publiées sur des site web. Hors la qualité des sources est aussi essentielle sur wikipedia (WP:SOURCES) et il faut dans la mesure où cela est possible se référer soit à des ouvrages publiés, soit à des articles académiques publiés dans des revues à comité de lecture. Par exemple :
- L'Introduction à l’analyse des données de Samuel Ambapour est un simple document de travail (http://www.cnsee.org/Publication/PDF/BAMSIREPRINT04.pdf)
- De même cet article semble être un simple document de travail (http://www.datatheory.nl/pdfs/92/92_12.pdf)
- Idem pour http://www.umiacs.umd.edu/~knkim/KG_VISA/PCA/FaceRecog_PCA_Kim.pdf
- Ce lien http://olivier.godechot.free.fr/hopfichiers/IntroductionAnalyseDonnees.pdf renvoie à de simples notes de cours, certes rédigées par un chercheur reconnu, mais qui n'ont fait l'objet d'aucune relecture. Je suis certain que de nombreux manuels contiennent les mêmes informations et constitueraient une source bien plus crédible.
- http://www.math.univ-toulouse.fr/~besse/pub/Explo_stat.pdf n'est qu'un document de travail
- http://blogperso.univ-rennes1.fr/arthur.charpentier/index.php/post/2009/02/02/Le-"cercle-des-corrélations"-en-ACP n'est qu'un simple article de blog. Ne peut-on pas trouver la même information dans un ouvrage ou un article publié ?
- Lorsque les articles ont été publiés dans des revues académiques, il serait préférable d'utiliser le modèle:Article au modèle:Lien web. Cela permet de préciser les références de la revue. Par exemple :
- L'article de Lebart (http://www.jehps.net/Decembre2008/Lebart.pdf) est publié dans une revue mais la revue n'est pas mentionnée dans l'article alors que c'est un élément de rendre la source plus crédible.
- De même pour cet article http://takane.brinkster.net/yoshio/b008.pdf
- De même pour http://msh.revues.org/2967?file=1
- De même http://pbil.univ-lyon1.fr/R/articles/abd02.pdf
- Ce lien http://perso.univ-rennes1.fr/arthur.charpentier/ASSNVT2.pdf devrait être remplacé par une référence à l'ouvrage d'Arthur Charpentier
--PAC2 (d) 4 janvier 2012 à 17:27 (CET)
- Merci pour cette relecture. Effectivement, j'ai du travail à faire sur les sources. Je ne pensais pas que c'était aussi important, puisque je donne aussi des reférences bibliographiques. OK j'y retourne !
- voir la page "A Faire". j'ai modifié le maximum de références que je pouvais, mais j'en ai laissé quelques-unes dont les auteurs me semblent crédibles.--Jackverr (d) 5 février 2012 à 12:53 (CET)
- Merci pour cette relecture. Effectivement, j'ai du travail à faire sur les sources. Je ne pensais pas que c'était aussi important, puisque je donne aussi des reférences bibliographiques. OK j'y retourne !
AdQ?
[modifier le code]Article intéressant
[modifier le code]Un article intéressant sur l'analyse des données à la française : Alain Desrosières « Entre réalisme métrologique et conventions d'équivalence : les ambiguïtés de la sociologie quantitative », Genèses 2/2001 (no43), p. 112-127. URL : www.cairn.info/revue-geneses-2001-2-page-112.htm. --PAC2 (d) 18 janvier 2012 à 17:14 (CET)
- Merci pour l'article , intéressant en particulier sur la différence entre l'AD à la française et le Data Analysis anglo-saxon. Je vais réfléchir à la manière de m'en servir dans le paragraphe Definition par exemple.--Jackverr (d) 18 janvier 2012 à 22:25 (CET)
- Bonjour, dans la foulée, cela nécessite probablement un renommage de l'article, puisque les aspects "analyse des données qualitatives" ne semblent pas abordés non plus. Cordialement, Deuxtroy (d) 29 janvier 2012 à 16:42 (CET)
- Bonsoir, l'AFC et l'ACM traitent des données qualitatives et ont chacune un paragraphe dans l'article.--Jackverr (d) 29 janvier 2012 à 17:07 (CET)
- Je pense que le terme "Analyse des données" est un terme consacré dans littérature. C'est le terme utilisé par exemple par Michel Volle dans Analyse des données, Economica, 1997 ou encore par Gilbert Saporta Probabilites Analyse des Données et Statistique 2011, éditions Technip. L'autre possibilité, c'est d'utiliser le terme utilisé par Brigitte Le Roux, Frédéric Lebaron et Henri Rounat d' analyse géométrique des données (voir par exemple la page perso de Brigitte Le Roux (ici)). --PAC2 (d) 29 janvier 2012 à 17:13 (CET)
- Je faisais référence à ceci : [1], où l'on voit que l"analyse peut être statistique ou lexicale (dans le cas du marketing), et avec en introduction beaucoup de règles en amont de AFC ou ACM. Deuxtroy (d) 29 janvier 2012 à 17:34 (CET)
- Je pense que le terme "Analyse des données" est un terme consacré dans littérature. C'est le terme utilisé par exemple par Michel Volle dans Analyse des données, Economica, 1997 ou encore par Gilbert Saporta Probabilites Analyse des Données et Statistique 2011, éditions Technip. L'autre possibilité, c'est d'utiliser le terme utilisé par Brigitte Le Roux, Frédéric Lebaron et Henri Rounat d' analyse géométrique des données (voir par exemple la page perso de Brigitte Le Roux (ici)). --PAC2 (d) 29 janvier 2012 à 17:13 (CET)
- Bonsoir, l'AFC et l'ACM traitent des données qualitatives et ont chacune un paragraphe dans l'article.--Jackverr (d) 29 janvier 2012 à 17:07 (CET)
- Bonjour, dans la foulée, cela nécessite probablement un renommage de l'article, puisque les aspects "analyse des données qualitatives" ne semblent pas abordés non plus. Cordialement, Deuxtroy (d) 29 janvier 2012 à 16:42 (CET)
Relecture
[modifier le code]- Une pure question formelle : personnellement je n'aime pas tellement qu'on mette l'initiale du prénom et le nom. Soit on met que le nom, soit on met le nom et le prénom.--Jackverr (d) 22 janvier 2012 à 21:54 (CET)
- Est-ce que quelqu'un connait les prénoms de D. CAROLL et R.N. SHEPARD?--Jackverr (d) 30 janvier 2012 à 22:43 (CET)
- Les liens internes vers des notions trop évidentes comme technique, sport, image ou information ne me semblent pas nécessaires.
- Il me semble que l'ouvrage d'Antoine Prost Le vocabulaire des proclamations électorales 1974 aux PUF est un ouvrage important dans l'application des méthodes d'analyse des données, mais je n'ai pas l'ouvrage sous la main.
- désolé je ne connais pas cet ouvrage.--Jackverr (d) 22 janvier 2012 à 21:54 (CET)
--PAC2 (d) 20 janvier 2012 à 00:19 (CET)
Suppression d'un lien vers un travail d'étudiant
[modifier le code]J'ai supprimé le lien vers ce document qui semble être un travail réalisé par des étudiants dans un but pédagogique et dont rien ne garantit la qualité. --PAC2 (d) 22 janvier 2012 à 15:32 (CET)
- OK, vous avez bien fait--Jackverr (d) 22 janvier 2012 à 21:59 (CET)
Discussion
[modifier le code]- Dans l'intro vous dites : « ces représentations ne sont pas liées à une opinion « a priori » sur les lois des phénomènes analysés contrairement aux méthodes de la statistique classique. ». C'est vrai mais en même temps les méthodes d'analyse de données ne sont pas des méthodes d'inférence statistique au sens où ça n'a pas de sens de faire de test statistique dans ce cadre là ou même de construire des intervalles de confiance. Les méthodes d'analyse de données sont essentiellement des méthodes permettant de résumer de manière synthétique l'information contenue dans les données. Par conséquent, la comparaison avec la statistique inférentielle paramétrique ne me semble pas évidente.
- Pas d'accord.Dans les années 60, Benzécri considère l'absence d'hypothèse statistique comme une nouvelle approche par rapport à ce qui se faisait auparavant--Jackverr (d) 30 janvier 2012 à 22:40 (CET)
- Dans la phrase suivante « La classification automatique, l’analyse factorielle discriminante (AFD) ou analyse discriminante adoptent un autre type de représentation des individus, et permettent d’identifier des groupes homogènes au sein de la population du point de vue des variables étudiées. », j'ai supprimé la partie « adoptent un autre type de représentation des individus, et » qui n'apporte aucune information. C'est plus direct et plus clair ainsi à mon avis.
- J'ai également supprimé la conclusion de la partie historique parce qu'en général, on ne met pas de conclusion sur wikipedia :
L'analyse des données est donc une technique issue du {{s-|XX|e}}, avec des racines remontant parfois bien loin dans le passé, et dont les foyers d'apparition et d'expansion se répartissent tout autour du globe. Si l'analyse des données « à la française » est sans conteste une réalité, il ne faut pas non plus oublier que d'autres statisticiens-chercheurs dans le monde ont emprunté la même voie pour obtenir des résultats parfois semblables.
- noté.--Jackverr (d) 30 janvier 2012 à 22:40 (CET)
- Je pense que dans la partie historique, il serait mieux d'utiliser le présent plutôt que le passé--Jackverr (d) 30 janvier 2012 à 22:40 (CET).
- De mon point de vue, la partie application mériterait d'être largement développée et découpée en paragraphe ou en sous section pour chaque disciplines.
- Je n'ai pas assez de matériel pour faire ça, en outre je ne souhaite pas que cette partie soit sur-développée par rapport aux autres.--Jackverr (d) 30 janvier 2012 à 22:40 (CET)
- Je trouve la phrase « La sociologie compte beaucoup sur l'analyse des données pour comprendre la vie et le développement de certaines populations comme celles du Liban, de la Colombie ou de la Tunisie dont les études sont présentées par Jean-Paul Benzécri » beaucoup trop générale.
- OK. Je vais la compléter, pour que l'utilisation de l'AD soit plus clair dans cet exemple.--Jackverr (d) 30 janvier 2012 à 22:40 (CET)
- La phrase a été réécrite pour tenir compte de cette remarque, et donner quelques indications sur l'étude des populations du Liban présentées par JP Benzécri.--Jackverr (d) 1 février 2012 à 22:10 (CET)
- La référence aux études menées en Colombie et en Tunisie ont été supprimées.
Articles en langue étrangère
[modifier le code]La page en anglais "data analysis" ne correspond pas, mais alors pas du tout, à "analyse des données" au sens qui lui est donné ici (et il me semble en français) : "Analysis of data is a process of inspecting, cleaning, transforming, and modeling data (...)", ce qui est beaucoup plus large que la simple réduction de dimension à des fins de représentation et de description. L'analyse des données exclut a priori la modélisation. Malheureusement, je n'ai pas su trouver de page anglaise traitant spécifiquement de cela. "data mining" ne correspond pas. Les articles espagnol et italien (et sans doute les autres, mais je ne parle pas ces langues) sont de simples ébauches de traduction de l'article anglais, et donc présentent la même discordance.
--PAC2 (d) 30 janvier 2012 à 15:52 (CET)
- J'ai entrepris une discussion à ce sujet ici, pour ceux qui suivraient cette page : https://fr.wikipedia.org/wiki/Discussion_Portail:Probabilités_et_statistiques#L.27article_Analyse_des_donn.C3.A9es.2C_et_l.27analyse_statistique.2F.22data_analysis.22 --Soirhiver (discuter) 13 septembre 2017 à 01:31 (CEST)
Proposition d'article de qualité refusée le 28 février 2012
[modifier le code]Si vous désirez reprendre l'article pour l'améliorer, vous trouverez les remarques que firent les wikipédiens dans la page de vote.
Udufruduhu (d) 29 février 2012 à 00:11 (CET)
Discussion transférée depuis Wikipédia:Pages à fusionner
L'article en lui-même n'est pas sourcé, je ne pense pas qu'il soit un pan très important de la discipline, de ce fait mérite-t-il un article à lui tout seul ? -- JR (disc) 20 septembre 2018 à 07:43 (CEST)
- Data profiling semble être un terme plus large, d'après les définitions. D'ailleurs n'y a t il pas une traduction? Il existe aussi Consolidation informatique. Mais c'est trop pointu pour moi, je ne me prononce pas. --Io Herodotus (discuter) 20 septembre 2018 à 08:50 (CEST)
- Contre il existe une nuance entre les deux procédés — Les Yeux NoirsDiscuter 26 septembre 2018 à 20:49 (CEST)
- Article du projet Mathématiques d'avancement BA
- Article du projet Mathématiques d'importance élevée
- Article du projet Probabilités et statistiques d'avancement BA
- Article du projet Probabilités et statistiques d'importance élevée
- Article du projet Informatique d'avancement BA
- Article du projet Informatique d'importance moyenne
- Article du projet Sciences d'avancement BA
- Article du projet Sciences d'importance moyenne