Wiktionnaire:Actualités/081-décembre-2021
Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves d’ici
- Rapaloux a proposé un projet collectif en décembre afin de corriger de nombreuses entrées décrivant des noms de langues en anglais. Ces mots sont considérés comme des noms propres dans cette langue et étaient par erreurs qualifiés de noms communs. Grâce aux efforts conjoints de Treehill, Pamputt, Mavienvert et Rapaloux, ce fut pleinement corrigé dès le 11 décembre !
- Lionel Scheepmans a engagé une discussion sur la nature des sources utilisées dans le Wiktionnaire.
- Pamputt propose de reparler des résultats des souhaits de la communauté pour l’équipe de développement de la Wikimédia Foundation en 2020. Il s’agissait d’une procédure d’expressions des besoins techniques. Réalisée fin 2019 pour l’année 2020, elle proposait de se concentrer sur les projets autres que Wikipédia, Wikimedia Commons et Wikidata, qui ont de fortes communautés qui effaçaient les années précédentes les autres projets. Ainsi, 20 propositions ont été déposées pour les Wiktionnaires, et parmi celles-ci, la première a été soutenue par un nombre suffisant de personnes pour atteindre le cahier des charges des développeurs. Malheureusement, ceux-ci ont fini par annoncer ne pas pouvoir s’occuper de ce développement. La communauté voit donc ses efforts douchés une fois de plus, et il est fort peu probable qu’elle s’investisse dans la nouvelle consultation pour 2022 qui se déroulera pendant les mois de janvier et février.
- Le 15 décembre, l’accès aux lexèmes de Wikidata a été activé sur les Wiktionnaires en basque et en bengali. Comme sur Wikipédia, cet accès se fera via le langage de programmation Lua (Scribunto plus précisément).
- Pols12 propose d’élaborer collectivement une page de convention sur l’usage des notes, Convention:Notes.
Statistiques
- Du 20 novembre au 20 décembre 2021
15 909 entrées et 96 langues modifiées pour atteindre 4 467 308 entrées et 1 251 langues avec au moins cinq entrées.
2 510 entrées en français pour atteindre 397 678 lemmes et 610 978 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le same du Nord ( 7 520 entrées), le gallo ( 1 239 entrées), l’allemand ( 1 118 entrées), le breton ( 565 entrées) et le polonais ( 560 entrées).
Les nouvelles langues sont : le kaang ( 1) et le mro ( 1).
2 975 citations ou exemples en français pour atteindre 503 293.
969 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, pour atteindre 57 441.
- Du 30 novembre au 31 décembre 2021
3 414 sections de langue contenant au moins une prononciation audio (dont 619 pour le français) pour atteindre 307 691 sections de langue contenant au moins une prononciation audio pour 138 langues (dont 133 038 pour le français).
Aucun nouveau thésaurus ce mois-ci, le total reste de 1 098 thésaurus dans 67 langues dont 801 thésaurus en langue française.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
28 mots créés sur les 38 proposés dans les Mots du jour !
Brèves d’ailleurs
- Publication en ligne du numéro 174 de la revue académique Langage et société qui regroupe divers articles et compte-rendus de lecture d’ouvrages grand public.
- Avis de publication : Un dictionnaire inattendu de pédagogie par Philippe Meirieu, professeur en sciences de l’éducation qui analyse une cinquantaine de concepts critiques pour réfléchir sur les questions éducatives. L’auteur présente son ouvrage dans un entretien pour Café pédagogique et l’ouvrage est chroniqué par Dominique Martinez pour NVO comme un ouvrage libre et corrosif.
- Un article sur le site du Dicopathe de Jacques Picard revient sur la découverte du pidgin basco-islandais, des mots utilisés par les navigateurs basques lors de rencontres avec des étrangers, une sorte de lingua franca atlantique.
- Camille Jourdan revient dans Slate sur les méthodes des dictionnaires commerciaux suite aux polémiques sur le pronom iel. Luca Greco, sociolinguiste, revient sur la discussion avec une analyse pour Le Monde des usages du pronoms depuis plus d’une décennie par une partie des francophones et indique que la création de formes pronominales non binaires n’est pas une exception française.
- Lepetitjournal Istanbul republie un article sur 10 prénoms turcs qui ont aussi une signification en français si on les entend ou si on les lit comme si c’étaient des mots français.
- Alice Develey propose dans la section « Langue française » du Figaro des entretiens avec des personnalités liées aux dictionnaires. Laurent Catach raconte son aventure avec la création de la version numérique du Dictionnaire de l’Académie française. Jean Pruvost revient sur l’histoire des dictionnaires et leurs évolutions dans le temps.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
- À la fin du mois dernier, David Louapre a publié sur sa chaîne YouTube ScienceEtonnante une vidéo expliquant des notions de traitement automatique du langage naturel et d’apprentissage automatique : Comment les I.A. font-elles pour comprendre notre langue ?
- Le numéro de décembre 2021 de Sciences humaines signale l'appel à projet Decolonise science qui consiste en la traduction en six langues (zoulou, sotho du nord, yoruba, haoussa, luganda et amharique) de 180 articles scientifiques (dont le premier auteur ou première autrice est africain·e) dans le but d'établir des glossaires de termes scientifiques qui n'existent pas encore dans ces langues. Pour aller plus loin : What’s the isiZulu for dinosaur? (« comment dit-on dinosaure en zoulou »), Nature Podcast, 18 août 2021.
- Le 18 décembre 2021, la linguiste Maria Candea a été interviewée sur France Culture pour l’émission Le Français, langue vivante, et miroir de l’époque. Elle y parle de lexicographie, de sociolinguistique et mentionne très justement les rôles des dictionnaires et des linguistes quant à la langue.
- Le 23 décembre, Monté de la chaîne Linguisticae a sorti une vidéo sur l’alphabet latin. Il explique en quoi cet alphabet est très mal compris et mal utilisé en français, et pourquoi ça génère des ennuis à ses locuteurs et locutrices. Il replace son propos dans un contexte plus large des langues et leurs alphabets, et des réusages de l’alphabet latin dans le monde. Un épisode qui fait écho à la catégorie Termes en français par caractère .
- Pour une campagne de communication sur l’occitan, quelques expressions du français qui sont issues de cette langue sont présentées dans une courte vidéo.
- Ania propose une vidéo en français avec dix mots récents dans la langue russe.
Les mots de l’année 2021
Depuis quelques années, de nombreux médias proposent des mots de l’année, qui sont à la mode ou caractérisent un événement ou une discussion typique d’une année. Ils peuvent être choisis par une rédaction de dictionnaire, par le lectorat d’un journal ou par un sondage en ligne.
- Un sondage en ligne proposé en Belgique par le journal Le Soir, la RTBF et le Centre de recherche Valibel de l’université Louvain a sélectionné le terme ultracrépidarianisme. (rtbf.be)
- Le dictionnaire en ligne Merriam-Webster a annoncé son mot de l’année pour 2021 : vaccine (« vaccin »). (www.merriam-webster.com)
- Oxford Dictionaries a quant à lui choisi vax (« vaccin »). (languages.oup.com)
- Le Collins English Dictionary lui préfère NFT (« jeton non fongible »). (www.collinsdictionary.com)
- Le site Dictionary.com a choisit allyship (« soutien entre alliés ») devant les termes critical race theory (souvent non traduit ), burnout et vaccine (« vaccin »). (edition.cnn.com)
- Le Van Dale, dictionnaire de référence de la langue néerlandaise, a désigné comme mot de l’année prikspijt (« regret lié à la vaccination », de l’avoir été ou de ne pas l’avoir été) qui l’emporte devant woonprotest et wappiegeluid. Pour la Belgique, le podium est le suivant : 1. knaldrang, 2. tegelwippen, 3. boosterprik (vandale.nl)
- Pour l’espagnol, la Fundéu BBVA a sélectionné le mot vacuna (« vaccin ») comme mot de l’année, mentionnant également le mot composé vacuguagua (« vaccinobus »). (www.fundeu.es)
- Pour le portugais brésilien, c’est le mot vacina (« vaccin ») qui a été sélectionné. (cause.net.br)
- Le palmarès 2021 en Suisse romande : iel, précarités et variants. (www.lacote.ch)
- Le palmarès 2021 en Suisse alémanique : Impfdurchbruch (« infection post-vaccinale »), Starkregen, entfreunden. (www.presseportal.ch)
- Le palmarès 2021 en Suisse italienne : certificato, urgenza, exploit. (www.presseportal.ch)
- Le palmarès 2021 en Suisse romanche : respect, pazienza, tgira. (www.presseportal.ch)
- Attribué depuis 1977 par la Société pour la langue allemande, le prix du mot de l’année 2021 pour l’Allemagne : Wellenbrecher (« digue brise-lames », mesures de protection sanitaire par analogie avec les protections faces aux vagues déferlantes). (iamexpat.de)
- La Real Academia de la Lengua Vasca a choisi pour le basque le mot aldaera (« variante »). (noticiasdenavarra)
- L’outil de Google pour connaître les tendances de recherches propose les 10 mots dont la définition a été la plus recherchée en France en 2021 : 1 : survivaliste, 2 : demi-jauge, 3 : hybride, 4 : ERP, 5 : wokisme, 6 : islamo-gauchisme, 7 : poitrine tubéreuse, 8 : HPI, 9 : RSE, 10 : PMA.
- Pas de mot de l’année élu par les wiktionnaristes, mais on peut observer les mots les plus recherchés dans le Wiktionnaire en 2021 : chapeau, -ez, iel, merde, -ded, eau, avoir le seum, chien, feu, béninoiserie.
Dictionnaire du mois
- Marie-Éva de Villers, Multidictionnaire de la langue française, 7e édition, Édition Québec Amérique, 2021.
Le Multidictionnaire est un ouvrage usuel au Canada, mais moins connu ailleurs, alors qu’il existe depuis 33 ans. Sa septième édition est parue cette année, ce que le numéro d’août des Actualités n’avait pas manqué de faire savoir. C’est à nouveau un fort épais volume proposant des définitions sur plus de 1 800 pages.
Ce qui le distingue d’un dictionnaire de définition centré sur les sens et usages comme le Robert ou d’un dictionnaire encyclopédique tel que le Larousse, c’est qu’il apporte de très nombreuses notes d’explications pédagogiques détaillées. Des indications sur la prononciation plutôt que l’API systématiquement (par exemple : « notamment : les deux m se prononcent comme un seul : [nɔtamɑ̃] ») ou des indication sur la graphie selon le contexte (nu-tête mais tête nue), des indications de la conjugaison des verbes ou sur la structure qu’ils ont dans des phrases et même des indications typographiques avec les règles les plus communes, répétées aussi souvent que nécessaires. Des notes sémantiques et techniques viennent enrichir de très nombreuses entrées afin de faciliter la compréhension, d’expliquer les différences avec des mots proches ou des règles de la langue.
En ceci, il réunit plusieurs ouvrages lexicographiques et pédagogiques, dépassant sur certains aspects de sa couverture les intentions du Wiktionnaire, en accompagnement son lectorat vers la bonne utilisation des termes décrits. Il en vient à être normatif, pointant négativement les anglicismes sans les décrire et manquant parfois de nuance, notamment dans la description de la diversité de la langue. Pourtant, s’agissant d’un ouvrage québécois et canadien, il rend compte des usages spécifiques à cette aire, en indiquant d’une fleur de lys les entrées concernées. Les autres usages régionaux ne sont pas indiqués, et la courte introduction ne s’attarde pas sur les diversités géographiques de la langue. Une centaine de planches et tableaux de conjugaison viennent compléter l’ouvrage, apportant de nombreuses informations supplémentaires au fil de la lecture. La découverte des planches est hasardeuse, ce qui sert également le but pédagogique de l’ouvrage en rappelant régulièrement le fonctionnement de la langue.
La mise en page est claire et assez peu dense, avec de nombreux retours à la ligne pour les notes, qui rend l’exploration assez agréable, et pousse à s’y référer, même pour une personne non-québécoise ! Il existe également une version numérique, que je n’ai pas pu consulter, ainsi qu’un Multi des jeunes qui a l’air plus coloré. Si vous connaissez ces ouvrages, ou d’autres dictionnaires, n’hésitez pas à proposer des compléments à cette chronique !Quand les mots génèrent des images
Dans la lignée du logiciel DALL-E, les chercheurs en intelligence artificielle d’OpenAI ont réalisé GLIDE qui permet lui aussi de générer spontanément une image à partir d’un texte en langage naturel. L'aspect intéressant est que l'image est créée à la volée, en s'inspirant de bouts d'images déjà vus dans des catalogues d'images, mais sans les recopier intégralement ; toute image générée devrait donc être une nouvelle image. La technologie utilisée est à base de réseaux de neurones artificiels et plus précisément d'un modèle de type génératif appelé « modèle de diffusion ». Pour l’instant, si le démonstrateur ne fonctionne qu’en anglais, il impressionne quand même fortement. Par exemple, si vous soumettez le texte « a group of rhinoceros walking in muddy water », le logiciel vous affichera environ vingt secondes plus tard une image représentant « un groupe de rhinocéros marchant dans de l’eau boueuse ». Le logiciel devrait aussi permettre d’éditer seulement une partie d’une image existante à partir d’une instruction textuelle. Par exemple, la Figure 3 de la pré-publication GLIDE montre que le logiciel serait en mesure d’ajouter « une peinture d’un corgi sur le mur au-dessus d’un canapé » dans une image existante représentant un salon.
Certes, les images générées sont un peu floues, voire carrément incompréhensibles (essayez par exemple de générer une image en soumettant « a sad person »). Néanmoins, étant donné les progrès dans les réseaux de neurones au cours des dix dernières années, nul doute que ce type de logiciel va s’améliorer.
Dès lors, on s'imagine que les dictionnaires en ligne pourraient l’utiliser pour générer automatiquement une image illustrant chaque mot. Voire ils pourraient l'utiliser pour générer une nouvelle image à chaque téléchargement de page. Cependant, il est probable que les images de certains types de mots du dictionnaire, même avec leur définition (ex : un mot abstrait comme « empathie ») seront extrêmement difficiles à générer. Par conséquent, pour ces mots, peut-être faudra-t-il plutôt utiliser des exemples d'utilisation du mot qui utilisent un contexte « visuel » afin de disposer d'un texte qui guidera efficacement GLIDE à générer une image intéressante pour le lecteur. Bref, amis contributeurs, n'hésitez pas à continuer à alimenter le Wiktionnaire en exemples, ils serviront peut-être à générer de futures images.Les collaborations de la semaine de décembre
Ces propositions, affichées sur la page d’accueil, ont été proposées par Noé et Lyokoï. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées !
Semaine 48 (29 novembre au 5 décembre 2021)
Semaine 49 (6 au 12 décembre 2021)
– Une idée de thème de la semaine ? Je sèche !
– Seiche ? Seiche encrier , seiche hameçon, seiche petites mains, seiche pharaon , seiche élégante , seiche flamboyante ?
– C’est charmant !
Semaine 50 (13 au 19 décembre 2021)
Semaine 51 (20 au 26 décembre 2021)
Semaine 52 (27 décembre 2021 au 2 janvier 2022)
Semaines suivantes
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, brouillon du prochain numéro