1 00:00:05,888 --> 00:00:09,312 Il existe environ 7 500 langues 2 00:00:09,312 --> 00:00:10,806 parlées dans le monde aujourd'hui. 3 00:00:11,770 --> 00:00:16,258 On estime qu'environ 70 % d'entre elles 4 00:00:16,258 --> 00:00:20,232 risquent de disparaître d'ici la fin du XXIe siècle. 5 00:00:22,270 --> 00:00:24,266 La mort d'une langue 6 00:00:24,711 --> 00:00:26,622 est la rupture d'un lien 7 00:00:26,622 --> 00:00:30,590 qui a duré des centaines voire des milliers d'années, 8 00:00:30,590 --> 00:00:34,816 un lien avec la culture, avec l'histoire, 9 00:00:35,320 --> 00:00:38,150 avec les traditions et le savoir. 10 00:00:38,933 --> 00:00:42,250 Le linguiste Kenneth Hale a dit 11 00:00:42,250 --> 00:00:44,183 que la mort d'une langue 12 00:00:44,183 --> 00:00:46,794 serait comme larguer une bombe en plein Louvre. 13 00:00:49,377 --> 00:00:51,844 On se demande alors : 14 00:00:52,730 --> 00:00:54,800 pourquoi les langues meurent-elles ? 15 00:00:56,244 --> 00:01:00,155 Une réponse simple serait que 16 00:01:00,162 --> 00:01:03,051 les gouvernements autoritaires 17 00:01:03,051 --> 00:01:05,311 interdisent aux peuples de parler leur langue natale, 18 00:01:05,844 --> 00:01:09,630 punissent les enfants s'ils le font à l'école, 19 00:01:09,866 --> 00:01:14,420 ou ferment les stations de radio de langues minoritaires. 20 00:01:15,044 --> 00:01:16,977 Cela s'est déjà produit 21 00:01:16,977 --> 00:01:19,298 et se produit encore aujourd'hui dans une certaine mesure. 22 00:01:19,616 --> 00:01:23,026 Pour être honnête, 23 00:01:23,026 --> 00:01:26,666 dans la grande majorité des cas de disparition des langues, 24 00:01:27,296 --> 00:01:29,336 la réponse est beaucoup plus simple 25 00:01:29,336 --> 00:01:32,555 et beaucoup plus facile à expliquer. 26 00:01:33,696 --> 00:01:36,222 Les langues meurent 27 00:01:36,220 --> 00:01:39,176 parce qu'elles ne sont pas transmises d'une génération à une autre. 28 00:01:42,280 --> 00:01:45,913 Lorsqu'un locuteur d'une langue minoritaire a des enfants, 29 00:01:46,752 --> 00:01:50,355 une équation s'impose à lui. 30 00:01:51,360 --> 00:01:52,800 Il se demande... 31 00:01:53,660 --> 00:01:56,288 s'il doit transmettre sa langue natale à ses enfants 32 00:01:56,770 --> 00:02:01,311 ou s'il doit se limiter à leur apprendre la langue majoritaire. 33 00:02:01,311 --> 00:02:03,222 En fait, dans sa tête, 34 00:02:03,900 --> 00:02:05,844 il se représente une balance 35 00:02:06,720 --> 00:02:08,355 qui, d'un côté, 36 00:02:09,280 --> 00:02:13,921 chaque fois que l'opportunité d'utiliser sa langue natale se présente 37 00:02:14,825 --> 00:02:18,588 pour communiquer ou pour aborder un aspect de la culture traditionnelle 38 00:02:19,776 --> 00:02:21,748 une pierre est placée du côté gauche, 39 00:02:22,228 --> 00:02:25,613 et dès qu'il se retrouve incapable de parler sa langue natale 40 00:02:25,770 --> 00:02:27,955 et obligé de parler la langue majoritaire, 41 00:02:27,958 --> 00:02:30,066 une pierre est placée du côté droit. 42 00:02:31,822 --> 00:02:34,800 Étant donné le sentiment de force et de dignité 43 00:02:34,800 --> 00:02:36,660 que confère le fait de parler sa langue natale, 44 00:02:36,660 --> 00:02:38,985 les pierres du côté gauche ont tendance à peser plus lourd. 45 00:02:38,985 --> 00:02:42,048 Mais s'il y a assez de pierres à droite, 46 00:02:42,560 --> 00:02:44,600 la balance penchera forcément de ce côté-là, 47 00:02:44,600 --> 00:02:48,659 et lorsqu'une personne décide de transmettre sa langue, 48 00:02:49,160 --> 00:02:50,622 elle considère sa propre langue 49 00:02:50,622 --> 00:02:53,220 comme un fardeau plutôt qu'une bénédiction. 50 00:02:55,200 --> 00:02:58,676 Comment donc inverser cela ? 51 00:02:59,450 --> 00:03:01,777 Il faut d'abord s'interroger... 52 00:03:03,181 --> 00:03:06,510 sur les sphères sociales dans lesquelles une langue donnée 53 00:03:06,510 --> 00:03:07,900 peut être parlée. 54 00:03:07,900 --> 00:03:10,538 Toutes les langues natales parlées de nos jours 55 00:03:10,800 --> 00:03:12,990 peuvent être parlées au sein des familles. 56 00:03:13,670 --> 00:03:16,671 Un ensemble limité de langues peuvent être parlées au sein des communautés, 57 00:03:16,671 --> 00:03:18,660 un autre encore plus limité au niveau régional, 58 00:03:19,288 --> 00:03:22,155 et seulement une poignée de langues 59 00:03:22,331 --> 00:03:24,878 sont utilisées dans le cadre de communications internationales. 60 00:03:25,824 --> 00:03:28,640 Même au sein de ces sphères, 61 00:03:28,640 --> 00:03:31,712 on se demande si l'on peut utiliser telle ou telle langue 62 00:03:31,712 --> 00:03:35,533 à des fins éducatives, commerciales 63 00:03:35,911 --> 00:03:37,600 ou dans le domaine de la technologie. 64 00:03:39,136 --> 00:03:41,952 Pour mieux illustrer 65 00:03:43,200 --> 00:03:44,530 ce que je veux dire, 66 00:03:44,530 --> 00:03:46,393 j'aimerais me servir d'une anecdote. 67 00:03:48,400 --> 00:03:50,400 Disons que vous partez bientôt 68 00:03:50,400 --> 00:03:52,280 pour des vacances de rêve en Inde 69 00:03:53,155 --> 00:03:56,032 et que vous avez huit heures d'escale à Istanbul. 70 00:03:57,312 --> 00:04:00,896 Vous n'aviez pas vraiment prévu de visiter la Turquie 71 00:04:00,896 --> 00:04:04,066 mais vous avez un ami turque 72 00:04:04,066 --> 00:04:05,933 qui vous propose de découvrir un bon restaurant 73 00:04:05,933 --> 00:04:07,400 pas très loin de l'aéroport, 74 00:04:07,800 --> 00:04:10,600 vous vous dites : « J'y ferai un tour durant mon escale. » 75 00:04:11,022 --> 00:04:12,920 Vous quittez l'aéroport, 76 00:04:13,950 --> 00:04:15,480 vous allez à votre restaurant, 77 00:04:15,480 --> 00:04:17,020 et on vous donne le menu 78 00:04:17,020 --> 00:04:19,086 qui se trouve être entièrement en turc. 79 00:04:20,170 --> 00:04:22,911 Disons qu'à titre d'exemple, 80 00:04:22,911 --> 00:04:24,377 vous ne parlez pas turc. 81 00:04:25,210 --> 00:04:26,535 Que faites-vous ? 82 00:04:28,155 --> 00:04:29,744 Si vous avez de la chance, 83 00:04:29,744 --> 00:04:32,367 vous trouverez peut-être quelqu'un qui parle votre langue natale, 84 00:04:32,383 --> 00:04:34,264 l'allemand, l'anglais, etc. 85 00:04:35,870 --> 00:04:37,997 Mais supposons que ce ne soit pas votre jour de chance 86 00:04:38,000 --> 00:04:41,066 et que personne dans le restaurant ne parle allemand ou anglais. 87 00:04:42,000 --> 00:04:43,377 Que faites-vous ? 88 00:04:43,377 --> 00:04:45,995 Je suppose que, comme moi, la plupart d'entre vous 89 00:04:45,995 --> 00:04:48,130 recourrez à la technologie, 90 00:04:49,535 --> 00:04:52,351 à une traduction automatique ou un dictionnaire numérique, 91 00:04:52,437 --> 00:04:54,196 que vous rechercherez chaque mot séparément 92 00:04:54,399 --> 00:04:57,733 et finirez par commander un délicieux plat turque. 93 00:04:59,970 --> 00:05:02,844 Imaginons plutôt que 94 00:05:03,610 --> 00:05:06,400 vous parlez une langue minoritaire. 95 00:05:07,455 --> 00:05:09,173 Le bas sorabe par exemple. 96 00:05:09,173 --> 00:05:11,140 Le bas sorabe est une langue menacée d'extinction, 97 00:05:11,140 --> 00:05:12,488 parlée ici en Allemagne, 98 00:05:12,488 --> 00:05:16,888 à environ 130 kilomètres au sud-est, 99 00:05:17,711 --> 00:05:20,857 par quelques milliers de personnes, âgées pour la plupart. 100 00:05:22,810 --> 00:05:25,111 Disons que le bas sorabe est votre langue natale. 101 00:05:25,370 --> 00:05:26,773 Vous êtes dans le restaurant. 102 00:05:26,773 --> 00:05:28,462 Les chances d'y trouver quelqu'un 103 00:05:28,462 --> 00:05:31,387 qui parle votre langue natale sont bien sûr exceptionnellement faibles. 104 00:05:32,280 --> 00:05:36,412 Là aussi, vous pouvez avoir recours à la technologie. 105 00:05:36,890 --> 00:05:39,333 Toutefois, il n'existe pas de solution technologique 106 00:05:39,333 --> 00:05:41,718 adaptée à votre langue natale. 107 00:05:42,010 --> 00:05:44,991 Vous devrez vous en remettre à l'allemand ou à l'anglais 108 00:05:44,991 --> 00:05:47,488 comme langue pivot pour comprendre le turc. 109 00:05:48,920 --> 00:05:52,382 Vous réussissez bien entendu à commander un délicieux plat turc 110 00:05:52,382 --> 00:05:54,860 mais vous vous demandez à quel point cela aurait été difficile 111 00:05:54,860 --> 00:05:57,270 pour votre grand-père par exemple qui ne parle pas allemand. 112 00:05:58,174 --> 00:05:59,840 Bien que ce ne soit qu'un petit incident, 113 00:05:59,844 --> 00:06:04,787 la balance pencherait tout de même un peu plus du côté droit 114 00:06:05,310 --> 00:06:07,053 et vous vous direz peut-être, 115 00:06:07,053 --> 00:06:09,898 le jour où vous auriez des enfants ou d'autres enfants, 116 00:06:10,943 --> 00:06:14,726 que la situation pénible que vous avez vécue 117 00:06:14,726 --> 00:06:17,233 fait que continuer à utiliser votre langue natale soit inutile. 118 00:06:19,391 --> 00:06:21,284 Imaginez encore si ce scénario 119 00:06:21,284 --> 00:06:26,177 était d'une importance plus critique, 120 00:06:26,177 --> 00:06:28,380 dans un cadre hospitalier par exemple. 121 00:06:31,133 --> 00:06:36,161 C'est sur ce point que nous pouvons intervenir, 122 00:06:36,790 --> 00:06:40,242 par « nous », je veux dire vous et moi, ici présents. 123 00:06:41,400 --> 00:06:43,355 Nous avons les moyens d'intervenir. 124 00:06:44,905 --> 00:06:47,019 Si des outils technologiques sont accessibles 125 00:06:47,019 --> 00:06:49,350 aux locuteurs de langues minoritaires ou défavorisées, 126 00:06:50,555 --> 00:06:54,022 la balance pencherait légèrement du côté gauche. 127 00:06:54,022 --> 00:06:55,776 Personne ne se dit forcément 128 00:06:55,776 --> 00:06:57,680 qu'il doit parler une langue minoritaire 129 00:06:57,680 --> 00:06:59,488 pour pouvoir interagir avec le monde, 130 00:07:00,351 --> 00:07:06,004 les sphères sociales en seraient plus ouvertes. 131 00:07:07,910 --> 00:07:10,233 La solution idéale serait bien sûr 132 00:07:10,233 --> 00:07:13,202 d'avoir accès à la traduction automatique dans toutes les langues du monde. 133 00:07:13,202 --> 00:07:16,831 Malheureusement, ce n'est tout bonnement pas possible. 134 00:07:16,831 --> 00:07:19,800 La traduction automatique nécessite un vaste corpus de textes 135 00:07:19,800 --> 00:07:21,088 et pour beaucoup de ces langues 136 00:07:21,088 --> 00:07:23,080 qui sont en voie de disparition ou défavorisées, 137 00:07:23,391 --> 00:07:25,439 ces données ne sont pas disponibles. 138 00:07:26,309 --> 00:07:28,279 Certaines de ces langues ne sont même pas écrites 139 00:07:29,000 --> 00:07:30,960 ce qui rend la collecte de données 140 00:07:30,960 --> 00:07:33,195 pour alimenter un moteur de traduction automatique 141 00:07:33,195 --> 00:07:34,390 peu probable. 142 00:07:34,390 --> 00:07:38,060 Ce qui est accessible par contre, sont les données lexicales. 143 00:07:40,244 --> 00:07:43,444 Grâce aux travaux de plusieurs linguistes 144 00:07:43,444 --> 00:07:45,440 au cours des derniers siècles, 145 00:07:47,777 --> 00:07:49,728 des dictionnaires et des grammaires ont été créés 146 00:07:49,728 --> 00:07:51,680 pour la plupart des langues du monde. 147 00:07:53,920 --> 00:07:56,511 Malheureusement, la plupart de ces travaux 148 00:07:56,511 --> 00:08:00,644 ne sont pas accessibles au monde, 149 00:08:00,647 --> 00:08:03,533 encore moins aux populations parlant ces langues minoritaires. 150 00:08:04,522 --> 00:08:06,377 Ce n'est pas un processus délibéré, 151 00:08:06,377 --> 00:08:10,785 il s'agit souvent d'une première édition limitée de ces dictionnaires 152 00:08:11,155 --> 00:08:13,517 et les seules copies qui existent 153 00:08:13,517 --> 00:08:16,244 moisissent quelque part dans une librairie universitaire. 154 00:08:17,511 --> 00:08:21,333 Mais nous pouvons nous emparer de ces données 155 00:08:21,333 --> 00:08:23,330 et les rendre accessibles à tous. 156 00:08:24,133 --> 00:08:28,377 La fondation Wikimedia compte parmi les meilleures, 157 00:08:28,377 --> 00:08:30,555 si ce n'est *la* meilleure au monde, 158 00:08:30,975 --> 00:08:33,396 organisations à rendre accessibles des données 159 00:08:33,396 --> 00:08:36,688 à la majorité des populations du monde. 160 00:08:38,533 --> 00:08:40,134 Penchons-nous sur cette question. 161 00:08:41,000 --> 00:08:44,998 Pour expliquer un peu notre travail à ce sujet, 162 00:08:45,311 --> 00:08:48,127 j'aimerais vous présenter mon organisation PanLex, 163 00:08:48,711 --> 00:08:51,638 le but de cette organisation 164 00:08:51,638 --> 00:08:54,352 est de collecter des données lexicales pour les rendre accessibles. 165 00:08:54,780 --> 00:08:56,830 Tout a commencé il y a 12 ans 166 00:08:56,830 --> 00:08:59,600 à l'université de Washington, dans le cadre d'un projet de recherche. 167 00:08:59,600 --> 00:09:02,129 L'idée était de démontrer qu'on pouvait créer 168 00:09:02,129 --> 00:09:04,377 un outil de traduction efficace 169 00:09:04,377 --> 00:09:07,125 à partir de traductions « induites », 170 00:09:07,125 --> 00:09:09,088 un outil de traduction lexical pour ainsi dire. 171 00:09:09,088 --> 00:09:12,223 Voici un exemple tiré des données de PanLex. 172 00:09:12,410 --> 00:09:14,057 C'est pour vous montrer comment traduire 173 00:09:14,066 --> 00:09:17,805 le mot « ev » qui veut dire « maison » en turc, 174 00:09:17,805 --> 00:09:19,555 en bas sorabe, 175 00:09:19,555 --> 00:09:21,392 la langue dont je vous parlais tout à l'heure. 176 00:09:21,392 --> 00:09:23,320 C'est très peu probable de trouver 177 00:09:24,333 --> 00:09:26,200 des dictionnaires turc - bas sorabe, 178 00:09:26,200 --> 00:09:28,244 mais en croisant le terme 179 00:09:28,244 --> 00:09:30,240 avec plusieurs langues intermédiaires différentes, 180 00:09:30,488 --> 00:09:32,600 on peut créer des traductions efficaces. 181 00:09:34,333 --> 00:09:36,911 Quand on a présenté ça pour les projets de recherche, 182 00:09:36,911 --> 00:09:39,631 le fondateur de PanLex, Dr. Jonathan Pool, 183 00:09:40,711 --> 00:09:43,666 s'est dit : « Pourquoi ne ferait-on pas ça ? » 184 00:09:43,666 --> 00:09:45,800 Il a donc lancé une organisation à but non lucratif 185 00:09:45,800 --> 00:09:48,842 pour collecter le plus données lexicales possibles et les rendre accessibles. 186 00:09:48,911 --> 00:09:51,126 Ça a été notre travail pendant les 12 dernières années. 187 00:09:51,126 --> 00:09:54,516 Durant ce temps, nous avons collecté des milliers de dictionnaires, 188 00:09:54,516 --> 00:09:58,329 en avons extrait des données lexicales, et compilé une base de données 189 00:09:58,329 --> 00:10:01,340 qui dispense des traductions lexicales inférées 190 00:10:01,340 --> 00:10:03,505 entre... 191 00:10:03,755 --> 00:10:05,866 on compte présentement 5 500 langues 192 00:10:05,860 --> 00:10:07,955 sur les 7 500 langues parlées dans le monde. 193 00:10:08,511 --> 00:10:10,685 Évidemment, 194 00:10:10,685 --> 00:10:13,111 nous tendons continuellement à élargir cette base de données 195 00:10:13,111 --> 00:10:15,124 et à enrichir les données de chaque langue. 196 00:10:17,220 --> 00:10:21,111 La question qui se pose ensuite 197 00:10:22,079 --> 00:10:25,663 est comment pouvons-nous collaborer là-dessus ? 198 00:10:26,330 --> 00:10:28,931 Chez PanLex, nous observons le développement des données lexicales 199 00:10:28,931 --> 00:10:31,260 sur lequel travaille Wikidata 200 00:10:31,260 --> 00:10:34,175 avec beaucoup d'enthousiasme. 201 00:10:35,155 --> 00:10:37,548 C'est très fascinant de voir des organisations 202 00:10:37,550 --> 00:10:39,476 travailler sur des aspects différents 203 00:10:39,476 --> 00:10:41,183 d'une sphère similaire. 204 00:10:41,535 --> 00:10:44,351 Nous attendons avec impatience 205 00:10:44,733 --> 00:10:46,466 d'en voir les résultats. 206 00:10:46,466 --> 00:10:51,144 Nous sommes également impatients de collaborer avec Wikidata. 207 00:10:53,844 --> 00:10:56,021 Je pense que les compétences spécifiques 208 00:10:56,021 --> 00:10:58,352 que nous avons développées depuis les 12 dernières années, 209 00:10:58,352 --> 00:11:00,345 non seulement en collectant des données lexicales 210 00:11:00,345 --> 00:11:02,307 mais dans la conception de notre base de données, 211 00:11:02,307 --> 00:11:03,908 peuvent être très utiles pour Wikidata. 212 00:11:03,910 --> 00:11:07,111 D'autre part, je pense que... 213 00:11:08,415 --> 00:11:10,975 Les compétences de Wikidata 214 00:11:11,743 --> 00:11:14,549 dans le *crowdsourcing* des données sont très prometteuses. 215 00:11:15,129 --> 00:11:18,047 Les sources actuelles de PanLex 216 00:11:18,399 --> 00:11:20,959 sont des sources lexicales imprimées ou autres, 217 00:11:20,990 --> 00:11:22,662 mais nous ne faisons pas de *crowdsourcing*. 218 00:11:22,670 --> 00:11:24,920 Notre infrastructure ne nous le permet pas 219 00:11:24,920 --> 00:11:26,931 et la fondation Wikimedia 220 00:11:26,933 --> 00:11:28,930 est l'expert mondial du *crowdsourcing*. 221 00:11:30,469 --> 00:11:33,728 Je suis impatient de collaborer 222 00:11:33,733 --> 00:11:35,680 pour mettre en pratique ces compétences. 223 00:11:38,533 --> 00:11:41,209 Mais le plus important je pense, 224 00:11:41,209 --> 00:11:43,457 est le fait que dans notre travail, 225 00:11:43,461 --> 00:11:45,133 le moindre détail compte. 226 00:11:45,133 --> 00:11:47,773 Nous avons passé des heures à examiner des formes grammaticales, 227 00:11:47,773 --> 00:11:51,911 à feuilleter des dictionnaires mordernes ou ancients, 228 00:11:51,915 --> 00:11:53,977 parfois même des dictionnaires récemment publiés, 229 00:11:53,977 --> 00:11:57,401 et à s'attaquer à la forme écrite des mots. 230 00:11:57,466 --> 00:11:59,874 Ça a l'air très méticuleux. 231 00:11:59,874 --> 00:12:02,676 Or, parfois, nous devons nous rappeler que nous devons prendre du recul 232 00:12:02,676 --> 00:12:04,951 dans le sens où même si cela... 233 00:12:06,231 --> 00:12:08,831 peut parfois paraître banal, 234 00:12:10,091 --> 00:12:11,957 notre travail est extrêmement important. 235 00:12:13,010 --> 00:12:15,666 Je pense que c'est l'ultime moyen 236 00:12:15,666 --> 00:12:18,862 de soutenir les langues menacées 237 00:12:18,862 --> 00:12:21,488 et de nous assurer que la diversité linguistique de la planète 238 00:12:21,488 --> 00:12:25,730 survive jusqu'à la fin de ce siècle voire longtemps plus tard. 239 00:12:26,444 --> 00:12:29,644 Il est tout à fait possible que notre travail aujourd'hui 240 00:12:29,644 --> 00:12:35,092 contribue à la préservation, à la transmission, et à la survie 241 00:12:35,092 --> 00:12:36,955 des langues menacées. 242 00:12:38,527 --> 00:12:40,605 Gardez donc à l'esprit 243 00:12:40,605 --> 00:12:43,207 que si vous utilisez sur votre ordinateur 244 00:12:43,207 --> 00:12:44,480 pour saisir une donnée 245 00:12:44,480 --> 00:12:49,707 et que vous ajoutez les formes de données d'une langue minoritaire 246 00:12:49,707 --> 00:12:51,796 correspondant à chaque non, 247 00:12:51,800 --> 00:12:54,577 le travail insignifiant que vous faites en ce moment 248 00:12:54,577 --> 00:12:59,043 peut contribuer à faire en sorte que cette langue survive 249 00:12:59,155 --> 00:13:01,060 jusqu'à la fin du siècle voire plus longtemps. 250 00:13:02,591 --> 00:13:03,703 Merci beaucoup, 251 00:13:03,703 --> 00:13:05,717 je vais maintenant prendre des questions. 252 00:13:06,222 --> 00:13:08,373 (applaudissements) 253 00:13:23,688 --> 00:13:24,977 (intervenant·e 1) Merci. 254 00:13:24,977 --> 00:13:26,901 - Merci pour votre intervention. - Merci à vous. 255 00:13:26,901 --> 00:13:28,757 J'ai une question concernant les dictionnaires. 256 00:13:28,757 --> 00:13:31,177 Vous travaillez avec des dictionnaires papier, n'est-ce pas ? 257 00:13:31,177 --> 00:13:32,312 - Oui. - J'aimerais savoir 258 00:13:32,312 --> 00:13:34,508 ce que vous en prélevez 259 00:13:34,511 --> 00:13:38,222 et s'il y a des soucis de droits d'auteur à prendre en compte. 260 00:13:38,222 --> 00:13:41,060 J'étais sûr que ce serait la première question qu'on me poserait. 261 00:13:41,060 --> 00:13:42,827 (rires) 262 00:13:42,827 --> 00:13:46,358 Alors, chez PanLex, 263 00:13:46,358 --> 00:13:50,244 selon les références légales que nous avons consultées, 264 00:13:52,734 --> 00:13:55,860 bien que l'agencement et la structure d'un dictionnaire 265 00:13:55,860 --> 00:13:57,466 soient soumis à des droits d'auteur, 266 00:13:57,466 --> 00:14:03,260 la traduction en tant que telle ne l'est pas. 267 00:14:04,170 --> 00:14:06,518 Un annuaire par exemple 268 00:14:06,518 --> 00:14:08,898 est soumis à des droits d'auteur, 269 00:14:08,898 --> 00:14:11,613 du moins selon la loi américaine. 270 00:14:11,965 --> 00:14:15,720 Mais dire que le numéro de téléphone d'un Untel 271 00:14:15,720 --> 00:14:18,360 est tel numéro ne l'est pas. 272 00:14:21,666 --> 00:14:23,444 Comme je l'ai dit, 273 00:14:23,444 --> 00:14:25,311 selon nos experts juridiques, 274 00:14:25,311 --> 00:14:27,333 on peut aborder les choses sous cet angle-là. 275 00:14:27,333 --> 00:14:30,666 Même si cet argument légal n'est pas assez solide, 276 00:14:30,666 --> 00:14:32,213 il est important de garder à l'esprit 277 00:14:32,213 --> 00:14:38,269 que la grande majorité de ces données lexicales 278 00:14:39,355 --> 00:14:40,530 sont libres de droits. 279 00:14:40,530 --> 00:14:42,822 Un nombre important de ces données sont libres de droits 280 00:14:42,822 --> 00:14:44,333 et peuvent être librement utilisées. 281 00:14:44,333 --> 00:14:46,892 En plus, la plupart du temps, 282 00:14:47,311 --> 00:14:49,564 lorsqu'on travaille avec un dictionnaire papier récent, 283 00:14:49,564 --> 00:14:51,577 plutôt que de le scanner ou de le passer à la ROC, 284 00:14:51,577 --> 00:14:53,589 nous envoyons un email à la personne qui l'a conçu. 285 00:14:53,589 --> 00:14:57,510 Il se trouve que la plupart des linguistes sont très contents 286 00:14:57,510 --> 00:14:59,600 que leurs données puissent êtres rendues accessibles. 287 00:14:59,600 --> 00:15:02,207 « Bien sûr, allez-y, prenez tout et rendez-le accessible. » 288 00:15:02,207 --> 00:15:03,613 vous diront-ils. 289 00:15:05,533 --> 00:15:07,964 Et donc selon nos experts juridiques, 290 00:15:07,964 --> 00:15:09,466 nous avons au moins cette possibilité, 291 00:15:09,466 --> 00:15:11,547 et même si vous n'êtes pas d'accord avec ça non plus, 292 00:15:11,547 --> 00:15:15,644 Les données sont facilement accessibles au public. 293 00:15:26,288 --> 00:15:28,470 - (intervenant·e 2) Merci. Bonjour. - Bonjour. 294 00:15:28,470 --> 00:15:29,830 Pouvez-vous élaborer 295 00:15:29,830 --> 00:15:33,127 sur la manière dont une personne qui parle le bas sorabe 296 00:15:33,127 --> 00:15:35,031 puisse accéder aux données ? 297 00:15:35,031 --> 00:15:38,355 Plus précisément sur la manière dont ces informations leur parviennent 298 00:15:38,357 --> 00:15:40,977 et peuvent même les convaincre 299 00:15:40,977 --> 00:15:42,800 soit pour essayer... 300 00:15:42,800 --> 00:15:44,680 Très bonne question, 301 00:15:44,680 --> 00:15:46,266 j'y réfléchis beaucoup également 302 00:15:46,266 --> 00:15:49,759 parce que je pense que lorsqu'il s'agit d'accès aux données, 303 00:15:50,270 --> 00:15:53,244 cela se fait sur plusieurs étapes. 304 00:15:53,244 --> 00:15:56,288 La conservation des données en est une, il faut s'assurer de les préserver. 305 00:15:56,288 --> 00:15:58,911 Deuxièmement, il faut qu'elles soient interopérables 306 00:15:59,177 --> 00:16:01,844 et donc utilisables. 307 00:16:01,844 --> 00:16:05,370 Troisièmement, il faut qu'elles soient accessibles. 308 00:16:05,631 --> 00:16:07,333 Dans le cas de PanLex, 309 00:16:07,333 --> 00:16:09,755 nous pouvons utiliser une API 310 00:16:09,755 --> 00:16:11,888 mais l'utilisateur final n'y a évidement pas accès. 311 00:16:11,888 --> 00:16:14,847 Nous avons également développé des interfaces. 312 00:16:15,155 --> 00:16:19,727 Par exemple, si vous allez sur « translate.panlex.org », 313 00:16:19,728 --> 00:16:22,711 vous pouvez effectuer des traductions sur notre base de données. 314 00:16:22,711 --> 00:16:25,864 Si vous voulez vous amuser un peu avec l'API, allez sur « dev.panlex.org » 315 00:16:25,866 --> 00:16:29,222 ou sur « api.palnex.org » et vous y trouverez plein de choses. 316 00:16:30,950 --> 00:16:32,542 Une autre étape à prendre en compte 317 00:16:32,542 --> 00:16:36,577 est que même si vous rendez toutes vos données accessibles 318 00:16:36,570 --> 00:16:40,533 avec des outils très pratiques permettant leur accessibilité, 319 00:16:41,210 --> 00:16:43,244 si vous ne promouvez pas ces outils, 320 00:16:43,244 --> 00:16:45,058 personne ne pourra utiliser ces données. 321 00:16:45,058 --> 00:16:47,177 Pour être honnête, 322 00:16:48,827 --> 00:16:51,044 cet aspect n'est pas suffisamment abordé 323 00:16:51,044 --> 00:16:53,055 et je ne peux pas vous donner la réponse adéquate. 324 00:16:53,055 --> 00:16:54,800 Comment peut-on être sûr... 325 00:16:55,022 --> 00:16:56,933 Disons par exemple que je n'ai connu Wikidata 326 00:16:56,933 --> 00:16:59,647 que très récemment, quelques années auparavant, 327 00:16:59,647 --> 00:17:02,463 et c'est le genre de choses qui m'intéressent. 328 00:17:02,970 --> 00:17:07,177 Comment peut-on se mettre en valeur ? 329 00:17:07,177 --> 00:17:08,680 Laissons cette question ouverte. 330 00:17:08,680 --> 00:17:11,286 Encore une fois, je n'ai pas de réponse adéquate à cette question. 331 00:17:11,286 --> 00:17:12,888 Bien sûr, pour y arriver, 332 00:17:12,888 --> 00:17:14,880 on doit d'abord passer par les premières étapes. 333 00:17:22,133 --> 00:17:24,777 (intervenant·e 3) Si nous voulons bénéficier de la traduction automatique, 334 00:17:24,777 --> 00:17:27,822 n'avons-nous pas besoin d'une mémoire de traduction ? 335 00:17:27,827 --> 00:17:30,666 Je ne pense pas qu'entrer des termes isolés 336 00:17:30,666 --> 00:17:32,918 dans Wikidata, 337 00:17:32,918 --> 00:17:36,558 ces courtes propositions qu'on entre dans Wikidata, 338 00:17:36,558 --> 00:17:41,130 qu'il s'agisse d'éléments ordinaires ou de lexèmes Wikidata, 339 00:17:41,130 --> 00:17:43,953 suffise pour effectuer une traduction adéquate. 340 00:17:43,955 --> 00:17:46,600 Nous avons besoin de phrases complètes... 341 00:17:46,772 --> 00:17:48,320 (Benjamin) Absolument. 342 00:17:48,577 --> 00:17:51,422 Où trouvons-nous ces structures de données ? 343 00:17:51,422 --> 00:17:55,177 Je ne suis pas certain 344 00:17:55,177 --> 00:17:59,533 que Wikidata puisse résoudre 345 00:17:59,533 --> 00:18:03,066 la question de la mémoire de traduction pour le moment. 346 00:18:04,324 --> 00:18:05,965 « translatewiki.net » 347 00:18:05,965 --> 00:18:09,490 pour aborder cette lacune... 348 00:18:12,111 --> 00:18:14,993 Doit-on agir dans ce sens ou... ? 349 00:18:15,000 --> 00:18:17,133 Oui, merci pour votre question. 350 00:18:17,135 --> 00:18:18,715 J'en ai parlé un peu tout à l'heure, 351 00:18:18,715 --> 00:18:20,361 mais je le répète avec plaisir. 352 00:18:21,356 --> 00:18:23,008 C'est la raison précise pour laquelle 353 00:18:23,008 --> 00:18:24,785 PanLex travaille avec les données lexicales 354 00:18:24,785 --> 00:18:27,230 et pour laquelle je me réjouis au sujet des données lexicales 355 00:18:27,230 --> 00:18:29,545 contrairement à... 356 00:18:29,545 --> 00:18:32,396 Plutôt en plus des moteurs de traduction automatique 357 00:18:32,396 --> 00:18:35,087 et de la traduction automatique en général. 358 00:18:35,900 --> 00:18:39,200 Vous l'avez dit, la traduction automatique nécessite des données spécifiques, 359 00:18:39,740 --> 00:18:43,123 et ces données ne sont pas disponibles pour la majorité des langues du monde. 360 00:18:43,123 --> 00:18:44,776 Pour cette grande majorité, 361 00:18:44,776 --> 00:18:46,589 elles ne sont tout bonnement pas disponibles. 362 00:18:46,589 --> 00:18:48,807 Ça ne veut pas dire que nous devons baisser les bras. 363 00:18:48,807 --> 00:18:49,827 Pourquoi ? 364 00:18:51,260 --> 00:18:54,444 Si j'ai besoin de traduire mon menu de restaurant turc, 365 00:18:54,755 --> 00:18:59,360 la traduction lexicale serait un très bon outil. 366 00:18:59,360 --> 00:19:01,715 Je ne dis pas qu'on peut utiliser la traduction lexicale 367 00:19:01,715 --> 00:19:04,600 pour traduire des paragraphes à la perfection. 368 00:19:04,600 --> 00:19:06,866 Par traduction lexicale, je veux dire du mot à mot, 369 00:19:06,866 --> 00:19:09,670 et cette traduction lexicale peut s'avérer très utile. 370 00:19:12,231 --> 00:19:14,708 En fait, c'est amusant, mais nous n'avons pas eu accès 371 00:19:14,708 --> 00:19:16,620 à une bonne traduction automatique. 372 00:19:16,620 --> 00:19:20,191 On n'y a eu accès que très récemment. 373 00:19:20,191 --> 00:19:23,649 On se débrouillait bien avec les dictionnaires, 374 00:19:23,649 --> 00:19:27,687 et leur utilité est indéniable. 375 00:19:28,311 --> 00:19:29,584 Les données sont disponibles 376 00:19:29,584 --> 00:19:31,338 alors pourquoi ne pas les rendre disponibles 377 00:19:31,338 --> 00:19:34,377 au monde et à ceux qui parlent ces langues ? 378 00:19:36,422 --> 00:19:38,666 (intervenant·e 4) Bonjour, quels sont les mécanismes en place 379 00:19:38,666 --> 00:19:40,666 lorsque la communauté... Je suis ici ! 380 00:19:40,666 --> 00:19:43,133 - Où ça ? D'accord. - Oui, pardon. (rit) 381 00:19:43,133 --> 00:19:44,577 ...lorsque la communauté en question 382 00:19:44,577 --> 00:19:47,320 ne veut pas que PanLex obtienne une partie de ces données ? 383 00:19:47,320 --> 00:19:48,933 Bonne question. 384 00:19:48,933 --> 00:19:51,955 Nous procédons comme suit : 385 00:19:51,955 --> 00:19:56,287 si un dictionnaire est publié et est mis à la disposition du public, 386 00:19:56,666 --> 00:19:58,133 c'est un indicateur valide. 387 00:19:58,133 --> 00:20:02,400 Vous pouvez l'acheter dans un magasin ou dans une bibliothèque universitaire, 388 00:20:02,400 --> 00:20:04,690 ou une bibliothèque publique à la disposition de tous. 389 00:20:04,690 --> 00:20:08,080 Cela indique bien que la décision a déjà été prise. 390 00:20:08,080 --> 00:20:11,577 [inaudible] 391 00:20:15,740 --> 00:20:18,266 (intervenant·e 5) Pouvez-vous parler dans le micro ? 392 00:20:19,295 --> 00:20:20,337 Pouvez-vous répéter ça ? 393 00:20:20,337 --> 00:20:23,307 (intervenant·e 5) Les linguistes n'ont pas toujours la permission de la communauté 394 00:20:23,307 --> 00:20:24,517 pour publier certaines choses, 395 00:20:24,517 --> 00:20:27,533 ils le font souvent sans le consentement de la communauté. 396 00:20:27,533 --> 00:20:29,577 C'est vrai. 397 00:20:29,577 --> 00:20:32,533 Je dirais que... 398 00:20:32,533 --> 00:20:34,422 ça arrive. 399 00:20:34,422 --> 00:20:36,770 Je dirais qu'en général, les cas sont rares 400 00:20:36,770 --> 00:20:40,955 et plutôt limités à l'Amérique du Nord, 401 00:20:40,955 --> 00:20:43,355 parfois même à certaines langues sud-américaines. 402 00:20:44,765 --> 00:20:46,488 Il faut prendre ça en considération. 403 00:20:46,488 --> 00:20:49,288 Si l'on portait à notre connaissance 404 00:20:49,288 --> 00:20:52,377 que les données sur PanLex 405 00:20:52,377 --> 00:20:56,330 ne devraient pas être accessibles au reste du monde, 406 00:20:56,330 --> 00:20:58,040 nous les supprimerions. 407 00:20:58,040 --> 00:20:59,310 (intervenant·e 5) Très bien. 408 00:21:00,901 --> 00:21:02,261 Ça ne veut pas dire, bien entendu, 409 00:21:02,261 --> 00:21:04,681 que nous prendrons en compte les lois sur les droits d'auteur 410 00:21:04,681 --> 00:21:07,062 mais nous prendre en compte les communautés traditionnelles, 411 00:21:07,062 --> 00:21:08,468 là réside la principale différence. 412 00:21:08,468 --> 00:21:10,532 (intervenant·e 5) Oui, c'est ce que je voulais dire. 413 00:21:15,022 --> 00:21:16,755 Cela soulève un point très intéressant 414 00:21:16,755 --> 00:21:18,350 en ce qui concerne 415 00:21:18,844 --> 00:21:22,244 les représentants d'une langue. 416 00:21:23,000 --> 00:21:27,911 J'ai visité le Sud-Ouest des États-Unis 417 00:21:27,911 --> 00:21:29,755 pour collaborer avec des équipes 418 00:21:29,777 --> 00:21:32,288 qui travaillent sur les langues des indigènes Pueblos. 419 00:21:36,053 --> 00:21:38,044 Ces indigènes parlent environ 420 00:21:38,044 --> 00:21:40,220 six langues pueblos selon la région 421 00:21:40,220 --> 00:21:41,955 qu'ils habitent. 422 00:21:41,955 --> 00:21:44,022 Elles sont réparties sur 18 pueblos différents 423 00:21:44,320 --> 00:21:47,066 qui ont chacun leur propre gouvernement tribal, 424 00:21:47,066 --> 00:21:50,022 et ces gouvernements ont des opinions divergentes 425 00:21:50,022 --> 00:21:54,007 sur l'éventuelle accessibilité de leur langue aux étrangers. 426 00:21:56,626 --> 00:21:58,170 Le zuni, par exemple, 427 00:21:58,170 --> 00:22:01,472 n'est parlé qu'au sein d'un seul pueblo. 428 00:22:02,593 --> 00:22:05,194 Ils veulent vraiment que leur langue soit accessible partout, 429 00:22:05,194 --> 00:22:07,934 ils l'écrivent sur les panneaux de signalisation et tout, c'est bien. 430 00:22:07,934 --> 00:22:10,637 Mais pour certaines des autres langues, 431 00:22:10,644 --> 00:22:13,051 les communautés qui les parlent pourront vous dire : 432 00:22:13,051 --> 00:22:15,866 « On ne veut pas que notre langue soit accessible aux étrangers. » 433 00:22:15,871 --> 00:22:19,383 Leurs voisins pueblos qui parlent la même langue, qui vous diront : 434 00:22:19,383 --> 00:22:21,716 « Nous voulons rendre notre langue accessible aux étrangers 435 00:22:21,716 --> 00:22:24,088 grâce à ces outils technologiques 436 00:22:24,088 --> 00:22:26,560 parce que nous voulons que notre langue survive. » 437 00:22:26,560 --> 00:22:29,488 Cela soulève une question éthique très intéressante. 438 00:22:29,488 --> 00:22:31,651 Parce que si vous baissez les bras en vous disant : 439 00:22:31,651 --> 00:22:34,622 « C'est bon, j'arrête parce que cette communauté veut que j'arrête, » 440 00:22:34,622 --> 00:22:36,711 ne serait-ce pas injuste envers le deuxième groupe 441 00:22:36,711 --> 00:22:39,360 qui est convaincu de la nécessité d'écarter ces choses-là. 442 00:22:39,360 --> 00:22:42,755 Je ne pense pas que la réponse à cette question soit facile à trouver. 443 00:22:42,755 --> 00:22:44,955 Mais du moins en ce qui concerne PanLex... 444 00:22:44,955 --> 00:22:48,938 D'ailleurs, nous n'avons jamais été confronté à cette situation, 445 00:22:48,938 --> 00:22:50,407 pour autant que je sache. 446 00:22:50,933 --> 00:22:52,920 Ça pourrait être en partie parce que... 447 00:22:53,666 --> 00:22:55,444 Pour revenir à sa question, 448 00:22:55,666 --> 00:22:57,790 nous avons besoin de plus de promotion. (rit) 449 00:22:58,660 --> 00:23:02,155 Mais en général, à ma connaissance, 450 00:23:02,155 --> 00:23:04,488 nous n'avons pas été confronté à ça. 451 00:23:04,488 --> 00:23:06,871 Notre stratégie dans ce cas 452 00:23:06,871 --> 00:23:10,975 est que si une communauté ne veut pas de ses données dans une base de données, 453 00:23:10,975 --> 00:23:12,095 nous les supprimons. 454 00:23:12,095 --> 00:23:14,806 (intervenant·e 5) Nous avons abordé le sujet dans Wikidata et Wikipedia... 455 00:23:14,806 --> 00:23:16,250 - Ah bon ? - (intervenant·e 5) Dans les commentaires. 456 00:23:16,250 --> 00:23:17,647 - Vraiment ? - (intervenant·e 5) Ça pose problème. 457 00:23:17,647 --> 00:23:20,488 J'imagine, oui, surtout pour des commentaires sur des photos ou autres. 458 00:23:20,488 --> 00:23:21,900 (intervenant·e 5) Exactement. 459 00:23:27,177 --> 00:23:33,170 (intervenant·e 6) J'ai une question sur le *crowdsourcing*. 460 00:23:34,087 --> 00:23:36,644 Pour ce qui est de demander à une communauté 461 00:23:36,654 --> 00:23:40,480 d'annoter ou d'entrer des données dans un ensemble de données, 462 00:23:40,480 --> 00:23:46,131 ce qui peut être intimidant en tant qu'éditeur 463 00:23:46,131 --> 00:23:49,244 c'est que je ne peux voir que ce qui manque. 464 00:23:49,244 --> 00:23:53,242 Mais si je vais y consacrer du temps ayant une idée claire en tête, 465 00:23:53,582 --> 00:23:56,672 que certains éléments sont prioritaires, 466 00:23:57,755 --> 00:24:01,198 ça devient très motivant. 467 00:24:01,200 --> 00:24:05,392 Je me demandais si vous aviez un système qui... 468 00:24:05,602 --> 00:24:07,866 Nous sommes conscients des lacunes dans nos données, 469 00:24:07,866 --> 00:24:12,088 les preuves linguistiques montrent que si ces lacunes-là 470 00:24:12,088 --> 00:24:15,530 avaient été annotées, elles auraient un impact élevé. 471 00:24:15,530 --> 00:24:17,152 J'imagine donc 472 00:24:18,202 --> 00:24:21,405 qu'avoir le lexème correspondant à « maison » est important, 473 00:24:21,405 --> 00:24:24,977 plus important que le lexème correspondant à « donnée » ou autre. 474 00:24:24,977 --> 00:24:28,947 Je me demandais si vous aviez un système pour ça, 475 00:24:30,217 --> 00:24:35,480 si ça peut encourager les efforts de ces communautés. 476 00:24:35,840 --> 00:24:37,066 Bonne question. 477 00:24:37,200 --> 00:24:41,216 Wikidata a beaucoup de... 478 00:24:41,216 --> 00:24:44,576 Pardon, PanLex a beaucoup de listes Swadesh. 479 00:24:44,576 --> 00:24:47,381 Il parait qu'on a la plus vaste collection de listes Swadesh au monde, 480 00:24:47,381 --> 00:24:48,445 ce qui est intéressant. 481 00:24:48,445 --> 00:24:50,432 Si vous ne savez pas ce qu'est une liste Swadesh, 482 00:24:50,432 --> 00:24:56,244 c'est une liste normalisée d'éléments lexicaux 483 00:24:56,244 --> 00:25:00,040 pouvant être utilisée dans l'analyse des langues. 484 00:25:00,040 --> 00:25:02,730 Elles contiennent des ensembles de mots très basiques. 485 00:25:02,730 --> 00:25:05,003 Il y a quelques différents types de listes Swadesh. 486 00:25:05,003 --> 00:25:07,328 Elles contiennent toutefois 100 ou 213 éléments 487 00:25:07,328 --> 00:25:08,911 dont des mots comme 488 00:25:08,911 --> 00:25:12,777 « maison » ou « œil » ou « peau », 489 00:25:12,777 --> 00:25:14,444 des mots généraux 490 00:25:14,444 --> 00:25:16,331 que l'on trouve dans toutes les langues. 491 00:25:17,833 --> 00:25:19,888 C'est un bon point de départ 492 00:25:19,888 --> 00:25:22,988 pour avoir accès à ce genre de données. 493 00:25:29,090 --> 00:25:31,126 Je le disais tout à l'heure, 494 00:25:31,133 --> 00:25:33,480 nous ne faisons pas de *crowdsourcing* pour le moment 495 00:25:33,480 --> 00:25:36,276 et nous sommes très enthousiastes à l'idée de pouvoir le faire un jour. 496 00:25:36,276 --> 00:25:39,073 J'aimerais vraiment discuter de ce sujet avec les personnes présentes, 497 00:25:39,073 --> 00:25:42,982 de la manière dont le *crowdsourcing* peut être utilisé 498 00:25:42,982 --> 00:25:45,931 et la logistique impliquée, 499 00:25:46,200 --> 00:25:48,867 c'est le genre de questions qui se posent. 500 00:25:51,288 --> 00:25:53,400 Ce que je peux vous dire 501 00:25:53,400 --> 00:25:55,376 c'est que nous avons une liste de priorités... 502 00:25:55,376 --> 00:25:57,684 En fait, nous avons effectivement une liste de priorités 503 00:25:57,684 --> 00:25:59,730 quant aux langues que nous recherchons. 504 00:25:59,730 --> 00:26:02,222 Nous commençons par rechercher les langues 505 00:26:02,222 --> 00:26:04,666 qui ne sont pas inclues dans les solutions technologiques 506 00:26:04,666 --> 00:26:06,977 et qui sont le plus souvent, disons généralement, 507 00:26:06,977 --> 00:26:09,280 des langues minoritaires, 508 00:26:09,280 --> 00:26:12,096 et les privilégions. 509 00:26:13,916 --> 00:26:16,844 En ce qui concerne les éléments lexicaux isolés, 510 00:26:16,851 --> 00:26:20,244 et du moment que c'est sous cette forme que nous récoltons les nouvelles données, 511 00:26:20,244 --> 00:26:22,977 il s'agit principalement d'ingérer la totalité d'un dictionnaire. 512 00:26:22,977 --> 00:26:25,911 Nous nous référons au choix des éléments lexicaux 513 00:26:25,911 --> 00:26:30,153 du dictionnaire, plutôt que de rechercher le terme « maison » 514 00:26:30,153 --> 00:26:31,500 dans chaque langue. 515 00:26:31,500 --> 00:26:33,465 Pour ce qui est du *crowdsourcing*, 516 00:26:33,465 --> 00:26:35,350 nous avons besoin de quelque chose de similaire. 517 00:26:35,350 --> 00:26:37,912 C'est une opportunité de recherche et de développement. 518 00:26:40,044 --> 00:26:43,088 (intervenant·e 7) Bonjour, je m'appelle Victor et tout ceci est génial. 519 00:26:44,498 --> 00:26:46,888 Par rapport à vos diapositives... 520 00:26:46,888 --> 00:26:49,355 Pouvez-vous élaborer sur la situation technique 521 00:26:49,355 --> 00:26:53,590 où circulent les informations entre Wikidata et PanLex 522 00:26:53,590 --> 00:26:57,022 en place actuellement ? 523 00:26:57,022 --> 00:26:59,955 Est-ce une situation déjà établie 524 00:26:59,955 --> 00:27:03,888 ou sinon, comment faites-vous 525 00:27:03,888 --> 00:27:07,133 en termes d'échange ou de retour d'informations 526 00:27:07,140 --> 00:27:09,950 entre PanLex et Wikidata ? 527 00:27:09,950 --> 00:27:13,733 Nous n'avons pas de relation officielle avec Wikidata actuellement 528 00:27:13,733 --> 00:27:15,583 et encore une fois, je suis très content 529 00:27:15,583 --> 00:27:18,054 de pouvoir aborder ce sujet dans le cadre de cette conférence. 530 00:27:18,054 --> 00:27:20,644 Nous avons eu quelques échanges avec Wikitionary 531 00:27:21,774 --> 00:27:24,720 mais honnêtement, Wikidata serait une meilleure solution 532 00:27:24,720 --> 00:27:26,755 pour le travail que nous faisons. 533 00:27:27,245 --> 00:27:29,201 Avoir un accès direct aux informations lexicales 534 00:27:29,201 --> 00:27:30,692 signifie que nous auront moins 535 00:27:30,692 --> 00:27:32,933 d'analyse et d'extraction de données à faire. 536 00:27:32,933 --> 00:27:37,148 Nous ne collaborons pas encore mais nous espérons le faire. 537 00:27:37,148 --> 00:27:39,800 (intervenant·e 7) Si ça ne se fait pas, quels obstacles prévoyez-vous ? 538 00:27:39,800 --> 00:27:43,511 Visiblement, Wikidata prend en compte plusieurs langues, 539 00:27:43,511 --> 00:27:46,533 mais lorsque je vais sur « translate.panlex.org », 540 00:27:46,533 --> 00:27:49,311 je vois que vous travaillez avec beaucoup de dialectes, 541 00:27:49,311 --> 00:27:50,888 beaucoup plus que Wikidata. 542 00:27:50,888 --> 00:27:53,316 Comment percevez-vous cet écart 543 00:27:53,316 --> 00:27:57,177 entre la traduction lexicale d'abord, 544 00:27:57,177 --> 00:28:00,155 telle qu'elle est appliquée, 545 00:28:00,155 --> 00:28:03,537 et le fait d'essayer de dresser une structure de connaissances ? 546 00:28:03,537 --> 00:28:05,946 Schématiser des connaissances peut s'avérer très intéressant. 547 00:28:05,946 --> 00:28:07,336 Nous avons ardemment discuté 548 00:28:07,336 --> 00:28:12,311 de la manière dont Wikidata organise ses données lexicales, 549 00:28:12,311 --> 00:28:13,777 vos données lexicales, 550 00:28:13,777 --> 00:28:16,044 et celle dont nous organisons les nôtres. 551 00:28:16,044 --> 00:28:20,933 Les différences subtiles qui existent nécessitent une stratégie de modélisation, 552 00:28:21,460 --> 00:28:24,577 certaines d'entre elles ne seront pas automatiques 553 00:28:24,577 --> 00:28:27,422 mais nous pourrions développer des techniques pour y arriver. 554 00:28:27,422 --> 00:28:30,796 Vous avez mentionné les variantes linguistiques. 555 00:28:30,796 --> 00:28:34,111 Nous sommes plutôt « catégoriques » à ce sujet. 556 00:28:34,111 --> 00:28:36,311 En d'autres termes, si l'on porte à notre connaissance 557 00:28:36,311 --> 00:28:38,755 que pour telle langue, tel ou tel dialecte est parlé 558 00:28:38,755 --> 00:28:41,325 du côté gauche de la rivière, en Papouasie-Nouvelle-Guinée 559 00:28:41,325 --> 00:28:42,743 et qu'une autre source nous affirme 560 00:28:42,743 --> 00:28:45,195 que tel ou tel dialecte est parlé du côté droit de la rivière, 561 00:28:45,195 --> 00:28:47,130 nous les considérerons comme deux langues à part, 562 00:28:47,130 --> 00:28:51,072 et ce, pour préserver au mieux les données que nous avons. 563 00:28:52,222 --> 00:28:54,355 Pouvoir structurer tout ça à la manière de Wikidata... 564 00:28:54,355 --> 00:28:56,938 Ce que j'aimerais vraiment c'est discuter 565 00:28:56,938 --> 00:29:00,696 de la manière dont les langues 566 00:29:00,696 --> 00:29:06,323 sont désignées sur Wikidata. 567 00:29:08,145 --> 00:29:12,320 Encore une fois, notre stratégie est une stratégie de séparation. 568 00:29:13,856 --> 00:29:17,440 Nous utilisons des codes ISO 6393 569 00:29:17,866 --> 00:29:19,643 fournis par l'Ethnologue, 570 00:29:19,643 --> 00:29:23,840 puis prévoyons plusieurs variantes pour chaque code, 571 00:29:23,840 --> 00:29:25,588 que ce soit pour les variantes écrites, 572 00:29:25,588 --> 00:29:29,096 les dialectes régionaux ou les sociolectes. 573 00:29:30,040 --> 00:29:32,942 Là encore, la discussion est ouverte et la collaboration est possible. 574 00:29:35,622 --> 00:29:39,466 (femme 3) Bonjour, j'aimerais savoir si vous avez un *pipeline ROC* 575 00:29:39,466 --> 00:29:44,533 parce que nous avons essayé la ROC pour les langues mayas 576 00:29:44,533 --> 00:29:47,928 sans succès. 577 00:29:47,933 --> 00:29:49,933 Ça ne comprend rien... 578 00:29:49,933 --> 00:29:52,512 - Oui ! (rit) - (intervenant·e 8) Oui... 579 00:29:52,512 --> 00:29:56,078 Si vos *pipelines* sont disponibles... 580 00:29:56,078 --> 00:30:00,288 Autre chose, à propos du chevauchement des codes ISO, 581 00:30:00,288 --> 00:30:01,641 on entend parfois : 582 00:30:01,641 --> 00:30:04,199 « Ceci est une langue, celle-ci en est une autre, » 583 00:30:04,199 --> 00:30:06,555 d'autres sources disent autre chose, 584 00:30:06,555 --> 00:30:10,133 comme vous le dites, alors qu'elles se chevauchent. 585 00:30:10,133 --> 00:30:12,955 Comment procédez-vous ? 586 00:30:12,956 --> 00:30:15,155 Très bonne question. 587 00:30:15,155 --> 00:30:17,120 J'apprécie énormément. 588 00:30:17,120 --> 00:30:20,400 Nous n'avons pas de *pipeline ROC* à proprement parler, 589 00:30:20,400 --> 00:30:23,533 nous procédons source par source. 590 00:30:23,533 --> 00:30:26,266 C'est parce que nous avons souvent 591 00:30:26,266 --> 00:30:28,035 des sources qui ne nécessitent pas de ROC 592 00:30:28,035 --> 00:30:30,188 et qui sont disponibles pour certaines de ces langues. 593 00:30:30,188 --> 00:30:33,103 Nous nous concentrons là-dessus parce qu'elles demandent moins de travail. 594 00:30:33,103 --> 00:30:35,070 Mais si nous voulons nous intéresser de plus prêt 595 00:30:35,070 --> 00:30:37,056 à l'une des sources que nous avons accumulées, 596 00:30:37,056 --> 00:30:40,896 nous devrons développer des *pipelines ROC* solides. 597 00:30:40,896 --> 00:30:43,968 Il y aussi le fait que, comme vous l'avez mentionné, 598 00:30:44,400 --> 00:30:48,576 ceux qui ont conçu les logiciels ROC 599 00:30:49,088 --> 00:30:51,072 ne réalisent pas à quel point 600 00:30:51,072 --> 00:30:53,282 ils peuvent être soumis à des épreuves sous contraintes. 601 00:30:53,282 --> 00:30:55,181 Et vous savez le plus drôle ? 602 00:30:55,181 --> 00:30:57,690 Soumettre un dictionnaire russe - tibétain à une ROC. 603 00:30:58,600 --> 00:31:00,216 Il s'avère que c'est très difficile... 604 00:31:01,503 --> 00:31:03,987 Nous y avons renoncé et avons engagé quelqu'un pour tout taper, 605 00:31:04,022 --> 00:31:05,641 ce qui était tout à fait faisable. 606 00:31:05,641 --> 00:31:07,260 Il parait même que 607 00:31:07,260 --> 00:31:10,266 cette dame russe exceptionnelle a appris le tibétain 608 00:31:10,266 --> 00:31:12,815 justement pour pouvoir faire ce travail, ce qui vraiment génial. 609 00:31:15,333 --> 00:31:18,270 Je pense que si vous avez affaire à des caractères latins, 610 00:31:18,270 --> 00:31:22,871 des solutions ROC robustes peuvent être développées 611 00:31:22,871 --> 00:31:25,033 pour traiter des sources multilingues semblables, 612 00:31:25,033 --> 00:31:27,131 il faudra s'attendre à y trouver un quatre aléatoire, 613 00:31:27,131 --> 00:31:28,284 si vous avez affaire 614 00:31:28,284 --> 00:31:30,560 à des sources mayas du XVIe siècle, le chiffre quatre. 615 00:31:32,088 --> 00:31:37,600 Toutefois, il y a quelques sources 616 00:31:37,600 --> 00:31:40,111 que la ROC ne pourra probablement jamais vraiment traiter 617 00:31:40,111 --> 00:31:42,244 ou qui nécessitent une quantité de travail énorme, 618 00:31:43,200 --> 00:31:46,823 dont nous pouvons profiter un peu maintenant. 619 00:31:46,823 --> 00:31:48,761 Nous travaillons sur un autre projet chez PanLex 620 00:31:48,761 --> 00:31:50,414 dans le cadre duquel nous transcrivons 621 00:31:50,414 --> 00:31:53,673 toute la littérature traditionnelle de Bali. 622 00:31:53,673 --> 00:31:57,952 Nous avons trouvé que pour les manuscrits balinais, 623 00:31:58,054 --> 00:31:59,644 il n'y a pas moyen d'utiliser la ROC. 624 00:31:59,644 --> 00:32:02,200 Nous avons donc demandé à plusieurs balinais de les taper, 625 00:32:02,200 --> 00:32:05,000 et c'est devenu un projet culturel sympa à Bali, 626 00:32:05,000 --> 00:32:07,288 c'est même passé aux infos et tout. 627 00:32:07,434 --> 00:32:11,007 Je dirais qu'on n'est pas obligé de recourir à la ROC, 628 00:32:11,007 --> 00:32:13,194 même s'il y a trop de choses qui nécessiteraient cela. 629 00:32:13,194 --> 00:32:15,160 Avoir de bonnes solutions ROC serait idéal. 630 00:32:16,663 --> 00:32:20,992 D'ailleurs, s'il y en a qui s'intéressent à la ROC multilingue, 631 00:32:20,992 --> 00:32:22,635 venez me voir après ! 632 00:32:29,517 --> 00:32:31,467 (intervenant·e 9) Merci pour votre présentation. 633 00:32:32,007 --> 00:32:34,866 Vous avez parlé d'intégration 634 00:32:34,866 --> 00:32:37,060 entre PanLex et Wikidata, 635 00:32:37,060 --> 00:32:38,942 mais vous n'avez pas vraiment fourni de détails. 636 00:32:38,942 --> 00:32:42,701 J'ai vérifié votre licence, vous êtres sous CC0. 637 00:32:42,701 --> 00:32:44,210 - Oui. - (homme 6) C'est génial. 638 00:32:44,210 --> 00:32:46,377 Il y a deux possibilités : 639 00:32:46,377 --> 00:32:49,400 soit on peut importer les données 640 00:32:49,400 --> 00:32:52,777 soit on vire vers quelque chose de semblable à Freebase, 641 00:32:52,777 --> 00:32:55,688 où l'on a la base de données complète depuis Freebase 642 00:32:55,688 --> 00:32:59,080 qu'on a importée, pour ensuite créer un lien, 643 00:32:59,080 --> 00:33:03,955 un identifiant externe à la base de données Freebase. 644 00:33:03,955 --> 00:33:08,397 Si vous avez une idée en tête, se rapproche-t-elle de ça ? 645 00:33:08,397 --> 00:33:10,401 Ou vous voulez simplement créer... 646 00:33:15,291 --> 00:33:18,755 une base de données indépendante qui pourrait être liée à Wikidata ? 647 00:33:18,755 --> 00:33:20,533 C'est une très bonne question 648 00:33:20,533 --> 00:33:23,282 et je pense même que ça a une longueur d'avance 649 00:33:23,282 --> 00:33:25,648 sur ce que j'ai en tête, 650 00:33:25,648 --> 00:33:29,555 en partie parce que 651 00:33:29,685 --> 00:33:32,111 faire en sorte que les deux bases de données collaborent 652 00:33:32,111 --> 00:33:33,533 est une étape en soi. 653 00:33:33,533 --> 00:33:35,332 Je pense que la première étape 654 00:33:35,333 --> 00:33:37,622 serait la mise en commun de nos compétences. 655 00:33:37,911 --> 00:33:40,246 Nous avons beaucoup d'expérience 656 00:33:40,246 --> 00:33:42,656 dans la classification des propriétés de différents lexèmes 657 00:33:42,656 --> 00:33:44,734 que je serai ravi de partager. 658 00:33:45,864 --> 00:33:49,050 Mais lier les deux bases de données serait formidable. 659 00:33:49,050 --> 00:33:50,808 J'en suis parfaitement sûr. 660 00:33:50,808 --> 00:33:54,066 Je pense que ce serait plus facile 661 00:33:54,066 --> 00:33:56,022 de lier Wikidata à PanLex, 662 00:33:56,022 --> 00:33:59,036 c'est peut-être subjectif de ma part parce que je sais que ça peut marcher. 663 00:34:02,040 --> 00:34:06,088 En fait, du moment que Wikidata est satisfait 664 00:34:06,088 --> 00:34:09,620 en ce qui concerne la licence, ou que nous trouvons un arrangement, 665 00:34:09,620 --> 00:34:12,057 ce serait une très bonne idée. 666 00:34:13,216 --> 00:34:14,666 Il ne nous reste plus qu'à trouver 667 00:34:14,666 --> 00:34:16,376 des moyens de lier les données elles-mêmes. 668 00:34:16,376 --> 00:34:22,234 Ce serait vraiment bien que les modifications effectuées sur Wikidata 669 00:34:22,577 --> 00:34:26,088 puissent immédiatement alimenter la base de données PanLex, 670 00:34:26,088 --> 00:34:29,398 sans avoir à réingérer... 671 00:34:30,786 --> 00:34:35,779 et donc faire de Wikidata une interface collaborative pour PanLex 672 00:34:35,779 --> 00:34:36,888 serait vraiment génial. 673 00:34:36,888 --> 00:34:39,517 La possibilité d'utiliser PanLex pour des traductions immédiates, 674 00:34:39,517 --> 00:34:42,464 d'effectuer des traductions à travers les éléments lexicaux de Wikidata... 675 00:34:42,464 --> 00:34:43,770 ce serait magnifique. 676 00:34:55,288 --> 00:35:00,266 (intervenant·e 10) On dirait le processus de vérification de la toile sémantique 677 00:35:00,266 --> 00:35:03,808 pour combler des vides par interférence. 678 00:35:05,682 --> 00:35:09,733 Si on réfléchit un peu plus à ce genre de traduction, 679 00:35:09,733 --> 00:35:13,353 comment gérez-vous les non-concordances 680 00:35:13,355 --> 00:35:16,088 sémantiques et grammaticales ? 681 00:35:16,088 --> 00:35:18,888 Par exemple, si vous essayez de traduire quelque chose en allemand, 682 00:35:18,888 --> 00:35:21,933 vous pouvez placer des mots ensemble 683 00:35:21,933 --> 00:35:25,986 et avoir un résultat qui ait du sens, 684 00:35:25,986 --> 00:35:29,184 mais d'un autre côté, j'ai lu que... 685 00:35:31,450 --> 00:35:38,450 parfois, les langues ont des systèmes granulaires différents 686 00:35:38,450 --> 00:35:40,453 pour les couleurs, par exemple. 687 00:35:41,487 --> 00:35:42,800 Vous dites que tous les systèmes 688 00:35:42,800 --> 00:35:45,010 sont différents ou similaires ? 689 00:35:45,400 --> 00:35:48,377 (intervenant·e 10) Je pense qu'il s'agit plutôt de l'évolution des langues 690 00:35:48,377 --> 00:35:51,533 où on ne désignait que le noir et le blanc... 691 00:35:51,533 --> 00:35:53,333 Oui, la hiérarchie des couleurs. 692 00:35:53,333 --> 00:35:54,492 La hiérarchie des couleurs 693 00:35:54,492 --> 00:35:57,271 est un bon moyen d'illustrer comment ça marche. 694 00:35:57,977 --> 00:36:01,400 Quand vous n'avez qu'une seule langue pivot... 695 00:36:01,873 --> 00:36:04,822 C'est très intéressant de lire des études sur les traductions automatiques 696 00:36:04,822 --> 00:36:08,000 où l'on mentionne souvent l'existence d'une langue pivot théorique, 697 00:36:08,000 --> 00:36:09,826 « il y a une langue pivot » lira-t-on, 698 00:36:09,826 --> 00:36:12,133 ensuite il s'avère que c'est l'anglais. 699 00:36:12,133 --> 00:36:16,688 À travers cette forme de traduction lexicale, 700 00:36:16,680 --> 00:36:20,352 le croisement de plusieurs langues intermédiaires différentes 701 00:36:20,755 --> 00:36:26,142 peut amener une meilleure gestion de l’ambiguïté sémantique. 702 00:36:26,142 --> 00:36:28,426 Du moment que le croisement se fait à travers des langues 703 00:36:28,426 --> 00:36:33,408 ayant des limites sémantiques plutôt similaires, 704 00:36:33,408 --> 00:36:37,038 vous pourrez éviter 705 00:36:37,038 --> 00:36:39,808 d'introduire de l'ambiguïté sémantique à travers une langue pivot. 706 00:36:39,808 --> 00:36:42,817 Si on utilise la hiérarchie des couleurs comme exemple, 707 00:36:42,817 --> 00:36:44,294 si l'on prend une langue 708 00:36:44,294 --> 00:36:46,460 qui a un seul terme pour désigner le bleu et le vert 709 00:36:46,460 --> 00:36:49,825 et le traduit en bleu 710 00:36:49,825 --> 00:36:52,924 dans votre langue pivot unique 711 00:36:52,924 --> 00:36:54,477 puis dans une autre langue différente 712 00:36:54,477 --> 00:36:57,422 qui comporte des ambiguïtés différentes, 713 00:36:57,422 --> 00:37:00,283 vous finirez par instaurer une ambiguïté sémantique. 714 00:37:00,283 --> 00:37:02,370 Mais si le croisement se fait avec des langues 715 00:37:02,370 --> 00:37:05,660 qui n'ont également qu'un seul élément lexical pour le vert et le bleu, 716 00:37:05,660 --> 00:37:10,666 la spécificité sémantique 717 00:37:11,040 --> 00:37:16,990 est transmise à la langue cible. 718 00:37:17,755 --> 00:37:20,666 En ce qui concerne les caractéristiques grammaticales, 719 00:37:20,666 --> 00:37:26,178 PanLex a collecté principalement des lexèmes, des formes lexicales, 720 00:37:26,178 --> 00:37:28,960 au cours de son histoire. 721 00:37:29,711 --> 00:37:31,800 Je veux dire par là 722 00:37:31,804 --> 00:37:33,840 les mots que vous trouvez dans un dictionnaire. 723 00:37:34,800 --> 00:37:38,170 Nous ne nous préoccupons pas pour le moment 724 00:37:38,555 --> 00:37:40,955 de recueillir des formes de variantes grammaticales, 725 00:37:40,955 --> 00:37:43,100 comme les données [inaudible], etc. 726 00:37:43,100 --> 00:37:45,010 ou les formes conjuguées du passé et du présent. 727 00:37:45,010 --> 00:37:46,487 Mais nous y réfléchissons. 728 00:37:46,488 --> 00:37:48,420 Autre chose qu'il est important de se rappeler, 729 00:37:48,420 --> 00:37:50,600 c'est que notre attention... 730 00:37:51,422 --> 00:37:54,490 est portée sur les langues minoritaires défavorisées et menacées, 731 00:37:55,000 --> 00:37:57,777 nous visons la disponibilité 732 00:37:57,777 --> 00:37:59,711 avant la perfection. 733 00:38:01,621 --> 00:38:02,844 J'aime beaucoup le dicton : 734 00:38:02,844 --> 00:38:04,927 « Le mieux est l'ennemi du bien » 735 00:38:04,927 --> 00:38:06,570 c'est ce que nous comptons faire. 736 00:38:06,570 --> 00:38:09,384 Mais l'idée de pouvoir manipuler les formes grammaticales 737 00:38:09,384 --> 00:38:11,826 et de pouvoir traduire à travers les formes grammaticales, 738 00:38:11,826 --> 00:38:13,892 nous intéresse beaucoup, 739 00:38:13,892 --> 00:38:15,640 ce sont des choses que nous avons étudiées 740 00:38:15,640 --> 00:38:17,209 mais pas encore implémentées. 741 00:38:25,350 --> 00:38:28,777 (intervenant·e 11) Donc sur ces 7 500 langues, 742 00:38:30,448 --> 00:38:33,111 je suppose que vous utilisez des dictionnaires conçus pour nous, 743 00:38:33,111 --> 00:38:36,222 mais toutes ces langues ont-elles des formes écrites standardisées ? 744 00:38:36,222 --> 00:38:38,101 Comment faites-vous pour... ? 745 00:38:38,101 --> 00:38:39,887 C'est une très bonne question. 746 00:38:42,111 --> 00:38:45,062 Oui, beaucoup de ces langues, 747 00:38:45,066 --> 00:38:47,977 vous le savez, n'ont pas de forme écrite. 748 00:38:47,977 --> 00:38:50,666 Toutefois, toute langue pour laquelle un dictionnaire a été conçu 749 00:38:50,666 --> 00:38:52,466 possède une orthographe, 750 00:38:52,466 --> 00:38:56,710 nous nous basons sur l'orthographe conçue pour le dictionnaire. 751 00:38:56,710 --> 00:38:59,686 Nous ajustons un peu l'orthographe parfois 752 00:39:00,956 --> 00:39:03,177 dans la garantie qu'il n'y ait pas de pertes. 753 00:39:03,177 --> 00:39:05,377 Nous essayons d'éviter cela autant que possible. 754 00:39:07,533 --> 00:39:11,245 Nous ne nous mettons pas 755 00:39:11,245 --> 00:39:13,229 à développer des orthographes pour des langues, 756 00:39:13,229 --> 00:39:14,967 parce qu'elles ne se sont pas développées, 757 00:39:14,967 --> 00:39:17,240 et même si elles ne sont pas rendues publiques. 758 00:39:20,410 --> 00:39:22,185 Par exemple, 759 00:39:22,185 --> 00:39:26,022 pour les diverses langues parlées en Nouvelle-Guinée, 760 00:39:26,488 --> 00:39:29,125 il se peut qu'il n'y ait pas d'orthographe commune, 761 00:39:29,125 --> 00:39:30,980 mais certains linguistes les inventent 762 00:39:30,980 --> 00:39:32,333 et c'est une bonne initiative. 763 00:39:33,243 --> 00:39:35,055 Nous recueillons aussi les formes phonétiques 764 00:39:35,055 --> 00:39:37,040 si elles sont disponibles dans les dictionnaires, 765 00:39:37,040 --> 00:39:38,400 et c'est une autre façon de faire, 766 00:39:38,400 --> 00:39:40,533 une représentation d'un mot selon l'API 767 00:39:40,533 --> 00:39:41,800 si possible. 768 00:39:41,800 --> 00:39:43,333 On pourrait utiliser ça aussi. 769 00:39:43,333 --> 00:39:45,755 Mais on ne s'en sert pas comme pivot 770 00:39:45,755 --> 00:39:48,226 parce que ça instaure des ambiguïtés. 771 00:39:52,666 --> 00:39:55,466 (intervenant·e 12) Merci, c'est peut-être une question bête 772 00:39:56,044 --> 00:40:00,572 mais est-ce les seules langues intermédiaires que vous utilisez ? 773 00:40:00,572 --> 00:40:02,215 Non, non. 774 00:40:02,222 --> 00:40:03,790 (intervenant·e 12) D'accord, merci. 775 00:40:03,790 --> 00:40:05,683 Merci d'avoir posé la question. 776 00:40:05,683 --> 00:40:11,311 Ceci est une capture d'écran de « translate.panlex.org ». 777 00:40:11,311 --> 00:40:12,826 Si vous effectuez une traduction, 778 00:40:12,826 --> 00:40:15,022 vous aurez une liste de traductions à droite. 779 00:40:15,022 --> 00:40:17,874 Vous cliquez sur le bouton « ... », vous obtenez cette figure. 780 00:40:17,874 --> 00:40:21,760 Cela montre les langues intermédiaires, 781 00:40:22,010 --> 00:40:24,133 les 20 premières selon le score, 782 00:40:24,133 --> 00:40:26,093 je pourrais vous en dire plus 783 00:40:26,093 --> 00:40:27,452 mais ce n'est pas très important, 784 00:40:27,452 --> 00:40:30,244 donc les langues utilisées selon le score. 785 00:40:30,244 --> 00:40:33,393 Mais pour effectuer la traduction, nous en utilisons plus que 20. 786 00:40:33,393 --> 00:40:35,727 Je me limite à 20 parce que s'il y en a plus... 787 00:40:35,727 --> 00:40:37,661 en fait, c'est une sorte de simulation physique, 788 00:40:37,661 --> 00:40:39,638 vous pouvez la faire bouger et elle remue. 789 00:40:39,638 --> 00:40:42,200 S'il y a plus de 20 langues, votre ordinateur en devient fou. 790 00:40:45,400 --> 00:40:47,419 C'est plus une démonstration qu'autre chose. 791 00:40:55,885 --> 00:40:57,888 (femme 5) Je suis Leila, de la fondation Wikimedia. 792 00:40:57,888 --> 00:41:00,035 Une remarque à propos de... 793 00:41:00,035 --> 00:41:01,740 Vous avez mentionné la fondation Wikimedia 794 00:41:01,740 --> 00:41:03,260 quelques fois dans votre présentation, 795 00:41:03,260 --> 00:41:06,533 si vous voulez faire de l'ingestion de données 796 00:41:06,533 --> 00:41:08,460 ou que vous voulez collaborer avec Wikidata, 797 00:41:08,510 --> 00:41:11,200 peut-être que Wikimedia Deutschland serait l'endroit plus approprié 798 00:41:11,200 --> 00:41:13,182 pour ce genre d'échange ? 799 00:41:13,182 --> 00:41:16,166 Wikidata fait partie de Wikimedia Deutschland, 800 00:41:16,166 --> 00:41:17,511 leurs équipes sont en Allemagne, 801 00:41:17,511 --> 00:41:19,971 et la communauté de bénévoles de Wikidata 802 00:41:19,977 --> 00:41:23,710 serait l'endroit idéal pour aborder 803 00:41:23,710 --> 00:41:25,590 tout ce qui a trait aux ingestions 804 00:41:25,590 --> 00:41:31,136 ou au rapprochement de PanLex à Wikidata. 805 00:41:31,577 --> 00:41:32,688 Très bien, merci beaucoup, 806 00:41:32,688 --> 00:41:34,901 Honnêtement, je ne connais pas bien 807 00:41:34,901 --> 00:41:37,823 les subtilités de l'architecture des projets 808 00:41:37,823 --> 00:41:39,740 et la manière dont ils se relient. 809 00:41:39,740 --> 00:41:41,977 D'après vos rires, c'est compliqué. 810 00:41:41,977 --> 00:41:44,333 En fait, nous aimerions discuter 811 00:41:44,333 --> 00:41:48,333 avec les responsables de Wikidata. 812 00:41:48,333 --> 00:41:52,120 En gros, tous ceux qui sont responsables 813 00:41:52,860 --> 00:41:56,470 de Wikidata nous intéressent, 814 00:41:56,470 --> 00:41:58,264 c'est-à-dire vous tous bénévoles. 815 00:42:03,266 --> 00:42:05,044 D'autres questions ? 816 00:42:10,066 --> 00:42:14,400 Bon, si vous avez d'autres questions sur ce que j'ai dit, sur autre chose, 817 00:42:14,400 --> 00:42:17,711 ou sur les détails et les spécificités de certaines choses, 818 00:42:17,711 --> 00:42:19,800 venez m'en dire deux mots, je suis à l'écoute. 819 00:42:19,800 --> 00:42:23,977 Surtout si vous travaillez avec les lexiques, 820 00:42:23,977 --> 00:42:28,666 ou quoi que ce soit impliquant des langues minoritaires menacées 821 00:42:28,666 --> 00:42:30,444 ou défavorisées, 822 00:42:30,444 --> 00:42:34,410 ou l'Unicode, je travaille dessus également. 823 00:42:36,220 --> 00:42:37,670 Merci beaucoup 824 00:42:37,670 --> 00:42:39,563 et merci de m'avoir invité à prendre la parole, 825 00:42:39,563 --> 00:42:41,620 j'espère que vous avez apprécié cette présentation. 826 00:42:41,620 --> 00:42:43,753 (applaudissements)