top of page

Améliorer la qualité des métadonnées grâce aux campagnes de crowdsourcing

WE-Hope vise à créer une plateforme qui donnera accès à du contenu patrimonial, à savoir des témoignages de réfugiés et des histoires, partagées par des utilisateurs de par le monde. En prenant part à ce genre d’initiatives et campagnes de crowdsourcing (production participative) les utilisateurs de la plateforme peuvent améliorer la qualité des métadonnées substantiellement et efficacement. Cette nouvelle quantité de données produites par des algorithmes d’intelligence artificielle (IA) et automatique grâce aux récentes avancées de l’IA et du Machine Learning peut être vérifiée par les utilisateurs de la plateforme, et peut aussi être enrichie par les utilisateurs qui ajoutent de nouveaux termes en utilisant des thesauri.



Le Patrimoine Culturel se définit comme l’ensemble des biens, des sites et des pratiques qu’une société considère comme ancien, important et digne d’être conservé. Il fait l’objet d’une attention croissante de la part du public comme des chercheurs au niveau mondial, et le périmètre du concept continue de s’étendre. Ces dernières années, le secteur du Patrimoine Culturel a vécu une incroyable transformation : l’accélération de l’évolution digitale, sous la forme d’activités importantes de numérisation et d’annotation ainsi que des actions en faveur de la génération de contenu culturel de façon multimodale depuis toutes les sources possibles, ont conduit à de grandes quantités de contenus numériques disponibles via des institutions culturelles variées telles que les musées, bibliothèques, archives et galeries. De plus, l’évolution des Technologies Web a contribué à faire du Web une plateforme centrale pour la circulation, la distribution et la consommation d’une grande variété de contenus culturels.


Des initiatives visant à agréger le contenu culturel numérique au niveau national et international et à le rendre facilement accessible aux secteurs créatifs et culturels sont apparues durant les dernières décennies, parmi lesquelles se détachent Europeana et la Digital Public Library of America. Elles opèrent comme des plateformes cross-domaines, qui rendent le contenu accessible aux utilisateurs, immédiatement accessibles pour l’étude, la recherche et la réutilisation à travers des applications créatives et des services web. Mais bien que leur force principale réside dans le grand nombre d’items qu’elles contiennent, leur principale faiblesse est le manque de métadonnées structurées et riches en description et/ou la qualité insuffisante des métadonnées. Un tel problème affecte beaucoup l’accessibilité, la visibilité et la portée du contenu numérique disponible, limitant également l’ergonomie et le potentiel de valeur ajoutée des services et applications qui réutilisent ces ressources de façon innovante, ainsi que l’expérience de l’utilisateur.


L’amélioration de la qualité des métadonnées et leur enrichissement sont des défis majeurs qui reçoivent une attention grandissante dans le domaine du patrimoine culturel numérique. Ils ont été jusqu’à présent des processus manuels, devant faire face à des problèmes d’échelle, puisqu’améliorer ou même ajouter de nouvelles métadonnées à des centaines de milliers voire même millions d’enregistrements venant de différentes sources demande un énorme investissement en terme de temps, d’efforts et de ressources, que les agrégateurs et les institutions patrimoniales ne peuvent souvent pas se permettre. L’engorgement dû à l’échelle des métadonnées culturelles et patrimoniales peut actuellement être dépassé grâce à l’évolution de l’Intelligence Artificielle et l’émergence des initiatives de crowdsourcing. Les dernières avancées dans les technologies de l’IA et du Machine Learning facilitent le processus d’enrichissement des métadonnées en fournissant des capacités d’ingestion et d’analyse pour presque tous les types et toutes les quantités de données.

De plus, les initiatives et campagnes de crowdsourcing, vues comme des efforts pour raccorder le public ou le potentiel du collectif pour résoudre des problèmes complexes, à des niveaux et des échelles que ne pourrait atteindre aucun individu, ont prouvé qu’elles peuvent être un outil puissant pour obtenir des contributions de la part du public et aider à l’enrichissement des métadonnées. Dans ce contexte, les services d’enrichissement des métadonnées par l’analysée automatisée et l’extraction de caractéristiques ainsi que des services d’annotation par crowdsourcing, disponibles de façon centralisée, sur une plateforme dédiée, peuvent offrir une opportunité incroyable d’améliorer la qualité des métadonnées du contenu numérique disponible sur des plateformes comme Europeana, tout en engageant les utilisateurs et en sensibilisant à la valeur du Patrimoine Culturel.


Cet article a été écrit par NTUA.

Photo de Marvin Meyer via Unsplash.

bottom of page