La Fondation Wikimedia a alerté sur l'impact significatif de l'intelligence artificielle (IA) sur l'écosystème en ligne des connaissances et informations fiables. Selon les dernières données de l'organisation, le nombre de pages vues sur Wikipédia a enregistré une baisse significative, principalement en raison de la popularité des chatbots à modèles linguistiques à grande échelle et de l'utilisation généralisée des résumés générés par l'IA dans les moteurs de recherche.
Le double impact de la baisse du trafic et de l’amélioration de la détection
Marshall Miller, directeur principal des produits chez WikimediaBlog officielDans un rapport, l'entreprise a révélé qu'après avoir amélioré son mécanisme de détection des robots afin d'obtenir des données plus précises, le nombre de pages vues sur Wikipédia a diminué de 8 % par rapport à la même période l'an dernier. Marshall Miller a explicitement déclaré : « Nous pensons que ces baisses reflètent l'impact de l'IA générative et des médias sociaux sur la façon dont les gens accèdent à l'information, en particulier les moteurs de recherche qui fournissent des réponses directes aux internautes, souvent basées sur le contenu de Wikipédia. »
Une crise existentielle plus profonde
La crise décrite par Marshall Miller va bien au-delà du simple problème de trafic sur un seul site web. Il a également averti que si le trafic de Wikipédia continue de baisser, cela menacera la plateforme, qui est « le seul site web de cette taille à respecter les normes de vérifiabilité, de neutralité et de transparence et à soutenir l'information sur l'ensemble d'Internet ».
De plus, moins de trafic de liens signifie moins de participation bénévole, moins de soutien financier et, en fin de compte, un contenu moins fiable.
Défis techniques posés par les robots d'exploration IA
Ces dernières années, la Fondation Wikimedia a dû faire face à une complexité croissante due aux robots d'indexation alimentés par l'IA. La sophistication de ces robots a rendu de plus en plus difficile la distinction entre le trafic humain et celui des robots. Cela affecte non seulement la précision des statistiques de trafic, mais représente également une charge supplémentaire pour les ressources du serveur.
Solutions et appels à l'industrie
Face à cela, Marshall Miller a proposé une solution : les modèles linguistiques à grande échelle et les résultats de recherche devraient offrir aux utilisateurs des possibilités d'interaction directe avec les sources d'information. Marshall Miller a souligné que pour que les utilisateurs aient confiance dans les informations partagées en ligne, les plateformes devraient clairement indiquer les sources d'information et offrir la possibilité d'y accéder et d'y participer.
Les tentatives et les échecs de Wikipédia en matière d'IA
Cet été, Wikipédia a envisagé d'ajouter des résumés générés par l'IA en haut des articles, mais le projet a été abandonné avant même d'être lancé après une réaction négative des éditeurs bénévoles du site, soulignant l'épineux problème de l'équilibre entre la technologie de l'IA et la sagesse des éditeurs humains, même au sein de Wikipédia.
Alors que l'IA continue de transformer l'accès à l'information, la situation critique de Wikipédia met en lumière le point d'inflexion critique auquel l'écosystème du savoir en ligne est confronté. Comment tirer parti des avancées technologiques tout en préservant la pérennité de sources d'information fiables deviendra un défi que l'ensemble du secteur devra relever.
D’autre part, la Fondation Wikimedia tente également de créer sa propre base de données de connaissances gigantesque.Intégration avec des modèles d'IA génératifsabaissant ainsi les obstacles à son introduction et à son utilisation par les petits et moyens développeurs, réduisant ainsi la monopolisation de l'IA générative par quelques géants technologiques et renforçant le rôle du contenu Wikipédia comme source d'information importante dans la tendance des applications d'IA générative. Cependant, la possibilité d'établir un nouveau modèle de développement dans un écosystème où l'IA est largement utilisée reste incertaine.









