La pratique scientifique de la fouille de textes et de données mise en péril

La pratique scientifique de la fouille de textes et de données mise en péril par les mesures de protection mise en œuvre par les éditeurs

Rapportez vos expériences afin d’alimenter la consultation publique sur la transposition de la Directive européenne sur le marché unique numérique

Une enquête menée auprès de chercheurs par le groupe « Copyright et affaires juridiques » de LIBER (Ligue des bibliothèques européennes de recherche) et de LACA (UK Libraries and Archives Copyright Alliance), fait ressortir que :

-       Les chercheurs n’accèdent pas à de nombreux contenus, tels que les articles (44%) mais aussi les bases de données, sites web, ebooks, presse, etc.

-       Le temps nécessaire au déblocage des contenus est de 24h à 2 mois ½, avec une moyenne de 24 jours. 11% des répondants mentionnent que leur problème n’a jamais été résolu.

-       Les sanctions appliquées par les éditeurs impactent l’ensemble de la communauté scientifique et non le chercheur à titre individuel. Ces sanctions peuvent être :

  1. La suspension de l’accès aux ressources électroniques souscrites pour l’ensemble du campus
  2. Des menaces de coupure de ces accès si la fouille de textes et de données n’est pas stoppée
  3. Des moyens techniques qui limitent le téléchargement à un seul document à la fois
  4. Des surcoûts
  5. La mise en place de Captcha limitant la fouille de textes et de données.

La recherche est en danger

Les chercheurs ont de plus en plus besoin de recourir à la fouille de textes et de données et devraient avoir la garantie qu’elle peut être pratiquée sans risque de sanction pour la communauté scientifique.

Les verrouillages doivent être levés rapidement

Dans chacune des transpositions nationales de la directive du Marché Unique Numérique, Liber invite les états membres à s’assurer qu’il soit inscrit que tout verrouillage doit être levé en moins de 72 heures une fois le problème rapporté à l’instance appropriée. Dans la traduction française actuelle de la directive, cette exigence est absente.

Si les éditeurs et gouvernements ne s’assurent pas que la fouille de textes et de données peut être effectuée facilement et sans limitation, les blocages risquent d’encourager les chercheurs à exploiter SciHub ou contourner les Captcha en recourant à des logiciels.

Bien que Liber et Laca comprennent la nécessité pour les éditeurs d’exercer un contrôle sur les activités anormales de certaines adresses IP, ils déplorent les procédures chronophages imposées à tous et qui pourraient concourir à détériorer les relations entre le monde de la recherche et celui de l’édition.

Partager vos expériences de verrouillage

Liber et Laca vont continuer à publier les résultats de cette enquête et appellent les chercheurs à y partager les blocages qu’ils rencontrent.

Plus Liber et Laca auront d’exemples à fournir, plus ceux-ci auront de poids dans les consultations autour de l’implémentation de la directive du Marché unique numérique. En lien avec l’article 7 de la directive, les mesures actuelles qui permettent de circonvenir aux mesures techniques de protection ont grandement besoin d’être améliorées.

 

(Texte adapté de la communication du 10 mars 2020, https://libereurope.eu/blog/2020/03/10/tdm-technical-protection-measures/)