Vue normale

Reçu avant avant-hier :: S.I.Lex ::

Pourquoi diffuser des travaux de recherche sous licence « Pas de modification » n’est pas une bonne idée

Par :calimaq
27 avril 2020 à 09:29

Je vous propose ci-dessous la traduction en français, réalisée par mes soins, d’un article du blog de Creative Commons international écrit par Brigitte Vézina et intitulé : « Why Sharing Academic Publications Under “No Derivatives” Licenses is Misguided« .

L’idée de réaliser cette traduction m’est venue suite aux abondants débats qui ont eu lieu l’an dernier à propos du fameux Plan S préparé par une coalition d’agences de financement de la recherche et qui devrait entrer à présent en vigueur en 2021. Outre l’exigence de diffusion immédiate en Open Access des publications, le Plan S demande que les chercheurs les placent préférentiellement sous licence Creative Commons CC-BY.

Le logo de la licence CC-BY-ND

La systématisation de l’usage des licences Creative Commons est essentielle dans la stratégie du Plan S, puisqu’elle fera enfin sortir le processus de publications scientifique du système délétère des cessions exclusives de droits aux éditeurs. C’est un nouveau paradigme qui se mettra ensuite en place dans lequel l’édition pourra redevenir ce qu’elle n’aurait jamais dû cessé d’être : un service rendu aux communautés de recherche et non un processus d’accumulation de droits de propriété intellectuelle.

Mais cette disposition a pourtant fait l’objet de nombreux commentaires, faisant valoir qu’une diffusion plus restreinte, s’appuyant notamment sur des licences « ND » (No Derivative – Pas de modification) pourrait se justifier, en particulier pour préserver l’intégrité des résultats de la recherche. Je dois dire que j’ai toujours été très dubitatif devant ce type d’arguments et je me suis réjouis de voir que la Coalition S n’est pas significativement revenue sur sa volonté initiale dans la dernière version du Plan S.

Premier principe du Plan S, qui met en avant la question des licences

La licence CC-BY est donc toujours celle sous laquelle les publications doivent être diffusées par défaut, avec possibilité d’utiliser également les licences CC-BY-SA et CC0. Les licences comportant une clause ND ne pourront être utilisées qu’à titre exceptionnel et uniquement sur demande expresse des chercheurs adressée aux agences de financement., s’appuyant sur un motif légitime invoqué au cas par cas.

Dans son article, Brigitte Vézina démontre précisément qu’il ne devrait exister que très peu de cas dans lesquels l’utilisation d’une licence ND pourra s’appuyer sur un tel motif légitime.

Voire même aucun, si on va jusqu’au bout de la logique présentée dans ce texte.

Je précise que si j’ai pu procéder à cette traduction, c’est justement parce que le billet original était placé sous une licence CC-BY – donc sans clause ND – ce qui m’a permis de réaliser cette adaptation de l’oeuvre librement, mais dans le strict respect du principe de paternité.

Pourquoi diffuser des travaux de recherche sous licence « Pas de modification » n’est pas une bonne idée

Les bénéfices du Libre Accès sont indéniables et ils deviennent de plus en plus évidents dans tous les champs de la recherche scientifique : rendre les publications académiques librement accessibles et réutilisables procure une meilleure visibilité aux auteurs, garantit un meilleur emploi des crédits publics aux financeurs et un accès plus large aux connaissances pour les autres chercheurs et le grand public. Et pourtant, en dépit de ces avantages évidents du Libre Accès, certains chercheurs choisissent de publier leurs travaux sous des licences restrictives, sur la base de l’idée fausse qu’elles préserveraient mieux l’intégrité scientifique que les licences plus ouvertes.

La fraude académique, qu’elle prenne la forme du trucage des résultats, du plagiat ou du recours à des officines spécialisées pour rédiger ses travaux, est sans aucun doute un problème sérieux dans la communauté académique, partout dans le monde. Néanmoins, il s’agit d’un problème ancien, qui existait bien avant l’avènement des technologies numériques et des licences libres (comme les Creative Commons). Il est clair que le Libre Accès n’est pas la cause de la fraude académique, pas plus qu’il ne l’encourage ou l’aggrave.

Dans ce billet de blog, nous expliquons que l’utilisation de licences restrictives pour la diffusion des travaux académiques constitue une approche peu judicieuse pour résoudre les questions d’intégrité scientifique. Plus précisément, nous démontrons qu’utiliser une licence Creative Commons « Pas de modification » (No Derivative – ND) sur des publications académiques est non seulement peu pertinent pour juguler la fraude académique, mais aussi et surtout susceptible d’avoir un effet négatif sur la diffusion des résultats de la recherche, spécialement lorsqu’ils sont financés par des crédits publics. Nous mettons également en lumière que les garanties associées aux licences réellement ouvertes (comme la CC-BY ou la CC-BY-SA) sont à même d’enrayer les pratiques malveillantes, en plus des autres recours existants en cas de fraude académique et d’abus similaires.  

Les licences « Pas de modification » (CC-BY-ND et CC-BY-NC-ND) permettent aux utilisateurs de copier et de rediffuser une œuvre, mais interdisent de l’adapter, de la remixer, de la transformer, de la traduire, de la mettre à jour, de manière à produire une œuvre seconde. En résumé, elles interdisent de réaliser des œuvres dérivées ou des adaptations.

Les chercheurs font tous du remix

Les chercheurs publient pour être lus, pour avoir un impact et pour rendre le monde meilleur. Pour atteindre ces objectifs importants, il est préférable que les chercheurs autorisent la réutilisation et l’adaptation de leurs publications et de leurs données de recherche. Ils devraient également pouvoir réutiliser et adapter les publications et les données des autres chercheurs. Isaac Newton, un des scientifiques les plus influents de tous les temps, est l’auteur de cette citation célèbre : « Si j’ai vu plus loin, c’est en me tenant sur les épaules des géants », ce qui signifie que la production de nouvelles connaissances ne peut advenir que si les chercheurs peuvent s’appuyer sur les idées et les publications de leurs pairs et de leurs prédécesseurs, pour les revisiter, les réutiliser et les transformer, en ajoutant couche après couche de nouvelles connaissances. Les chercheurs sont des remixeurs par excellence : le Libre Accès est le moyen par excellence de favoriser le remix.

Les publications sous licence ND ne sont pas en Libre Accès

Les articles placés sous une licence ND ne peuvent pas être considérées comme en Libre Accès, si l’on se base sur la définition originelle établie en 2012 par l’initiative de Budapest pour le Libre Accès et les recommandations qui s’en sont suivies. Les licences ND restreignent de manière excessive la réutilisation des contenus par les collègues chercheurs et limitent leur possibilité de contribuer à l’avancement des connaissances. C’est la principale raison pour laquelle il est déconseillé d’appliquer des licences ND aux publications universitaires. Bien que les licences ND soient utilisées pour certains types de contenu, tels que les documents officiels qui ne sont pas censés être modifiés de manière substantielle, leur utilisation pour interdire les adaptations de publications universitaires va à l’encontre de l’éthique de la recherche universitaire. En fait, la clause ND nuit aux chercheurs.

Par exemple, les licences ND empêchent les traductions. Dès lors, puisque l’anglais est la langue dominante dans la recherche, les licences ND entravent l’accès à la connaissance pour les publics ne parlant pas anglais et limite la diffusion de la recherche au-delà de la sphère anglophone. Les licences ND empêchent aussi l’adaptation des graphiques, des images et des diagrammes inclus dans les articles de recherche (à moins qu’ils ne soient placés sous des licences distinctes permettant l’adaptation), qui sont souvent essentiels pour favoriser une diffusion plus large des idées sous-jacentes.

Les réutilisations peuvent aussi être découragées du fait des différences à la manière dont les « adaptations » sont définies dans les lois sur le droit d’auteur dans différents pays et des variations dans la façon dont les différentes exceptions et limitations au droit d’auteur peuvent s’appliquer. Un exemple significatif concerne la fouille et exploration de textes et de données (Text and Data Mining) utilisée pour produire de nouvelles connaissances à partir de matériaux pré-existants. Certains lois sont très claires à propos de la possibilité pour les chercheurs de faire du TDM sur la base d’une exception au droit d’auteur, même lorsqu’une adaptation intervient au cours du processus de TDM et lorsque le résultat produit peut être considéré comme une adaptation des matériaux de base. Le recours à une licence ND peut alors être interprété par erreur comme interdisant des activités pourtant parfaitement légales par ailleurs et constituent alors une nouvelle entrave à l’avancement de la Science.

Certains remix restent de toutes façons possibles malgré les licences ND

Quoi qu’il en soit, les licences ND ne suppriment pas complètement la possibilité de réutiliser ou d’adapter des publications académiques. D’abord, les licences ne limitent pas les droits dont les utilisateurs peuvent disposer grâce aux exceptions et limitations au droit d’auteur, comme la citation, l’analyse et la critique et le bénéfice du fair dealing ou du fair use. De plus, la Foire Aux Questions de notre site précise qu’en règle générale, le fait de prendre un extrait dans une œuvre pour illustrer une idée ou fournir un exemple au sein d’une autre œuvre ne produit pas une œuvre dérivée. Il s’agit alors d’un acte de reproduction et non pas une amélioration de l’œuvre préexistante qui seule pourrait être considérée comme une violation de la licence ND. Or toute les licences Creative Commons donnent le droit de reproduire l’œuvre, a minima dans un cadre non-commercial et parfois au-delà (en fonction de la licence retenue).

Toutefois, une personne qui souhaite adapter une publication placée sous licence ND peut demander l’autorisation de le faire à l’auteur, qui peut alors lui accorder une licence individuelle. Mais cela ajoute des coûts de transaction inutiles qui pèsent sur les réutilisateurs, lesquels peuvent choisir de de tourner vers d’autres sources plutôt que d’affronter le processus souvent fastidieux de la demande d’autorisation.

Bien qu’il existe des moyens légaux de réutiliser une œuvre sous licence ND, ils s’avèrent souvent mal adaptés au contexte de la recherche universitaire.

Toutes les licences Creative Commons imposent de respecter la paternité

De multiples protections contre les risques d’appropriation et de détournement sont incorporées dans toutes les licences CC, qui disposent à présent d’un solide historique d’application contre des réutilisateurs qui violeraient les termes des licences. Ces garanties, qui viennent s’ajouter et pas remplacer les pratiques et règles en vigueur dans le monde académique, procurent une couche supplémentaire de protection pour la réputation des auteurs originaux qui devraient les rassurer contre le risque de voir des modifications apportées à leurs œuvres leur être attribuées à tort :

  • Le respect de la paternité de l’auteur est prévu dans les six licences Creative Commons. L’attribution de l’œuvre à l’auteur (que l’on appelle souvent « citation » dans le monde académique) doit être effectuée dans la mesure où elle peut raisonnablement être opérée compte tenue des moyens, du média et du contexte de la réutilisation et à moins que l’auteur demande de ne pas le faire (droit de non- paternité qui existe également).
  • Les réutilisateurs n’ont pas le droit d’utiliser l’attribution de l’œuvre à l’auteur pour faire endosser à celui-ci les vues et opinions qu’ils expriment à l’occasion de la réutilisation.
  • Les modifications apportées à l’œuvre originale doivent être identifiées par le réutilisateur et un lien vers l’œuvre originale doit être effectué. Cela permet au public de voir ce qui a été modifié et, ainsi, de discerner ce qui doit être attribué au réutilisateur et non à l’auteur original. Pour plus de précisions voyez la section 3.a du contrat de la licence CC-BY 4.0.

Le droit d’auteur n’est pas le meilleur outil pour faire respecter l’intégrité de la recherche scientifique

Au final, les lois sur le droit d’auteur et les licences Creative Commons qui sont basées sur elles ne constituent pas le cadre le plus approprié pour régler les problèmes de respect de l’intégrité de la recherche. De meilleurs résultats peuvent être atteints à travers la définition et l’application de normes sociales, de principes éthiques et de codes de conduite pertinents et bien établis, reconnus par des institutions. Tout compte fait, les chercheurs ne se rendent pas service à eux-mêmes lorsqu’ils utilisent une licence ND pour diffuser leurs travaux. Pour optimiser la diffusion et accroitre leur impact social, nous recommandons le partage des publications académiques selon les conditions les plus ouvertes possibles, en utilisant la licence CC-BY pour les articles et la CC0 pour les données.

La diffusion des thèses électroniques à l’heure de la Science Ouverte

Par :calimaq
11 janvier 2020 à 09:29

L’an dernier, j’ai eu l’occasion de participer comme membre du Jury au premier prix Open Thèse, créé par l’association Open Law, qui avait pour but de récompenser des thèses en droit diffusées en Libre Accès par leurs auteurs. La remise des prix a eu lieu en décembre dernier et trois lauréats ont vu couronnés leurs efforts pour faire progresser la Science Ouverte.

Les sciences juridiques ne constituent pas une discipline réputée particulièrement favorable au Libre Accès et l’initiative de ce prix Open Thèse constitue donc un moyen intéressant de changer progressivement le regard porté sur la diffusion en ligne des résultats de recherche. Il s’adresse en outre aux chercheurs en début de carrière, c’est-à-dire à ceux qui sont les plus à même de faire évoluer les pratiques dans l’avenir. Une telle démarche gagnerait sans doute à être répliquée dans d’autres disciplines, notamment celles où la Science Ouverte progresse le plus lentement.

73% de thèses en Libre Accès

La question pourrait d’ailleurs se poser de savoir où en sont les pratiques des doctorants concernant la diffusion de leur thèse. Il faut savoir qu’un arrêté du 25 mai 2016 réserve aux doctorants la faculté de décider s’ils souhaitent publier leur thèse en accès libre sur Internet ou la laisser en accès restreint. L’ABES (Agence Bibliographique de l’Enseignement Supérieur) a publié en février 2019 les résultats d’une enquête – à côté de laquelle j’étais passé – contenant des informations très intéressantes quant à la manière dont les doctorants font usage de cette faculté de choix.

On y apprend notamment ceci :

Au 1er janvier 2019, sur les 85000 thèses soutenues et traitées par les établissements, on dénombrait quelques 23000 thèses électroniques en accès restreint, soit 27% du corpus, avec un ratio de 26,6% pour les thèses soutenues en 2016 et de 22% pour les thèses soutenues en 2017 (sachant que 2 500 thèses sont en attente de traitement pour 2017).

Je dois dire que j’ai dû relire ces chiffres plusieurs fois pour vérifier si j’avais bien compris. Car si 27% du corpus global des thèses est encore en accès restreint, on peut en déduire que 73% sont diffusées en ligne en libre accès, ce qui constitue un chiffre somme toute assez considérable, si on considère que les doctorants sont libres de prendre cette décision. Et la proportion semble progresser dans le temps, puisqu’elle augmente jusqu’à 78% pour la dernière année considérée par l’enquête (2017).

On dit que les doctorants sont parfois dissuadés de mettre leur thèse en ligne à cause de la peur du plagiat ou parce que la diffusion en Libre Accès leur ferait perdre l’opportunité de publier leur thèse chez un éditeur. Il semblerait que ce type d’arguments perdent peu à peu de leur puissance, vu que près de quatre doctorants sur cinq font à présent le choix de la mise en ligne. Il serait néanmoins intéressant d’avoir des chiffres plus détaillés, notamment pour connaître l’état des pratiques par discipline, car il doit exister des contrastes selon les branches de la Science.

A titre de comparaison, le Baromètre de la Science Ouverte indique une moyenne de 41% d’Open Access pour les articles publiés par les chercheurs français. On ne peut toutefois comparer complètement les thèses et les articles, car pour les thèses ne sont pas des documents édités et le choix de la mise en ligne peut s’opérer de manière plus autonome.

Quelle diffusion pour les thèses en accès restreint ?

Un autre point intéressant dans l’enquête de l’ABES concerne les pratiques des bibliothèques universitaires à propos de la mise à disposition des thèses, lorsque le doctorant a opté pour un accès restreint. En effet, l’arrêté de 2016 permet aux auteurs de ne pas diffuser leur thèse en ligne, mais il prévoit que les thèses en accès restreint reste néanmoins communicables dans le périmètre suivant :

Sauf si la thèse présente un caractère de confidentialité avéré, sa diffusion est assurée dans l’établissement de soutenance et au sein de l’ensemble de la communauté universitaire. La diffusion en ligne de la thèse au-delà de ce périmètre est subordonnée à l’autorisation de son auteur, sous réserve de l’absence de clause de confidentialité.

Il faut savoir que cette nouvelle version de l’arrêté sur le doctorant a élargi ces conditions de diffusion (j’avais d’ailleurs écrit un billet à ce sujet en 2016). En effet auparavant, les bibliothèques universitaires ne pouvaient communiquer les thèses électroniques en accès restreint que dans le périmètre de l’établissement de soutenance. En ajoutant que la diffusion était possible « au sein de l’ensemble de la communauté universitaire« , le nouvel arrêté laissait présager la possibilité d’une communication à distance, à condition de l’effectuer de manière sécurisée. Mais le texte restait flou sur les modalités que pourraient prendre une telle diffusion élargie.

L’enquête de l’ABES montre que ces incertitudes ont hélas plutôt joué en défaveur de la diffusion, puisque 2/3 des établissements n’autorisent pas le PEB (Prêt Entre Bibliothèques) pour les thèses électroniques en accès restreint. Les situations sont très variables en fonction des établissements : dans la plupart des cas, les thèses sont quand même accessibles via un intranet, mais uniquement aux membres de l’établissement et non à « l’ensemble de la communauté universitaire« .

État des pratiques concernant la diffusion sur Intranet des thèses en accès restreint d’après l’étude de lABES

Pour une « FAIRisation » de la diffusion des thèses

L’ABES recommande à la fin de son enquête la mise en place d’un dispositif au niveau national pour permettre l’accès aux thèses en accès restreint. Cette idée a son intérêt, mais il me semble que les enjeux vont graduellement se déplacer à l’avenir.

Si l’on en croît la dynamique des chiffres, cette question de la diffusion des thèses en accès restreint risque en effet de perdre peu à peu en importance dans le temps, puisque la plupart des thèses seront accessibles en ligne. Il restera néanmoins toujours une proportion de thèses pour lesquelles l’accès devra continuer à s’effectuer de manière sécurisée, indépendamment de la volonté du doctorant. Cela découle de motifs légitimes de confidentialité ou de la nécessité de protéger des secrets reconnus par la loi (protection de la vie privée, secret industriel et commercial, secrets administratifs, etc.).

Si on extrapole un peu à partir de la situation actuelle, on arrive à un schéma proche de celui qui prévaut actuellement en droit pour les données de la recherche, à savoir un principe d’ouverture par défaut, accompagné d’une série d’exceptions fixées par la loi. On pourrait donc à terme envisager une refonte de l’arrêté sur le doctorat pour acter cet état de fait et mettre complètement en phase les règles de diffusion des thèses avec les principes de la Science Ouverte. Cela conduirait quelque part à évoluer vers ce que j’appellerai une « FAIRisation » de la logique de diffusion des thèses.

Je fais référence par là aux principes FAIR, mis en place initialement par la Commission européenne pour les données de recherche, dont l’esprit général est résumé par la phrase : « Aussi ouvert que possible, aussi fermé que nécessaire« . Cet adage traduit l’idée que l’ouverture ne doit plus dépendre d’une décision d’opportunité ou d’un choix discrétionnaire, mais plutôt d’un diagnostic, devant s’attacher à vérifier si des obstacles juridiques à la mise en ligne existent ou non. Au cas où aucun de ces obstacles n’est identifié, alors c’est le principe général qui s’applique et la mise en ligne doit être opérée.

Il me semble qu’il serait important que les doctorants soient d’emblée familiarisés avec cette logique FAIR, car ils seront désormais amenés de plus en plus souvent dans la suite de leur carrière de chercheur à devoir appliquer ces principes d’ouverture par défaut. C’est en effet la volonté du Plan National pour la Science Ouverte, adopté en 2018, de promouvoir l’ouverture systématique des résultats de la recherche financée par des fonds publics. Il serait donc assez cohérent que les doctorants qui reçoivent un financement public pour réaliser leurs thèses doivent en contrepartie publier celle-ci en ligne, à moins qu’un obstacle juridique ne s’y oppose (ouverture par défaut). Une telle règle semble d’ailleurs se dessiner au Royaume-Uni pour les thèses financées par l’équivalent de leur ANR (voir ci-dessous).

La politique d'ouverture des thèses financées par UKRI et des publications associéeshttps://t.co/ZU6KlSPEa5 pic.twitter.com/nLD9V78iFw

— Mathieu Saby (@27point7) December 28, 2019

On pourrait même aller plus loin dans cette idée de « FAIRisation » de la diffusion des thèses en prenant en compte également les données de recherche associées. Il importe en effet de considérer les thèses comme des objets « hybrides », composés certes d’un texte, mais aussi des données sous-jacentes, qui en sont indissociables. La période du doctorat constitue d’ailleurs le premier moment où les chercheurs sont confrontés aux problématiques de production et de gestion de données de recherche et c’est donc un moment crucial pour l’acquisition des compétences de bonnes pratiques. Or de la même manière que les lauréats des projets ANR ou H2020 sont désormais tenus de réaliser des plans de gestion des données (DMP / Data Management Plan), on pourrait imaginer que les doctorants doivent faire de même.

Un tel plan de gestion de données, qui devrait idéalement comporter trois volets (en début de thèse, à mi-parcours, à la fin), permettrait justement d’anticiper la question de la diffusion et d’établir si des obstacles juridiques à l’ouverture existent ou non. Pour que la cohérence soit complète, de la même manière qu’un doctorant ne peut aujourd’hui soutenir sa thèse sans avoir déposé la version électronique du texte à la bibliothèques universitaire, on pourrait imaginer que les doctorants ne puissent se présenter à la soutenance sans avoir déposé les données associées, conformément à un Plan de Gestion de Données établi à l’avance. Et pour que ces principes aient une portée réelle, c’est l’arrêté sur le doctorat qui devrait être modifié pour établir de telles règles.

***

Le Plan National pour la Science Ouverte prévoyait déjà la création d’un « Label Science Ouverte » pour les écoles doctorales et lors des dernières Journées Nationales de la Science Ouverte qui se sont tenues à Paris en novembre dernier, il a été annoncé la production d’un « Vade-mecum de la Science Ouverte » à destination des écoles doctorales. Les propositions finales que j’ai fait figurer dans ce billet vont plus loin, mais si 73% des thèses sont déjà en Libre Accès, le pas à franchir pour établir un principe d’ouverture par défaut est assez ténu. Les principes mêmes de la Science Ouverte conduiront sans doute tôt ou tard à une généralisation de la logique du FAIR et il y aurait du sens à ce que les thèses soient diffusées dans cet esprit, aussi bien en ce qui concerne le texte que les données.

capture-2

calimaq

❌