Aller au contenu | Aller au menu | Aller à la recherche

OpenStreetMap : Changement de Licence - Historique et débat actuel

Le texte ci-dessous a été rédigé par Emilie Laffray contributrice OSM et membre du bureau de la fondation OSM.

__

Comme promis, voila un petit compte rendu sur le changement de licence basée sur ma compréhension des faits et ma participation aux discussions. Je vais aussi discuter un peu historique mais là c'est un sujet un peu plus difficile pour moi vu que je suis relativement nouvelle (avril 2009) dans le projet face à certaines personnes ici. Si quelqu'un voit une erreur, faites le moi savoir et je corrigerais mon propos. Je ne suis pas avocate, ou juriste, donc caveat emptor. La encore, je réitère de suite que j'ai accepté les nouveaux termes du contributeur et la nouvelle licence, mais ça ne m'empêchera pas d'essayer de présenter les différents points de vue qui sont exprimes par la communauté actuellement. De même, je simplifie volontairement certaines choses.

Historique

Quand le projet a commencé, OpenStreetMap a décidé de prendre une licence Creative Commons pour protéger le contenu de la base de données, et ce choix se porta sur la CC-BY-SA 2.0 qui est encore la licence actuellement (http://creativecommons.org/licenses/by-sa/2.0/deed.fr ). Toutefois, à mesure que le projet commençait à grossir, il est devenu clair qu'OSM commençait à devenir extrêmement important et les gens ont commencé à regarder la licence qui avait été choisie. Après évaluation de la licence, l'accord général était que la licence n'était pas adaptée à une base de données, car les données contenues dans OSM sont des faits, et donc ne tombent pas sous les termes du droit d'auteur. Il faut noter que cette interprétation peut varier d'un pays à un autre, du fait de l'évaluation du facteur de créativité.

Après examen de ce qui était disponible comme licence, il est devenu clair qu'il n'y avait aucune licence libre permettant de protéger une base de données. Les gens se sont alors mis à écrire une nouvelle licence qui deviendra l'ODbL (http://www.opendatacommons.org/licenses/odbl/summary/). Historiquement, ce sont des anciens de Creative Common qui ont crée l'Open Data Common (maintenant faisant partie de l'Open Knowledge Foundation). Cette scission provient du fait que les gens de Creative Common considèrent que les bases de données sont trop complexes légalement et doivent être mises sous une licence libérale. C'est d'ailleurs ce qui a conduit à la création de CC0 (http://wiki.creativecommons.org/CC0_FAQ).
Cette différence se retrouve d'ailleurs dans le commentaire de l'ODbL par des gens de Creative Common (http://wiki.openstreetmap.org/wiki/ODbL_comments_from_Creative_Commons). L'argumentation est qu'en effet les licences Creative Common ne sont pas adaptées à la protection des bases de données mais que l'ODbL est trop complexe et se base sur différentes législations a travers le monde, et que finalement il est plus simple de choisir CC0.

ODbL fonctionne globalement de la même façon que CC-BY-SA mais introduit de nouveaux concepts liés au fait que l'on travaille avec une base de données. L'ODbL contient deux notions importantes: Derived Database (Base de donnée dérivée), et Produced Work (Rendu de carte par exemple à partir des données). La nouvelle licence force la viralité des données mais permet à n'importe qui de choisir la licence désirée pour les produced works à condition que celui-ci ajoute l'attribution pour OSM. Une carte peut donc être distribuée sous CC-BY-SA, CC-BY ou encore être propriétaire. Ce choix de la licence pour le produced work était un moyen de clarifier le fait que la viralité du CC-BY-SA n'a jamais été quantifiée. Par exemple, Nike en Colombie et a Londres a lance une campagne nommée Nike Grid dont une publicité. Celle-ci contient quelques éléments de cartes provenant de OpenStreetMap. Cela rend-il la publicité CC-BY-SA elle même ou pas ? Personne n'a de réponse a cela (y compris Creative Common à qui on a posé la question).

L'autre chose qui diffère est que les contributions individuelles ne sont pas protégées en elle même; celles-ci ne sont protégées qu'a partir du moment où elles sont dans une base de données du fait qu'elles sont factuelles. C'est pour cela qu'il est possible légalement d'obtenir une extraction non substantielle des données et de les réutiliser comme l'on veut. Ce problème se pose pour toutes les bases de données.

L'ODbL utilise donc le droit des bases de données, les droits d'auteurs et la loi sur les contrats. En Europe, les données sont protégées par le droit européen sur les bases de données. Les autres éléments ont été rajoutées pour que les données soient protégées dans tous les pays du monde (d'où la complexité de la licence), puisqu'il n'existe pas d'accords internationaux sur les bases de données, ce qui n'est pas le cas pour le droit d'auteur (quoique).

Changement de licence

Le changement de licence en lui même a maintenant été lancé il y a quelques temps, une fois que l'ODbL ait atteint sa version finale. Mais le processus a commencé en 2008 suite à un accord des contributeurs d'après ce que j'ai compris. Toutefois, le changement de licence est composé de deux parties différentes: la licence elle même, et les termes du contributeur (CT).

Jusqu'à il y a peu de temps, il n'y avait pas de CT quand les gens prenaient un compte sur le site d'OSM. Depuis Mai, un CT est maintenant nécessaire pour obtenir un nouveau compte pour OSM. Le but du CT est de définir ce qui est faisable ou pas, et introduit aussi deux nouveaux concepts qui n'existaient pas jusqu'à maintenant : La fondation devient explicitement un "exclusive licensor" (elle l'était implicitement) et la fondation pourra changer la licence sans avoir a demander individuellement à chaque contributeur la licence sous reverse d'un accord de 66% de contributeurs actifs et sous réserve que la licence soit "open and free" autrement dit libre selon la définition de l'Open Knowledge Foundation. Il faut noter que si quelqu'un accepte le CT ses données sont alors sous double licence CC-BY-SA 2.0 et ODbL 1.0.

Le fait que la fondation devienne un "exclusive licensor" a deux raisons pratiques : La fondation n'a plus besoin de demander la permission individuelle à chaque contributeur pour savoir si leurs données peut changer de licence (les contributeurs sont toujours propriétaires de leurs données toutefois), ce qui simplifierait un changement de licence ultérieure et finalement la raison la plus importante à mes yeux, la fondation peut alors protéger les données et attaquer en justice si quelqu'un s'approprie les données. Actuellement, si l'on suit la loi à la lettre, la fondation n'a aucun mandat pour défendre les données de OSM puisque chaque contributeur est propriétaire de ses données. La pratique d'assignement des droits est extrêmement courante dans le monde du logiciel libre et n'a donc rien d'exceptionnel à OSM.

Le changement de licence est un processus en plusieurs étapes. Nous sommes actuellement dans la deuxième étape : celle où les gens peuvent passer sous la nouvelle licence et utiliser les nouveaux termes du contributeur. Ces termes ont été traduits en Français et en Italien pour respecter les lois de ces pays. La deuxième étape est utilisée pour jauger l'accord des contributeurs pour ce changement de licence. De même que précédemment, les données sont alors sous double licence CC-BY-SA 2.0 et ODbL 1.0. Il n'y a donc aucune perte de données. La deuxième phase a été volontairement non annoncée afin d'avoir une mesure réelle de l'intérêt de la nouvelle licence. Celle-ci a été juste diffusée de bouches à oreilles, même si on commence à avoir des statistiques pour les pays (Italie), où les gens en ont parlé fortement sur la liste (taux aux alentours de 70-80% selon la statistique choisie).
L'étape suivante (phase 3) est de demander à tous les contributeurs s'ils sont prêts à passer sous le nouveau CT et la nouvelle licence.
La phase 4 est de ne plus accepter des données sous CC-BY-SA 2.0 dans la base de données.
La phase 5 est de passer à une base de données CC-BY-SA 2.0 à une base de donnée ODbL 1.0. Cette phase est la phase ou il y aura potentiellement une perte de donnée, mais celle-ci n'est pas sure d'être atteinte en premier lieu.

Il faut noter que la phase la plus importante est la phase 3, car c'est à la fin de cette phase que l'on saura si l'on continue ou non. Il est hors de question de perdre une quantité importante de données. Cette perte sera évaluée clairement au cas par cas, car il y aura de fortes disparités régionales et l'on ne peut pas dire, c'est bon en Allemagne mais ce n'est pas bon en Australie. Définir un pourcentage de perte est quasiment impossible car ça ne serait pas un critère objectif. Il suffit de voir que les USA sont principalement déjà sous la nouvelle licence du fait que les données proviennent d'un import par un seul utilisateur.

Concernant la phase 5, il est très difficile de savoir le résultat final puisque les outils permettant d'exciser le contenu ODbL du contenu CC-BY-SA n'existent pas encore ou sont encore très rudimentaires. La carte qui a été montrée précédemment ne fonctionne que sur les "ways" et ne tient pas compte de l'approche où l'on remonte à la contribution la plus récente sous ODbL. Autrement dit, comme je le précisais dans un émail précèdent, la ville de Fleury Les Aubrais est très jaune mais en réalité la ville ne sera quasiment pas touchée par un effaçage car on remonterait a la version ODbL qui correspond aux Ways que j'ai crée initialement.

L'autre chose c'est que la fondation cherche a obtenir un consensus le plus large possible. Dans les premiers plans, le dual licensing n'était pas prévu, ce qui est le cas maintenant. Il est clair que ce plan risque de changer selon ce qui se passe dans la phase 3 et selon les chiffres obtenus.

Opposition au changement de licence

Actuellement, il y a plusieurs oppositions au changement de licence et pour différentes raisons. L'opposition se fait tant au niveau de la licence qu'au niveau de l'acceptation des CT. L'opposition principale n'est pas tant au niveau de la licence elle-même mais au niveau des CT.

Pour la licence, il y a trois types d'opposition : ceux qui veulent rester sous CC-BY-SA et ceux qui veulent passer sous domaine publique. Un certain nombre de personnes veulent conserver le status quo car elles pensent qu'il n'y a pas de soucis à avoir. Celles-ci pensent que CC-BY-SA fournit une maigre protection mais cela importe peu parce que la communauté arrivera toujours à faire pression sur les sociétés où les gens qui utilisent les données de manière illégale (l'exemple de Waze et de Google est donné). Parmi ces personnes, il y a aussi celles qui pensent que CC-BY-SA est extrêmement viral et que la viralité est perdue sur les produced works.

Certaines personnes pensent aussi que cette perte de viralité est un cadeau pour diverses sociétés qui peuvent alors faire payer les données de OSM (ce qui est d'ailleurs déjà possible de faire).

Concernant les CT, l'opposition se fait sur plusieurs points. Le premier point est que les gens refusent que la fondation soit l'"exclusive licensor" car il voit cela comme une intrusion de la fondation sur comment le projet est géré. Le deuxième point est sur le fait que le texte indiquait qu'il fallait vérifier explicitement les droits des données qu'on insère. Finalement, le troisième point est que certaines personnes refusent que la fondation soit capable de changer la licence vers une licence plus libérale (comme CC0) malgré les conditions incluses (66% des membres actifs autorisant le changement de licence vers une nouvelle licence libre). Parmi les points cités aussi, certains donnent l'argument qu'il n'est pas possible d'avoir un CT car certains pays refusent le droit aux enfants et aux femmes de signer ce genre d'accord et que donc il est illégal de pousser un CT.

Une société d'imagerie aérienne s'oppose notamment aux termes des CT car elle considère le CT comme deux nouvelles licences supplémentaires. L'interprétation qu'ils en ont est qu'il y a une viralité des droits quand quelqu'un trace les données sur leurs images, et donc potentiellement un changement vers une licence plus libérale violerait leurs droits d'auteurs. Ils ont d'autres arguments que je ne comprends pas tout à fait concernant tout cela toutefois.

Finalement, la troisième opposition vient des gens qui redoutent que ce changement de licence ne produise qu'une grosse perte de données, démoralisant les contributeurs et rendant la base de données inutile.

La fondation, notamment le Licence Working Group, se réunit chaque semaine pendant 1 heure (voire plus) pour essayer de résoudre les problèmes qui ont été soulevés. Nous en sommes maintenant à la version 1.2 des CT qui a été réécrit de manière assez importante afin de répondre aux objections qui ont été faites jusqu'à présent et de simplifier le langage. Je n'ai pas le lien ici et je pense que cet émail est déjà bien assez long comme cela. Les minutes sont disponibles une semaine après chaque réunion. Il est possible aussi aux gens qui le désirent de participer.

J'essaierais de répondre à toutes les questions mais je n'ai pas toutes les réponses loin de là. Je n'ai pas abordé volontairement tous les aspects, et j'ai essaye d'être aussi neutre que possible dans la présentation mais il est clair que je n'ai réussi à faire cela parfaitement.

Trop longue, Emilie Laffray