Open data des décisions de justice et IA appliqué au droit : état des lieux, enjeux et défis actuels
Où en est l’ouverture et la diffusion des décisions de justice ? Quels défis représente le traitement de cette masse de données par des solutions d’intelligence artificielle ? Éclairage.
Vingt mille visites par jour. C’est aujourd’hui le nombre moyen de consultations de Judilibre, le site internet de la Cour de cassation qui permet de faire des recherches dans l’ensemble des décisions de justice diffusées en open data. Soit « trois millions de vues depuis le début de l’année 2024 », et « je n’exclus pas les visites de robots », a relevé la directrice du service de documentation, des études et du rapport de la Cour de cassation, Sandrine Zientara-Logeay, lors d’un atelier sur l‘avenir de l’information juridique, organisé dans le cadre de la 5e édition du Grenelle du droit, le 12 juin dernier.
Open data des décisions de justice : un déploiement par étapes
La base de données de Judilibre contient actuellement 910 000 décisions diffusées en open data, dont 530 000 décisions de la Cour de cassation, 351 000 décisions des cours d’appel et 27 300 décisions de tribunaux judiciaires. Cette base de données croît rapidement à mesure que la Cour de cassation déploie l’open data dans l’ensemble des tribunaux français. Un arrêté publié en 2021 fixe le planning du déploiement. À terme, ce sont trois à quatre millions de décisions de justice (rendues publiquement) qui seront diffusées en open data, chaque année.
Après les décisions de la Cour de cassation et les décisions civiles et commerciales des cours d’appel, c’est au tour des tribunaux judiciaires. Un premier lot de 24 tribunaux judiciaires a été suivi de 15 autres mi-mai, avant 24 autres mi-septembre. Tous les tribunaux judiciaires devraient être passés à l’open data, d’ici fin 2025.
En parallèle, la diffusion des décisions des tribunaux de commerce est prévue d’ici fin 2024 – « j’espère que nous allons y arriver », a commenté la magistrate – et celle des conseils de prud’hommes, pour fin 2025 – « j’espère que l’on va y arriver également ».
Enfin, en ce qui concerne les décisions rendues par les juridictions de jugement en matière pénale, la diffusion en open data était initialement prévue pour fin 2024 pour les tribunaux de police et les tribunaux correctionnels, et échelonnée jusqu’à fin 2025 pour le reste. « Mais nous savons d’ores et déjà que nous ne pourrons pas le faire en 2024, pour des raisons juridiques et techniques, nous le ferons un peu plus tard. » L’arrêté va devoir être modifié en ce sens.
Quantité versus qualité : un défi pour les solutions d’IA
« Une donnée est un élément brut. Une information est une donnée travaillée pour être intelligible et compréhensible », a rappelé Valérie-Laure Benabou, professeur de droit à Paris Saclay et spécialiste du droit de la propriété intellectuelle et du droit du numérique. « Nous sommes face à une inflation vertigineuse de la donnée, à une approche volumétrique et à une difficulté de passer de la data à de l’information, c'est-à-dire à mettre en forme ces données pour les rendre intelligibles par nous. » Et c’est là un des grands enjeux du traitement des données juridiques par des solutions basées sur l’IA.
« Auparavant, il y avait des intermédiaires – avocats, magistrats, professeurs de droit…– pour faire ça, le passage de la donnée à l’information juridique, avec tout le prisme de la subjectivité assumée par ces auteurs » qui contribuent à la doctrine, aux commentaires et à la critique. Avec les outils logiciels, « on vous dit que l’on va tout araser, tout mouliner et vous donner une réponse objective ». Or, « le fait de mouliner toutes les données conduit à une information juridique différente, parce que les hiérarchisations ont disparu. » C’est « une petite révolution copernicienne », a conclu l’universitaire, et « c’est avec ça que l’on va devoir travailler, désormais ». Alors comment faire pour préserver le discernement, l’esprit critique ? « Lorsque l’on forme les gens à utiliser ces outils, il faut absolument les former aux limites de l’outil. »
Vers une réintroduction de la hiérarchisation des décisions
À la Cour de cassation, « nous réfléchissons à rétablir une hiérarchisation entre les décisions », a déclaré la magistrate Sandrine Zientara-Logeay. « Cette hiérarchisation peut être créée par la doctrine, bien sûr, mais elle peut également être faite par les magistrats eux-mêmes, et c’est ce que nous faisions traditionnellement à la Cour de cassation, en ne publiant qu’une sélection de décisions. Depuis février dernier, nous avons relancé un processus de hiérarchisation des décisions des juridictions du fond qui doivent signaler celles qui présentent un intérêt juridique particulier. Ces décisions apparaîtront sur Judilibre avec la mention ‘IP’ pour ‘intérêt particulier’. Le moteur de recherche donnera ces décisions en premier lieu, et il y aura aussi la possibilité de ne faire de recherches que sur ces décisions présentant un intérêt particulier. »
Pseudonymisation semi-automatique des décisions grâce à l’IA
La Cour de cassation a recours à l’IA pour la pseudonymisation semi-automatique des décisions de justice avant leur diffusion. « Une cellule d’annotateurs d’une vingtaine de personnes assure une relecture humaine de certaines décisions, en fonction de certains critères, afin de garantir la protection de la vie privée mieux encore que ne peut le faire la machine. Cette équipe contribue à l’apprentissage constant de la machine », a-t-elle poursuivi. Toujours avec l’aide de l’IA, « une équipe travaille sur les recherches de divergences dans les décisions de la Cour », et « nous avons encore d’autres projets et programmes ».
Pour les magistrats, un outil d’aide à la recherche documentaire
Pour les magistrats, cette technologie est utilisée pour faciliter la recherche documentaire. « L’IA, c’est une première étape de recherche des éléments documentaires qui vont faciliter la tâche des magistrats. Ensuite, il y a tout un raisonnement critique, contextualisé, axiologique – sur le contrôle de proportionnalité –, et la part du doute, qui vont garantir la vitalité de la jurisprudence et sa capacité à s’adapter aux évolutions sociétales. »
Quid du recours à l’IA comme outil d’aide à la décision ? « Des réflexions sont en cours sur l’utilisation d’une IA générative pour générer des trames de décisions », a répondu la magistrate. Sur ce terrain, « il n’y a pas d’obstacle de principe, mais l’idée c’est qu’il faut toujours préserver la capacité du juge à individualiser la décision, à appliquer le droit au fait. Or, si on produit des trames automatiques, il y a un risque que le juge soit happé par l’automatisation : face au produit fini produit par la machine, est-ce que le juge, du fait de sa masse de travail, va faire l’effort de s’éloigner de ce que proposera la machine ? » C’est pourquoi, « pour l’instant, nous n’utilisons pas encore l’IA dans la phase décisionnelle. Je pense que ce serait dommage de s’en priver, mais cela ne peut pas se faire sans un travail préalable de définition des limites, de ce que peut ou ne doit pas faire l’IA. »