Développement d'un logiciel destiné aux admistrations publiques européennes permettant la désidentification des données issues de documents comportant des informations personnelles (dossiers médicaux, jugements, etc). Cet outil permettra la constitution de corpus pour l'entraînement de systèmes de traitement automatique des langues. Le LIMSI est en charge de l'évaluation de l'outil.
Responsable scientifique LIMSI
Pierre Zweigenbaum
Financeur
Union Européenne (CEF - Connecting Europe Facility)
Date de début
Janvier 2020
Partenaires
1. Pangeanic - B.I. EUROPA SL (Pangeanic, coordinator) - Espagne
2. Ministry of Economic Affairs and Digital Transformation represented by the Secretary of State for Digital Advancement (SEAD) - Espagne
3. TILDE SIA (Tilde) - Lettonie
4. Università ta’ Malta (UM) - Malte
5. Fundacion Centro de Tecnologias de Interaccion Visual y Comunicaciones VICOMTECH (VICOM) - Espagne
6. Evaluations and Language Resources Distribution Agency (ELDA) - France
7. Centre National de la Recherche Scientifique (CNRS) - France
Plus d'informations sur le site du projet : https://mapa-project.eu/