<?xml version="1.0" encoding="UTF-8"?><mets:mets xmlns:mads="http://www.loc.gov/mads/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:tef="http://www.abes.fr/abes/documents/tef" xmlns:metsRights="http://cosimo.stanford.edu/sdr/metsrights/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mets="http://www.loc.gov/METS/">
    <mets:metsHdr ID="rennes1-ori-wf-1-20840" CREATEDATE="2025-03-28T10:21:45" LASTMODDATE="2025-03-28T10:21:46">
  <mets:agent ROLE="CREATOR">
            <mets:name>Université de Rennes</mets:name>
        </mets:agent>
</mets:metsHdr>
    <mets:dmdSec ID="desc_expr" CREATED="2025-03-28T10:21:45">
  <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_these">
            <mets:xmlData>
                <tef:thesisRecord>
     <dc:title xml:lang="fr">Réutilisation de données de santé massives sécurisée par IA : désidentification par apprentissage automatique pour des systèmes d'information apprenants fédérés</dc:title>
     <dcterms:alternative xml:lang="en">Secure Reuse of Massive Health Data with AI: De-identification through Machine Learning for Federated Learning Information Systems</dcterms:alternative>
     <dc:subject xml:lang="fr">Dossiers Médicaux Électroniques (DME)</dc:subject><dc:subject xml:lang="fr">Désidentification Automatique</dc:subject><dc:subject xml:lang="fr">Traitement Automatique du Langage Naturel (TALN)</dc:subject><dc:subject xml:lang="fr">Apprentissage Fédéré</dc:subject>
     <dc:subject xml:lang="en">Electronic Health Records (EHRs)</dc:subject><dc:subject xml:lang="en">Automatic De-identification</dc:subject><dc:subject xml:lang="en">Natural Language Processing (NLP)</dc:subject><dc:subject xml:lang="en">Federated Learning</dc:subject>
     <tef:sujetRameau><tef:vedetteRameauNomCommun>
						<tef:elementdEntree autoriteSource="Sudoc" autoriteExterne="286807270">Dossiers médicaux électroniques</tef:elementdEntree>
					</tef:vedetteRameauNomCommun><tef:vedetteRameauNomCommun>
						<tef:elementdEntree autoriteSource="Sudoc" autoriteExterne="027985830">Traitement automatique du langage naturel</tef:elementdEntree>
					</tef:vedetteRameauNomCommun><tef:vedetteRameauNomCommun>
						<tef:elementdEntree autoriteSource="Sudoc" autoriteExterne="027940373">Apprentissage automatique</tef:elementdEntree>
					</tef:vedetteRameauNomCommun><tef:vedetteRameauNomCommun>
						<tef:elementdEntree autoriteSource="Sudoc" autoriteExterne="027355276">Médecine -- Informatique</tef:elementdEntree>
					</tef:vedetteRameauNomCommun></tef:sujetRameau>
     
     
     
     <dcterms:abstract xml:lang="fr">Cette thèse aborde les enjeux et solutions liés à la réutilisation des données de santé, en mettant l'accent sur la protection de la vie privée des patients tout en permettant l'exploitation des données des dossiers médicaux électroniques (DME) pour la recherche clinique et l'amélioration des services de santé. Dans un premier temps, nous explorons le contexte général de la réutilisation des données clinique, en soulignant leur potentiel pour la recherche, tout en identifiant les principaux défis : la protection de la confidentialité, les contraintes réglementaires et les obstacles techniques. Ensuite, nous proposons une approche innovante pour désidentifier automatiquement les DME en français, en conformité avec le RGPD et les directives de la CNIL. En exploitant des techniques avancées d'apprentissage profond et des méthodes de supervision distante, nous avons démontré une solution économiquement viable pour rendre ces données réutilisables en toute sécurité. Les modèles développés, basés sur des représentations linguistiques avancées, montrent des performances prometteuses pour la reconnaissance des entités sensibles dans le texte médical. Dans une autre phase de nos travaux, nous avons étudié l'application de l'apprentissage fédéré (FL) pour l'extraction sécurisée d'informations personnelles à partir des DME. FL permet d’entrainer des modèles collaboratifs entre plusieurs institutions sans centraliser les données sensibles, préservant ainsi la confidentialité des patients. Nos résultats montrent que les modèles fédérés atteignent des performances proches des modèles centralisés tout en maintenant une protection des données. Par exemple, en utilisant le modèle BERT multilingue dans un environnement fédéré simulant 20 hôpitaux, notre modèle fédéré a obtenu un score F1 de 75,7 %, proche des 78,5 % de l'approche centralisée, mettant en évidence le potentiel de FL pour l'analyse de données de santé tout en réduisant les risques liés à la confidentialité. Enfin, nous avons exploré les vulnérabilités de l'apprentissage fédéré, notamment les attaques exploitant les gradients partagés pour extraire des informations sensibles. Nous avons simulé l'attaque "Decepticons", révélant que des données personnelles telles que les identifiants des patients et des observations médicales peuvent être récupérées avec des taux alarmants allant jusqu'à 90 %. En réponse, nous discutons de contre-mesures telles que la confidentialité différentielle et l'agrégation sécurisée, tout en insistant sur la nécessité d'améliorer ces défenses face à des menaces de plus en plus sophistiquées. Ces travaux ouvrent la voie à des avancées futures pour renforcer la sécurité des systèmes d'apprentissage fédéré, en développant des mécanismes adaptatifs et spécifiquement adaptés aux données médicales.</dcterms:abstract>
     <dcterms:abstract xml:lang="en">This thesis addresses the challenges and solutions related to the reuse of health data, focusing on protecting patients' privacy while enabling the exploitation of electronic health record (EHR) data for clinical research and improving healthcare services. First, we explore the general context of health data reuse, emphasizing its potential for clinical research while identifying key challenges: confidentiality protection, regulatory constraints, and technical obstacles. Next, we propose an innovative approach for the automatic de-identification of French EHRs, in compliance with GDPR and CNIL guidelines. By leveraging advanced deep learning techniques and distant supervision methods, we demonstrated a cost-effective solution to securely render these data reusable. The developed models, based on advanced linguistic representations, show promising performance in recognizing sensitive entities within medical texts. In another phase of our work, we studied the application of federated learning (FL) for the secure extraction of personal information from EHRs. FL allows the training of collaborative models across multiple institutions without centralizing sensitive data, thereby preserving patient confidentiality. Our results show that federated models achieve performance levels close to centralized models while maintaining data protection. For instance, using the multilingual BERT model in an FL environment simulating 20 hospitals, our federated model achieved an F1 score of 75.7%, close to the 78.5% of the centralized approach, highlighting the potential of FL for health data analysis while mitigating privacy risks. Finally, we explored the vulnerabilities of federated learning, particularly attacks exploiting shared gradients to extract sensitive information. We simulated the "Decepticons" attack, revealing that personal data, such as patient identifiers and medical observations, could be retrieved at alarming rates of up to 90%. In response, we discuss countermeasures such as differential privacy and secure aggregation, emphasizing the need to enhance these defenses against increasingly sophisticated threats. This work paves the way for future advancements in strengthening the security of federated learning systems by developing adaptive mechanisms specifically tailored to medical data.</dcterms:abstract>
     <dc:type>Electronic Thesis or Dissertation</dc:type><dc:type xsi:type="dcterms:DCMIType">Text</dc:type>
     <dc:language xsi:type="dcterms:RFC3066">en</dc:language>
    </tef:thesisRecord>
            </mets:xmlData>
        </mets:mdWrap>
</mets:dmdSec>
    <mets:dmdSec ID="desc_edition" CREATED="2025-03-28T10:21:45">
  <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">
            <mets:xmlData>
                <tef:edition><dcterms:medium xsi:type="dcterms:IMT">application/pdf</dcterms:medium><dcterms:extent>1 : 5158 Ko</dcterms:extent><dc:identifier xsi:type="dcterms:URI">https://ged.univ-rennes1.fr/nuxeo/site/esupversions/cbafd677-5979-4435-9bfe-99e5fc26022c</dc:identifier></tef:edition>
            </mets:xmlData>
        </mets:mdWrap>
</mets:dmdSec>
    <mets:amdSec>
        <mets:techMD ID="admin_expr">
            <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_admin_these">
                <mets:xmlData>
                    <tef:thesisAdmin>
                        <tef:auteur>
       <tef:nom>El Azzouzi</tef:nom>
       <tef:prenom>Mohamed</tef:prenom>
       
       <tef:dateNaissance>1994-12-09</tef:dateNaissance>
       <tef:nationalite scheme="ISO-3166-1">MA</tef:nationalite>
       <tef:autoriteExterne autoriteSource="Sudoc">286808935</tef:autoriteExterne>
       <tef:autoriteExterne autoriteSource="mailPerso">mohamed1elazzouzi@gmail.com</tef:autoriteExterne>
      </tef:auteur>
                        <dc:identifier xsi:type="tef:NNT">2025URENB011</dc:identifier>
                        <dc:identifier xsi:type="tef:nationalThesisPID">http://www.theses.fr/2025URENB011</dc:identifier>
                        <dcterms:dateAccepted xsi:type="dcterms:W3CDTF">2025-05-07</dcterms:dateAccepted>
                        <tef:thesis.degree>
                            <tef:thesis.degree.discipline xml:lang="fr">Analyse et traitement de l'information et des images médicales</tef:thesis.degree.discipline>
                            <tef:thesis.degree.grantor>
        <tef:nom>Université de Rennes</tef:nom><tef:autoriteInterne>thesis.degree.grantor_1</tef:autoriteInterne>
        
        <tef:autoriteExterne autoriteSource="Sudoc">26693823X</tef:autoriteExterne>
       </tef:thesis.degree.grantor>
                            <tef:thesis.degree.level>Doctorat</tef:thesis.degree.level>
                        </tef:thesis.degree>
                        <tef:theseSurTravaux>non</tef:theseSurTravaux>
                        <tef:avisJury>oui</tef:avisJury><tef:directeurThese><tef:nom>Cuggia</tef:nom><tef:prenom>Marc</tef:prenom><tef:autoriteInterne>intervenant_1</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">079366341</tef:autoriteExterne></tef:directeurThese><tef:directeurThese><tef:nom>Coatrieux</tef:nom><tef:prenom>Gouenou</tef:prenom><tef:autoriteInterne>intervenant_2</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">07413924X</tef:autoriteExterne></tef:directeurThese><tef:presidentJury><tef:nom>Ficheur</tef:nom><tef:prenom>Grégoire</tef:prenom><tef:autoriteInterne>intervenant_3</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">148926452</tef:autoriteExterne></tef:presidentJury><tef:membreJury><tef:nom>Cuggia</tef:nom><tef:prenom>Marc</tef:prenom><tef:autoriteInterne>intervenant_1</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">079366341</tef:autoriteExterne></tef:membreJury><tef:membreJury><tef:nom>Coatrieux</tef:nom><tef:prenom>Gouenou</tef:prenom><tef:autoriteInterne>intervenant_2</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">07413924X</tef:autoriteExterne></tef:membreJury><tef:membreJury><tef:nom>Bellafqira</tef:nom><tef:prenom>Reda</tef:prenom><tef:autoriteInterne>intervenant_4</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">227588649</tef:autoriteExterne></tef:membreJury><tef:membreJury><tef:nom>Daniel</tef:nom><tef:prenom>Christel</tef:prenom><tef:autoriteInterne>intervenant_5</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">176713972</tef:autoriteExterne></tef:membreJury><tef:membreJury><tef:nom>Vincent</tef:nom><tef:prenom>Johanne</tef:prenom><tef:autoriteInterne>intervenant_6</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">259347426</tef:autoriteExterne></tef:membreJury><tef:rapporteur><tef:nom>Garcia-Alfaro</tef:nom><tef:prenom>Joaquin</tef:prenom><tef:autoriteInterne>intervenant_7</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">113064004</tef:autoriteExterne></tef:rapporteur><tef:rapporteur><tef:nom>Sauleau</tef:nom><tef:prenom>Erik-André</tef:prenom><tef:autoriteInterne>intervenant_8</tef:autoriteInterne><tef:autoriteExterne autoriteSource="Sudoc">070964408</tef:autoriteExterne></tef:rapporteur>
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
                        
                        <tef:ecoleDoctorale>
       <tef:nom>SVS</tef:nom><tef:autoriteInterne>ecoleDoctorale_1</tef:autoriteInterne>
       
       <tef:autoriteExterne autoriteSource="Sudoc">264825152</tef:autoriteExterne>
      </tef:ecoleDoctorale>
                        
                        
      <tef:partenaireRecherche type="laboratoire">
       <tef:nom>
Laboratoire de Traitement du Signal et de l'Image
</tef:nom><tef:autoriteInterne>partenaireRecherche_1</tef:autoriteInterne>
       
       <tef:autoriteExterne autoriteSource="Sudoc">
177793767
</tef:autoriteExterne>
      </tef:partenaireRecherche>
                        <tef:oaiSetSpec>ddc:610</tef:oaiSetSpec>
                        
                        
                        
                    <tef:MADSAuthority authorityID="intervenant_1" type="personal"><tef:personMADS><mads:namePart type="family">Cuggia</mads:namePart><mads:namePart type="given">Marc</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_2" type="personal"><tef:personMADS><mads:namePart type="family">Coatrieux</mads:namePart><mads:namePart type="given">Gouenou</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_3" type="personal"><tef:personMADS><mads:namePart type="family">Ficheur</mads:namePart><mads:namePart type="given">Grégoire</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_4" type="personal"><tef:personMADS><mads:namePart type="family">Bellafqira</mads:namePart><mads:namePart type="given">Reda</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_5" type="personal"><tef:personMADS><mads:namePart type="family">Daniel</mads:namePart><mads:namePart type="given">Christel</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_6" type="personal"><tef:personMADS><mads:namePart type="family">Vincent</mads:namePart><mads:namePart type="given">Johanne</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_7" type="personal"><tef:personMADS><mads:namePart type="family">Garcia-Alfaro</mads:namePart><mads:namePart type="given">Joaquin</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="intervenant_8" type="personal"><tef:personMADS><mads:namePart type="family">Sauleau</mads:namePart><mads:namePart type="given">Erik-André</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="thesis.degree.grantor_1" type="corporate"><tef:personMADS><mads:namePart>Université de Rennes</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="ecoleDoctorale_1" type="corporate"><tef:personMADS><mads:namePart>SVS</mads:namePart></tef:personMADS></tef:MADSAuthority><tef:MADSAuthority authorityID="partenaireRecherche_1" type="corporate"><tef:personMADS><mads:namePart>
Laboratoire de Traitement du Signal et de l'Image
</mads:namePart></tef:personMADS></tef:MADSAuthority></tef:thesisAdmin>
                </mets:xmlData>
            </mets:mdWrap>
        </mets:techMD><mets:techMD ID="file_1"><mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_tech_fichier"><mets:xmlData><tef:meta_fichier>
     <tef:encodage>ASCII</tef:encodage>
     <tef:formatFichier>PDF</tef:formatFichier>
     
     
     
     <tef:taille>5281432</tef:taille>
    </tef:meta_fichier></mets:xmlData></mets:mdWrap></mets:techMD>
        
        <mets:rightsMD ID="dr_expr_thesard">
            <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_auteur_these">
                <mets:xmlData>
                    <metsRights:RightsDeclarationMD>
                        <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
                            <metsRights:Permissions DISCOVER="true" DISPLAY="true" COPY="true" DUPLICATE="true" MODIFY="false" DELETE="false" PRINT="true"/>
                        </metsRights:Context>
                    </metsRights:RightsDeclarationMD>
                </mets:xmlData>
            </mets:mdWrap>
        </mets:rightsMD>
        <mets:rightsMD ID="dr_expr_univ">
            <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these">
                <mets:xmlData>
                    <metsRights:RightsDeclarationMD>
                        <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
                            <metsRights:Permissions DISCOVER="true" DISPLAY="true" COPY="true" DUPLICATE="true" MODIFY="false" DELETE="false" PRINT="true"/>
                        </metsRights:Context>
                    </metsRights:RightsDeclarationMD>
                </mets:xmlData>
            </mets:mdWrap>
        </mets:rightsMD>
        <mets:rightsMD ID="dr_version">
            <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version">
                <mets:xmlData>
                    <metsRights:RightsDeclarationMD>
                        <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
                            <metsRights:Permissions DISCOVER="true" DISPLAY="true" COPY="true" DUPLICATE="true" MODIFY="false" DELETE="false" PRINT="true"/>
                        </metsRights:Context>
                    </metsRights:RightsDeclarationMD>
                </mets:xmlData>
            </mets:mdWrap>
        </mets:rightsMD>
    </mets:amdSec>
    <mets:fileSec>
  <mets:fileGrp ID="FGrID1" USE="archive"><mets:file ID="FID1" ADMID="file_1" MIMETYPE="application/pdf" USE="maitre"><mets:FLocat LOCTYPE="URL" xlink:href="https://ged.univ-rennes1.fr/nuxeo/site/esupversions/cbafd677-5979-4435-9bfe-99e5fc26022c"/></mets:file></mets:fileGrp>
 </mets:fileSec>
    <mets:structMap TYPE="logical">
        <mets:div DMDID="desc_expr" ADMID="dr_expr_thesard dr_expr_univ admin_expr" TYPE="THESE" CONTENTIDS="http://ori-oai-search.univ-rennes1.fr/uid/rennes1-ori-wf-1-20840/oeuvre">
            <mets:div ADMID="dr_version" TYPE="VERSION_COMPLETE" CONTENTIDS="http://ori-oai-search.univ-rennes1.fr/uid/rennes1-ori-wf-1-20840/oeuvre/version">
                <mets:div DMDID="desc_edition" TYPE="EDITION" CONTENTIDS="http://ori-oai-search.univ-rennes1.fr/uid/rennes1-ori-wf-1-20840/oeuvre/version/edition">
                    <mets:fptr FILEID="FGrID1"/>
                </mets:div>
            </mets:div>
        </mets:div>
    </mets:structMap>
</mets:mets>