| Imprimer |
| Effectiveness of a commercial AI Tools for Chest X-Ray Interpretation : a real-world multicentric, multireader, multicase study. (Évaluation de l’efficacité d’un outil d’intelligence artificielle commercial pour l’interprétation des radiographies thoraciques : une étude multicentrique, multilecteur et multicas en conditions réelles) Rabeau, Valentin - (2024-10-09) / Universite de Rennes Effectiveness of a commercial AI Tools for Chest X-Ray Interpretation : a real-world multicentric, multireader, multicase study.
| |||
Langue : Anglais Directeur(s) de thèse: Herpe, Guillaume Discipline : Médecine Classification : Médecine et santé Mots-clés : Radiographie thoracique, Intelligence artificielle, Urgence, Etude rétrospective, Cross over, Vie réelle
| |||
Résumé : Introduction : Les radiographies thoraciques (RT) sont l’un des examens diagnostiques les plus courants. Si tous les radiologues sont confrontés à l’interprétation des radiographies thoraciques, celle-ci reste complexe et source d’incertitudes diagnostiques. L’utilisation d’outils d’intelligence artificielle (IA) pour assister dans la lecture de ces radiographies a été explorée dans de nombreuses études sur des échantillons contrôlés. Cependant les données sur les performances des lecteurs avec IA en conditions réelles aux urgences sont encore limitées. Matériels et Méthodes : Cette étude rétrospective en cross over a inclus des patients adultes consécutifs aux urgences ayant bénéficié de RT en incidence postéro-antérieure. L’objectif était d’évaluer les performances de la lecture des RT dans des conditions proches de la réalité, par plusieurs lecteurs de différents centres de niveaux d’expérience variés (allant des radiologues internes de première à cinquième année, aux radiologues seniors et médecins urgentistes), avec et sans l’aide de l’IA. Les performances ont été évaluées globalement et dans des sous-groupes à l’aide de paramètres statistiques standard tels que la sensibilité, la spécificité, la valeur prédictive positive et la valeur prédictive négative, ainsi que des scores de précision et de reproductibilité. Résultats : Un total de 62 lecteurs a participé à l'interprétation de 119 cas de RT, avec et sans assistance de l'IA. Les résultats ont montré une amélioration significative des performances globales, incluant la sensibilité, la spécificité et la précision équilibrée. Les analyses des sous-groupes, basées sur les anomalies radiographiques et les niveaux d'expérience des lecteurs, ont révélé des améliorations significatives, notamment chez les radiologues internes de première année, les médecins urgentistes et pour la détection des cas critiques telles que le pneumothorax, les fractures et l’épanchement pleural. Conclusion : Cette étude en conditions réelles suggère que l’intégration d’outils d'IA pour assister l’interprétation des RT aux urgences améliore la précision diagnostique, l’efficacité et la reproductibilité des lecteurs. Le grand nombre de lecteurs et leurs niveaux d'expérience variés renforcent les résultats, reflétant les conditions de travail quotidiennes aux urgences. Ces conclusions offrent des pistes pour améliorer l’efficacité d’interprétation et le flux des examens radiographiques aux urgences. Abstract : Introduction : Chest X-Rays (CxR) are one of the most common diagnostic examinations. While all radiologists are confronted with the interpretation of CxR, it remains complex and a source of diagnostic uncertainty. The use of artificial intelligence (AI) tools to assist in the reading of these radiographs has been explored in numerous studies on controlled samples. However, data on the performance of AI-assisted readers in real-life conditions in the emergency department are still limited. Materials and Methods : This retrospective cross-over study included consecutive adult emergency patients who underwent posteroanterior CxR. The objective was to assess the performance of CxR interpretation in conditions close to real-life by several readers from different centers with varying levels of experience (ranging from first- to fifth-year radiology residents, to senior radiologists and emergency physicians), with and without the aid of AI. Performance was assessed overall and in subgroups using standard statistical parameters such as sensitivity, specificity, positive predictive value and negative predictive value, as well as accuracy and reproducibility scores. Results : A total of 62 readers participated in the interpretation of 119 CxR cases, with and without AI assistance. Results showed a significant improvement in overall performance, including sensitivity, specificity and balanced accuracy. Subgroup analyses, based on radiographic abnormalities and readers' experience levels, revealed significant improvements, particularly among first-year radiology residents, emergency physicians and for the detection of critical cases such as pneumothorax, fractures and pleural effusion. Conclusion : This real-life study suggests that integrating AI tools to assist CxR interpretation in the emergency department improves improves diagnostic accuracy, efficiency, and reader reproducibility. The large number of readers and their varied levels of experience reinforce the results, reflecting the day-to-day working conditions in emergency departments. These findings provide insights for improving interpretation efficiency and the workflow of radiographic examinations in the emergency department. | |||