Présentation de la société : CNRS
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.
Missions
Sujet de thèse :
Présentation du sujet de thèse et du projet :
Contexte : Pour assurer un accès équitable aux produits et services essentiels aux personnes en situation de handicap, l’Union européenne a adopté en 2019 l’European Accessibility Act. Cette directive exige notamment que les livres numériques publiés soient disponibles dans un format accessible aux personnes ne pouvant pas lire visuellement. Cependant, les bandes dessinées, en raison de leur complexité visuelle et narrative, ont obtenu une exemption temporaire de la part de l’ARCOM. En France, les bandes dessinées accessibles sous forme audio restent rares et reposent sur des adaptations manuelles, nécessitant un travail éditorial et artistique lourd et coûteux. Bien que ces versions offrent une expérience d’écoute riche, le coût et la complexité de cette adaptation en limitent le nombre au regard des milliers de bandes dessinées publiées chaque année.
La thèse BD-Access s’inscrit dans le cadre du projet ANR EnACA (ENhancing Accessibility in Comic Albums) qui vise à combler ce fossé en matière d'accessibilité en tirant parti des avancées dans les domaines de l'intelligence artificielle et des sciences cognitives. La restitution d’une bande dessinée visuelle en narration audio ne consiste pas à seulement restituer oralement les informations textuelles et décrire les images associées, mais nécessite de construire un récit auditif à partir d’un objet multimédia. Il est tout d’abord nécessaire d’extraire de manière robuste les différents éléments constitutifs de la bande dessinée (détection des cases et des bulles, reconnaissance du texte, segmentation et identification des personnages) , puis de structurer ces informations afin de produire une narration cohérente respectant l’intention narrative et la progression de l’histoire. Dans ce cadre, les approches fondées sur l’intelligence artificielle ouvrent des perspectives concrètes pour automatiser l’analyse des planches, la mise en relation des éléments et la génération de scripts de narration.
Le Projet EnACA vise à développer une chaîne outillée allant de l’analyse automatique des bandes dessinées à la génération de narrations audio, tout en articulant ces développements avec une évaluation cognitive auprès de publics déficients visuels et une intégration dans les standards et technologies de lecture.
Le projet mobilise une approche interdisciplinaire reposant sur la collaboration entre des spécialistes de l'analyse de textes et d'images, du traitement du langage naturel, des grands modèles linguistiques, des modèles vision-langage, de l'apprentissage profond et de la psychologie et de l’ergonomie cognitives. Le consortium du projet EnACA regroupe le laboratoire Informatique Image et Interaction (L3I/EA2118, Université La Rochelle) , le laboratoire d'Informatique Fondamentale d'Orléans (LIFO/EA 4022, Université d’Orléans) , le laboratoire Cognition, Langues, Langage, Ergonomie (CLLE/UMR
Voir plus sur le site emploi.cnrs.fr…
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers) , en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Profil recherché
Contraintes et risques :
Le premier risque identifié a trait à l’accès à la population des personnes déficientes visuelles, qui est au cœur du projet. Le.la doctorant.e pourra s’appuyer sur le soutien de l’association Valentin Haüy dans le cadre du programme « lecteur pilote » qui compte plus de 200 participants identifiés pour des tests utilisateurs. De plus, au sein de la bibliothèque en ligne EOLE de cette même association, qui dessert 17 000 utilisateurs, il existe un vivier diversifié de participants potentiels.
Le recrutement des participants et les passations expérimentales pourront supposer des déplacements en France. Le recrutement des participants d’ adultes tout venant pourra s’appuyer sur des dispositifs internes à l’université et à l’ UFR de Psychologie.
Le second risque a trait au fait que la qualité et la pertinence des narrations audio immersives devant faire l’objet d’évaluations expérimentales dépend des performances des techniques d’IA utilisées. Une solution de repli pourra consister à évaluer des narrations audio générées manuellement ou semi-automatiquement.
Des déplacements en France et à l'étranger sont à prévoir.