Le pouvoir des statistiques

1 Février 2019 Economie numérique

Le domaine de recherche d’Eve comprend l’ensemble des méthodes statistiques appliquées aux données qui correspondent à des durées — telles que les durées de vie, les périodes de chômage ou de mariage — et sont souvent censurées. Les données censurées font partie de structures de données complexes dans lesquelles seules des informations partielles sur les variables d’intérêt sont disponibles. La censure survient lorsque l’événement d’intérêt — comme la mort, la recherche d’un emploi ou le divorce — n’intervient pas pendant la période de suivi du sujet. 

Dans ce domaine, Eve travaille dans le champ des risques concurrents. Ces scénarios se produisent lorsqu’un individu est à risque sur plusieurs types d’événements, comme c’est le cas pour les patients cancéreux dans la phase post-thérapeutique. Elle s’intéresse également à la sélection de variables dans les modèles de survie en grande dimension, ce qui est particulièrement pertinent en oncologie. Depuis le séquençage du génome, les cliniciens ont maintenant à leur disposition une quantité colossale d’informations génétiques. L’analyse statistique permet d’identifier la combinaison de gènes qui permet le mieux de prédire la survie des patients atteints de cancer, fournissant ainsi une estimation plus précise de leur durée de survie. Cette information peut être extrêmement utile pour adapter le traitement aux besoins du patient.

L’objectif des MADS est d’animer et de développer des activités de recherche en mathématiques appliquées à l’économie. Les sujets comprennent la recherche opérationnelle, les mathématiques pour la finance, les statistiques, l’économétrie, la théorie des jeux, l’optimisation, le calcul des variations et des EDP, les modèles mathématiques en économie, en finance et en sciences sociales. 

Un exemple d’application de la méthodologie statistique du groupe MADS aux données économiques est le projet conjoint d’Eve Leconte et Sandrine Casanova. Leurs recherches visent à modéliser la fonction de distribution cumulative d’une durée censurée dans le contexte des enquêtes par échantillonnage, pour une population finie ou dans des domaines qui peuvent être restreints. Les estimateurs qu’elles proposent sont basés sur une régression quantile non paramétrique adaptée au cas des variables censurées. Dans la région Occitanie, ce travail a, entre autres, permis d’estimer la distribution des temps d’accès au premier emploi pour les femmes diplômées, en fonction de leur niveau d’éducation et de leur domaine de compétence.

Dans un autre projet mené par l’équipe MADS, Christine ThomasThibault Laurent et Anne Ruiz-Gazen travaillent avec le doctorant An Huong Nguyen sur la modélisation des données des élections départementales françaises, en tenant compte de certaines caractéristiques socio-économiques et géographiques. Cela nécessite une méthodologie statistique spécifique et les chercheurs ont pour objectif de fournir dans ce contexte de nouveaux estimateurs de régression.

Extrait du TSE Mag#18 Eté 2018