Laboratoire LEMAR – 2018
Patrice BREHMER et Sophie Dabo
Régional
Université Alioune Diop de Bambey (UADB), European Mathematical Society-Simons for Africa (EMS), Campus France
Début du projet
18/03/2019
Fin du projet
18/03/2022
Les données volumineuses et complexes avec une composante dynamique de l’espace et/ou du temps abondent dans de nombreux domaines d’étude (Dabo-Niang et al. (2004) dans le domaine de la géophysique ; Bayle, Monestiez et Nerini (2014) sur des données océanographiques ; Crambes et al. (2009) sur des données de consommation d’énergie) en particulier dans la description des systèmes, atmosphérique, hydrologique, océanologique, où l’étude des relations entre variables constituées de vecteurs dimensionnels élevés et/ou de composantes fonctionnelles, revêt une importance de premier ordre pour la compréhension du fonctionnement de ces systèmes naturels. Pour un problème de très haute dimension, la réduction dimensionnelle est une approche courante. En général, pour résoudre ce problème de dimension, un grand nombre de méthodes de régression multivariées faisant appel à des prédicteurs de grande dimension considèrent la dimension comme un paramètre de nuisance et utilisent des conditions de faible densité, essentiellement pour des raisons de commodité (Izenman, 2008).
L’analyse fonctionnelle des données (ADF) peut être une alternative à ces modélisations multivariées en transformant des données de très haute dimension en données fonctionnelles, c’est-à-dire des objets de données, tels que des courbes, des formes, des images ou un objet mathématique plus complexe, pensé comme des réalisations lisses d’un processus stochastique, qui est un objet de données de dimensions infinies. Plutôt que d’utiliser des modèles de corrélation entre prédicteurs, toutes les données provenant de variables multidimensionnelles observées pour plusieurs unités spatiales dépendantes peuvent être analysées par les méthodes de l’ADF en tirant parti de la dimensionnalité élevée des prédicteurs. Fondamentalement, les objets de l’ADF correspondent à la réalisation d’un processus stochastique, généralement supposé lisse sur un continuum et se situe dans un espace métrique, semi-métrique, de Hilbert ou de Banach.
Dans ce projet, nous essayons de modéliser et de prédire les données océanologiques à haute dimension par l’ADF pour une meilleure gestion des ressources en eau et des ressources halieutiques. Le principal objectif du projet sera de déterminer le(s) paramètre(s) environnemental(s) clé(s) dans la structuration spatiale des organismes marins en trois dimensions i.e. l’écosystème pélagique. En effet, l’équipe dispose d’un ensemble original de données océanologiques acquise dans le cadre du projet tripartite AWA (IRD-BMBF www.awa.ird.fr). Ces données, de nature fonctionnelle et spatiale (scanfish, sonde CTD, satellite, acoustique), collectées le long de la côte du Sénégal et de la Mauritanie dans l’écosystème d’upwelling (remontée d’eau favorisant la productivité de l’écosystème) de l’actuel grand écosystème marin des Canaries (Auger et al 2016), en utilisant une méthode dite d’approche directe, à l’aide de système d’observations embarqués, e.g. acoustique multifréquences, sonar et sondeur multifaisceaux, à bord des navires de recherche comme la Thalassa (Ifremer) et l’Antea (IRD) couplée à des observations environnementales in situ originales des paramètres physiques (e.g. température, salinité), chimiques et biologiques en trois dimensions, mise à disposition suite à leurs extraction nettoyage et pré analyses. Ce projet vise à développer des méthodes novatrices et pratiques pour les prévisions de l’évolution des ressources halieutiques soumis à des variations des facteurs abiotiques. Pour y parvenir, nous considérons l’analyse des données fonctionnelles (ADF) (Ramsay et Silverman, 2005), un cadre statistique où la donnée est une courbe (Horváth et Kokoszka, 2012). Dans ce cadre, les différentes variables (e.g. température, salinité, Sv, etc.) mesurées à différents points de profondeur, sont vue comme des courbes (fonctions) représentant toute la variabilité des données étudiées. Ainsi la mise en place d’une méthode de régression pleinement fonctionnelle prenant en compte l’aspect spatial permettra de mieux quantifier l’impact des facteurs environnementaux mais aussi de prédire l’évolution de ces ressources dans sa globalité mais pas de façon ponctuelle. Nous avons également à notre disposition une base de données physico-chimiques et microbiologiques issues d’une campagne AWATOX qui a été réalisée sur la presqu’ile de Dakar. Contrairement aux données issues du projet AWA, celles-ci ont été mesurées sur peu de sites et relativement distants. Les mêmes méthodes fonctionnelles seront appliquées et comparées aux méthodes de la statistique classique.
Ce projet de thèse s’inscrit dans le cadre de la recherche appliquée, elle se déroule en deux étapes. La première consiste à proposer un modèle de régression spatio-fonctionnel. Après validation, nous pourrons l’appliquer sur les jeux de données environnementales. Le plan de travail de notre approche se déclinera ainsi :
- Décrire et étudier la structuration spatiale des organismes marins pélagiques en trois dimensions.
- Faire des analyses exploratoires fonctionnels spatiaux (analyses factorielles, classification,) afin Identifier des différences (ou les ressemblances) entre les points d’échantillonnage du point de vue des facteurs abiotiques et des types de polluants.
- Mettre en place une modélisation non paramétrique fonctionnelle de la toxicité globale des sédiments en fonction des paramètres chimiques et microbiologiques.
- Mettre en place une modélisation spatiale et fonctionnelle des populations de poissons exploités, des communautés planctoniques en fonction des facteurs environnementaux.
- Faire des prévisions spatio-fonctionnelles ; des comparaisons seront réalisées avec les méthodes de prévisions usuelles.
- Effectuer des tests fonctionnels de détection de ruptures
Collaborateurs
- LPP (Laboratoire Paul Painlevé de l’Université de Lille), France
- ISRA-CRODT (Institut Sénégalais de Recherche Agricole – Centre de Recherches Océanographiques de Dakar-Thiaroye), Sénégal
- UCAD FST, Senegal
- UADB, Senegal
- IMROP, Mauritania
- FD, Gambia
- UMRs Mivegec, Locean et Lops
- Commission sous régional des pêches (CSRP / SRFC)