Allocataire de recherche du Crest.

Adresse professionnelle
Ensai - Campus de Ker-Lann,
Rue Blaise Pascal - BP 37203,
35172 BRUZ cedex
Téléphone : +33 (0)2 99 05 32 49
Fax : +33 (0)2 99 05 32 05
Courriel : samuel.maistre [at] ensai.fr
L'Ensai en finale du championnat de France universitaire de Poker
Ensai, 10h-10h45 : Abdullah Oueslati - SNCF Innovation et Recherche/LSTA, Université Paris 6
À la SNCF, le système de Yield-Management permet de répartir les places disponibles au sein des TGV entre les différents produits tarifaires (Prem's, Cartes 12-25, Plein tarif, ...). Pour établir de façon optimale le nombre de places allouées à chaque produit tarifaire, il faut connaître le plus précisément possible la demande des clients pour chacun de ces produits "concurrents". Or, les données de réservation récoltées sont contraintes par les quotas imposés par le Yield et intègrent les reports des clients d'une classe tarifaire à une autre.
Un modèle à risques proportionnels pour le processus des réservations a été développé afin de répondre à cette double problématique : une partie "détection de ruptures" pour la dynamique propre à une classe tarifaire et une partie "régression paramétrique" pour l'estimation des reports entre trains et/ou classes tarifaires.
Validée par simulations, la procédure d'estimation développée montre que notre modèle peut fournir une alternative intéressante au modèle de Cox, en particulier en présence d'égalités.
Conditionnement de diffusions par des observations partielles.
Ensai, 10h-10h45 : Jean-Louis Marchand (Irmar, doctorant de l'universite de Rennes 1)
On s'intéresse à un processus multidimensionnel x. On voudrait reconstituer une trajectoire de ce processus à l'aide d'observations de certaines coordonnées à certains instants. Le mieux que l'on puisse faire est de rechercher la loi conditionnelle. L'objectif est la simulation de trajectoires sous cette loi conditionnelle.
La loi du processus x est donnée par une équation différentielle stochastique (EDS). Pour reconstruire la trajectoire, on cherche à obtenir une seconde EDS, facile à simuler, de loi absolument continue par rapport à la loi conditionnelle ciblée. Le résultat présenté donne la densité, et fournit ainsi naturellement un algorithme de Monte-Carlo pour estimer des fonctionnelles des trajectoires conditionnelles.
Estimation par maximum de vraisemblance dans le modèle de régression logistique avec fraction immune.
Ensai, 10h-10h45 : Aba Diop (Université Gaston Berger de Saint-Louis, Sénégal)
Le modèle de régression logistique (modèle de régression pour données binaires) suppose que tous les individus pour lesquels la variable réponse vaut 0 sont susceptibles de développer l’événement d’intérêt. Il ne prend donc pas en compte l’existence éventuelle dans la population étudiée d’une proportion (dite "fraction immune") de sujets non susceptibles (d’être infectés, par exemple). Le statut d’immunité est inconnu sauf si l’événement d’intérêt a été observé. Dans ce travail, nous proposons une méthode d’estimation pour le modèle de régression logistique en présence d’une fraction immune. Cette méthode se base sur une modélisation conjointe de l’immunité et des risques d’infection. Nous étudions l’identifiabilité du modèle proposé et nous établissons les propriétés asymptotiques.
La méthode des fonctions test pour l'estimation de l'espace central.
Ensai, 10h-10h45 : François Portier (Irmar, doctorant de l'universite de Rennes 1)
Résumé : Soit un modèle de régression où le nombre de prédicteurs est trop élevé pour l'obtention de vitesses non-paramétriques correctes. La Sufficient Dimension Reduction propose de réduire la dimension du vecteur des prédicteurs en projetant ce dernier sur un espace de petite dimension appelé l'espace central. Le but de ce travail est d'estimer cet espace. Pour cela on définit la méthodologie des fonctions test dont l'idée principale est d'étudier la dépendance entre les prédicteurs et la réponse par l'introduction de transformations non-linéaires de la réponse. On distingue deux classes de méthodes basées respectivement sur les premiers et seconds moments des prédicteurs. Pour chacune d'elles, on exprimera les conditions d'exhaustivité de l'estimation de l'espace central d'une part, et dans un second temps on présentera les membres optimaux de ces classes par rapport au critère MSE. Enfin, des simulations nous montrerons la précision de ce nouveau type de méthodes.
Ensai, 10h-10h45 : Paul Bui Quang (Onera)
Résumé : Nous présentons le problème du filtrage bayésien et sa résolution par les méthodes particulaires classiques. Nous nous intéressons au cas où le paramètre à estimer est très informatif, par exemple lorsque la fonction de vraisemblance est pointue. Cette situation, réputée difficile en filtrage particulaire, apparaît notamment lorsque les observations sont faiblement bruitées. Nous proposons alors d'utiliser la méthode d'approximation d'intégrales de Laplace, utilisée en statistique bayésienne asymptotique, pour améliorer le filtrage. Nous illustrons sur des simulations que l'approximation de Laplace introduite rend l'estimation plus robuste.
Ensai, 10h-10h45 : Matthieu Saumard (Insa Rennes, Irmar)
Résumé : Nous considérons ici un modèle défini par des restrictions de moments conditionnels dans lequel les valeurs de la variable dans le conditionnement ainsi que le paramètre d?intérêt sont des éléments d?un espace fonctionnel.
Pour estimer le paramètre d'intérêt, nous utiliserons une technique de troncature afin d?appliquer et généraliser la théorie existante dans les modèles finies-dimensionnelles.
Résumé : Lorsqu'il s'agit d'étudier la répartition en fréquence d'un signal ou d'étudier la densité de bruit présent dans un signal, l'utilisation de la densité spectrale, dans l'Analyse des signaux, connaît un très grand succès.
Dans le cadre de ces études, nous proposons un estimateur de la densité spectrale d'un processus continu à l'aide d'un échantillonnage suivant des variables aléatoires i.i.d. Dilatées (présenté par Hall et Patil en 1994). Sous certaines conditions de régularité, nous étudions les propriètés de cet estimateur.
Ensai, 10h00-10h45, salle A010 : Samuel MAISTRE (Irmar, Crest-Ensai)
Résumé : Le filtrage collaboratif filtrage consiste à recommander des articles à un individu en se basant non seulement sur les informations dont on dispose sur ses goûts, mais aussi sur les préférences des autres individus. Ce concept s'est fortement développé ces dernières années, que ce soit au niveau de son étude théorique ou dans son implémentation logicielle (Netflix, Movielens et plus récemment Amazon).
Lorsque les préférences sont exprimées par des notes, on peut chercher à prédire les notes manquantes. Pour cela, une des méthodes fréquemment utilisée s'appuie sur la factorisation de matrices et peut être vue comme une ACP en présence d'une très grande proportion de valeurs manquantes.
Nous nous intéressons à deux sujets très peu traités dans la littérature : l'estimation de la confiance de prédiction et l'étude des conséquences du relâchement de l'hypothèse "missing at random".
Modélisation de valeurs extrêmes de processus observés à des intervalles de temps irréguliers
Ensai, 10h-10h45 : Nicolas Raillard (Irmar, doctorant de l'universite de Rennes 1, moniteur de l'université de Brest)
Résumé : Modelling extreme events has become a main concern for many applications and this task is often devoted to the extreme value theory which is a convenient tool to model rare events. The goal of the present study is to estimate the extremal behaviour of a process which is observed with an irregular time step as it is often the case in practice for environmental applications. Irregular time sampling may be due to the presence of missing values (e.g. instruments failure or transmission problems which are often associated with extreme weather) or to the way the data are obtained (e.g. ship or satellite data).
The most widespread approaches for modelling the extreme behaviour of processes observed at regular time step consist of:
-Blocs maxima. Data are blocked into blocks of equal length and the Generalized Extreme Value (GEV) distribution is fitted to the set of block maxima. A trade-off has to be found for the block size: it needs to be large enough to justify the use of the GEV distribution and not too big to get enough block to fit the GEV distribution. This method has the advantage to be implemented easily and rely on few assumptions but tend to waste data since only the maximum is kept in each block.
In this talk, we will discuss the extensions of these methods to processes observed at irregular time step. The proposed methods will be assessed using simulations and illustrated on meteorological data.
Determining the number of spikes in a spiked population model
Ensai, 10h-10h45 : Damien Passemier (Irmar, Rennes 1)
Résumé : In a spiked population model, the population covariance matrix has all its eigenvalues equal to units except for a few fixed eigenvalues (Spikes). Determining the number of spikes is a fundamental problem which appears in many scientific fields, including signal processing (Linear mixture model) or economics (Factor model). Several recent papers studied the asymptotic behavior of the eigenvalues of the sample covariance matrix (Sample eigenvalues) when the dimension of the observations and the sample size both grow to infinity so that their ratio converges to a positive constant. Using these results, we propose a new estimator based on the difference between two consecutive sample eigenvalues.
Développement d'Edgeworth d'ordre 1 pour des M-estimateurs dans le cas
Ensai, 10h-10h45 : Déborah Ferré (IRMAR - INSA Rennes)
Résumé :
Nous donnons des conditions assurant l'existence d'un développement