• switch_etudiant
  • switch_entreprise

Recherche

Le séminaire de statistique de doctorants

id="Bt_Share">

27 janvier 2012 - Abdullah Oueslati (SNCF Innovation et Recherche, LSTA, Paris 6)

Un modèle à risques proportionnels avec détection de ruptures pour l'estimation de la demande de TGV.

Ensai, 10h-10h45 : Abdullah Oueslati - SNCF Innovation et Recherche/LSTA, Université Paris 6

À la SNCF, le système de Yield-Management  permet de répartir les places disponibles au sein des TGV entre les différents produits tarifaires (Prem's, Cartes 12-25, Plein tarif, ...). Pour établir de façon optimale le nombre de places allouées à chaque produit tarifaire, il faut connaître le plus précisément possible la demande des clients pour chacun de ces produits "concurrents". Or, les données de réservation récoltées sont contraintes par les quotas imposés par le Yield et intègrent les reports des clients d'une classe tarifaire à une autre. 

 

Un modèle à risques proportionnels pour le processus des réservations a été développé afin de répondre à cette double problématique : une partie "détection de ruptures" pour la dynamique propre à une classe tarifaire et une partie "régression paramétrique" pour l'estimation des reports entre trains et/ou classes tarifaires.

Validée par simulations, la procédure d'estimation développée montre que notre modèle peut fournir une alternative intéressante au modèle de Cox, en particulier en présence d'égalités.

9 mars 2012

6 avril 2012

1er juin 2012

- Séminaires précédents :

16 décembre 2011 - Jean-Louis Marchand (Rennes 1)

Conditionnement de diffusions par des observations partielles.

Ensai, 10h-10h45 : Jean-Louis Marchand (Irmar, doctorant de l'universite de Rennes 1)

On s'intéresse à un processus multidimensionnel x.  On voudrait reconstituer une trajectoire de ce processus à l'aide d'observations de certaines coordonnées à certains instants. Le mieux que l'on puisse faire est de rechercher la loi conditionnelle. L'objectif est la simulation de trajectoires sous cette loi conditionnelle.

La loi du processus x est donnée par une équation différentielle stochastique (EDS). Pour reconstruire la trajectoire, on cherche à obtenir une seconde EDS, facile à simuler, de loi absolument continue par rapport à la loi conditionnelle ciblée. Le résultat présenté donne la densité, et fournit ainsi naturellement un algorithme de Monte-Carlo  pour estimer des fonctionnelles des trajectoires conditionnelles.

18 novembre 2011 - Aba Diop (Université Gaston Berger de Saint-Louis, Sénégal)

Estimation par maximum de vraisemblance dans le modèle de régression logistique avec fraction immune.

Ensai, 10h-10h45 : Aba Diop (Université Gaston Berger de Saint-Louis, Sénégal)

Le modèle de régression logistique (modèle de régression pour données binaires) suppose que tous les individus pour lesquels la variable réponse vaut 0 sont susceptibles de développer l’événement d’intérêt. Il ne prend donc pas en compte l’existence éventuelle dans la population étudiée d’une proportion (dite "fraction immune") de sujets non susceptibles (d’être infectés, par exemple). Le statut d’immunité est inconnu sauf si l’événement d’intérêt a été observé. Dans ce travail, nous proposons une méthode d’estimation pour le modèle de régression logistique en présence d’une fraction immune. Cette méthode se base sur une modélisation conjointe de l’immunité et des risques d’infection. Nous étudions l’identifiabilité du modèle proposé et nous établissons les propriétés asymptotiques.

 

23 septembre 2011 - François Portier (Rennes 1)

La méthode des fonctions test pour l'estimation de l'espace central.

Ensai, 10h-10h45François Portier (Irmar, doctorant de l'universite de Rennes 1)

Résumé : Soit un modèle de régression où le nombre de prédicteurs est trop élevé pour l'obtention de vitesses non-paramétriques correctes. La Sufficient Dimension Reduction propose de réduire la dimension du vecteur des prédicteurs en projetant ce dernier sur un espace de petite dimension appelé l'espace central. Le but de ce travail est d'estimer cet espace. Pour cela on définit la méthodologie des fonctions test dont l'idée principale est d'étudier la dépendance entre les prédicteurs et la réponse par l'introduction de transformations non-linéaires de la réponse. On distingue deux classes de méthodes basées respectivement sur les premiers et seconds moments des prédicteurs. Pour chacune d'elles, on exprimera les conditions d'exhaustivité de l'estimation de l'espace central d'une part, et dans un second temps on présentera les membres optimaux de ces classes par rapport au critère MSE. Enfin, des simulations nous montrerons la précision de ce nouveau type de méthodes.  

 

13 mai 2011 - Paul Bui Quang

Filtrage particulaire et approximation de Laplace

Ensai, 10h-10h45 : Paul Bui Quang (Onera)

Résumé : Nous présentons le problème du filtrage bayésien et sa résolution par les méthodes particulaires classiques. Nous nous intéressons au cas où le paramètre à estimer est très informatif, par exemple lorsque la fonction de vraisemblance est pointue. Cette situation, réputée difficile en filtrage particulaire, apparaît notamment lorsque les observations sont faiblement bruitées. Nous proposons alors d'utiliser la méthode d'approximation d'intégrales de Laplace, utilisée en statistique bayésienne asymptotique, pour améliorer le filtrage. Nous illustrons sur des simulations que l'approximation de Laplace introduite rend l'estimation plus robuste.

1er avril 2011 - Matthieu Saumard (Insa Rennes)

Analyse statistique de modèles définis par des restrictions de moments
conditionnels pour des données fonctionnelles

Ensai, 10h-10h45 : Matthieu Saumard (Insa Rennes, Irmar)

Résumé : Nous considérons ici un modèle défini par des restrictions de moments conditionnels dans lequel les valeurs de la variable dans le conditionnement ainsi que le paramètre d?intérêt sont des éléments d?un espace fonctionnel.
Pour estimer le paramètre d'intérêt, nous utiliserons une technique de troncature afin d?appliquer et généraliser la théorie existante dans les modèles finies-dimensionnelles.

 

18 février 2011 - Kouadio Simplice Kouakou (Rennes 2)

Estimation de la densité spectrale d'un processus stationnaire continu à l'aide d'un échantillonage aléatoire

Ensai, 10h00-10h45, salle A010 : Kouadio Simplice Kouakou (Rennes 2)

Résumé : Lorsqu'il s'agit d'étudier la répartition en fréquence d'un signal ou d'étudier la densité de bruit présent dans un signal, l'utilisation de la densité spectrale, dans l'Analyse des signaux, connaît un très grand succès.

Dans le cadre de ces études, nous proposons un estimateur de la densité spectrale d'un processus continu à l'aide d'un échantillonnage suivant des variables aléatoires i.i.d. Dilatées (présenté par Hall et Patil en 1994). Sous certaines conditions de régularité, nous étudions les propriètés de cet estimateur.

 

14 janvier 2011 - Samuel Maistre (Crest-Ensai)

Filtrage collaboratif : calcul de la confiance de prédiction pour les méthodes de factorisation.

Ensai, 10h00-10h45, salle A010 : Samuel MAISTRE  (Irmar, Crest-Ensai)

Résumé : Le filtrage collaboratif filtrage consiste à recommander des articles à un individu en se basant non seulement sur les informations dont on dispose sur ses goûts, mais aussi sur les préférences des autres individus. Ce concept s'est fortement développé ces dernières années, que ce soit au niveau de son étude théorique ou dans son implémentation logicielle (Netflix, Movielens et plus récemment Amazon).
Lorsque les préférences sont exprimées par des notes, on peut chercher à prédire les notes manquantes. Pour cela, une des méthodes fréquemment utilisée s'appuie sur la factorisation de matrices et peut être vue comme une ACP en présence d'une très grande proportion de valeurs manquantes.
Nous nous intéressons à deux sujets très peu traités dans la littérature : l'estimation de la confiance de prédiction et l'étude des conséquences du relâchement de l'hypothèse "missing at random".

3 décembre 2010 - Nicolas Raillard (Rennes 1)

Modélisation de valeurs extrêmes de processus observés à des intervalles de temps irréguliers

Ensai, 10h-10h45 : Nicolas Raillard (Irmar, doctorant de l'universite de Rennes 1, moniteur de l'université de Brest)

Résumé : Modelling extreme events has become a main concern for many applications and this task is often devoted to the extreme value theory which is a convenient tool to model rare events. The goal of the present study is to estimate the extremal behaviour of a process which is observed with an irregular time step as it is often the case in practice for environmental applications. Irregular time sampling may be due to the presence of missing values (e.g. instruments failure or transmission problems which are often associated with extreme weather) or to the way the data are obtained (e.g. ship or satellite data).


The most widespread approaches for modelling the extreme behaviour of processes observed at regular time step consist of:
 
-Blocs maxima. Data are blocked into blocks of equal length and the Generalized Extreme Value (GEV) distribution is fitted to the set of block maxima. A trade-off has to be found for the block size: it needs to be large enough to justify the use of the GEV distribution and not too big to get enough block to fit the GEV distribution. This method has the advantage to be implemented easily and rely on few assumptions but tend to waste data since only the maximum is kept in each block.

  • Peak over threshold. The first step consists in selecting a high threshold and keeping only the data over this threshold. For stationary series, asymptotic arguments imply that the marginal distribution of the excesses over the threshold should be well approximated by a Generalized Pareto Distribution but do not lead to a specification of the joint distribution of neighbouring excesses. A "declustering" step is then applied in order to obtain a set of threshold excesses which are approximately independent and again data are wasted.
  • Markov chain model for excesses above a high threshold. More recently, it was proposed to model the excesses above a high threshold using a Markov chain which transition kernel is derived from multivariate extreme value theory. This approach permits to keep all the data over the selected threshold but requires more modelling efforts since a particular transition kernel has to be chosen among the ones available from the asymptotic theory.

In this talk, we will discuss the extensions of these methods to processes observed at irregular time step. The proposed methods will be assessed using simulations and illustrated on meteorological data.

5 novembre 2010 - Damien Passemier (Rennes 1)

Determining the number of spikes in a spiked population model

Ensai, 10h-10h45 : Damien Passemier (Irmar, Rennes 1)

Résumé :  In a spiked population model, the population covariance matrix has all its eigenvalues equal to units except for a few fixed eigenvalues (Spikes). Determining the number of spikes is a fundamental problem which appears in many scientific fields, including signal processing (Linear mixture model) or economics (Factor model).  Several recent papers studied the asymptotic behavior of the eigenvalues of the sample covariance matrix (Sample eigenvalues) when the dimension of the observations and the sample size both grow to infinity so that their ratio converges to a positive constant. Using  these results, we propose a new estimator based on the difference between two consecutive sample eigenvalues.

 

24 septembre 2010 - Déborah Ferré (INSA Rennes)

Développement d'Edgeworth d'ordre 1 pour des M-estimateurs dans le cas de chaînes de Markov V-géométriquement ergodiques

Ensai, 10h-10h45 : Déborah Ferré (IRMAR - INSA Rennes)

Résumé : Nous donnons des conditions assurant l'existence d'un développement d'Edgeworth d'ordre 1 (raffinement du théorème limite central) pour des M-estimateurs dans le cas de chaînes de Markov V-géométriquement ergodiques. Ces conditions sont proches de celles du cas indépendant.