Modelisation and estimation of heterogeneous variances in nonlinear mixed models - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2008

Modelisation and estimation of heterogeneous variances in nonlinear mixed models

Modélisation et estimation de variances hétérogènes dans les modèles non linéaires mixtes

Mylene Duval
  • Fonction : Auteur

Résumé

Nonlinear mixed models stand apart in mixed models methodology. Contrary to linear and generalized linear models, often used as black boxes, the trajectory function t in nonlinear models generally comes from the integration of dierential equations. This provides a biological interpretation for the parameters, whereas models are often more parsimonious. However, the estimation of the parameters in nonlinear mixed models is complex because random eects cannot be integrated out of the likelihood in closed form. As in all mixed models, especially those used to analyze longitudinal data, nonlinear models are well adapted to take into account between and within-cluster variation. However, one of the common assumptions of such models is that of independent, identically distributed residuals with a common variance; this assumption is unrealistic in many elds of applications. The objective of this study was to propose some models for the residual variance to take into account the potential heterogeneity of variance of the residuals, while limiting the number of parameters in these models. In this sense, we used a parametric approach based on a linear mixed model on the logvariance, as well as the classical power \meanvariance" function. A classical inference method based on maximum likelihood theory was selected and we considered a stochastic EM algorithm, the SAEM-MCMC algorithm. The mixed model structure applied to the position and dispersion parameters is well adapted to the implementation of EM algorithms. Some instrumental distributions adapted to the analysis of these models, as well as some convergence criteria, were proposed in the MCMC step. The overall algorithm was numerically validated in both linear and nonlinear models, by comparing its results with those of an analytical EM algorithm (in the linear case) or other algorithms like those based on Gaussian quadrature. Finally, an application to the analysis of somatic cell scores in dairy cattle was presented. Several linear and nonlinear models were compared showing a clear gain obtained taking into account the heterogeneity of variances.
Les modèles non linéaires occupent une place à part dans la méthodologie des modèles mixtes. Contrairement aux modèles linéaire et linéaire généralisés qui s'apparentent souvent à des boites noires, la fonction d'ajustement des données dans le cas non linéaire provient en général de l'intégration d'une équation différentielle ce qui confère à ces modèles une dimension "explicative" beaucoup plus riche et souvent plus parcimonieuse. D'autre part, l'estimation des paramètres y est difficile du fait de l'impossibilité d'une intégration analytique des effets aléatoires. Comme dans tous les modèles mixtes notamment ceux appliqués aux données longitudinales, ils permettent bien de prendre en compte la variabilité entre et intra unités expérimentales. Mais, là comme ailleurs, le statut des résidus supposés habituellement indépendants et identiquement distribués suivant une loi normale de variance homogène reste problématique car fréquemment irréaliste. L'objet de ce travail était de présenter quelques possibilités de modélisation de ces variances résiduelles qui prennent en compte la grande hétérogénéité potentielle de celles-ci, mais dans un souci délibéré d'économie vis-à-vis du nombre de nouveaux paramètres impliqués dans ces fonctions. C'est pourquoi, en sus de la relation classique moyenne-variance, nous avons opté pour une approche paramétrique de type "modèle mixte" sur les logvariances. Nous avons choisi une méthode d'inférence classique basée sur la théorie du maximum de vraisemblance et, dans ce cadre complexe, nous avons considéré un algorithme de type EM stochastique plus précisément l'algorithme dit SAEM-MCMC. La structure de modèle mixte à la fois sur les paramètres de position et de dispersion se prête particulièrement bien à la mise en oeuvre de ces algorithmes EM. La phase MCMC, a nécessité la mise au point et le calibrage de distributions instrumentales adaptées à cette situation ainsi que la définition de critères permettant de contrôler la convergence de l'algorithme. Le tout a été validé numériquement dans le cadre linéaire et non linéaire par comparaison à des algorithmes EM analytiques quand ils existaient (cas linéaire) ou à d'autres algorithmes numériques tels ceux basés sur la quadrature de Gauss. Ces techniques ont été illustrées par l'analyse de profils de comptage de cellules somatiques de vaches laitières. Plusieurs modèles linéaire et non linéaires sont comparés et montrent clairement l'intérêt d'une modélisation mixte des variances résiduelles.
Fichier principal
Vignette du fichier
manuscrit_duval.pdf (1.7 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00004846 , version 1 (09-04-2009)

Identifiants

  • HAL Id : pastel-00004846 , version 1

Citer

Mylene Duval. Modelisation and estimation of heterogeneous variances in nonlinear mixed models. Mathematics [math]. AgroParisTech, 2008. English. ⟨NNT : 2008AGPT0082⟩. ⟨pastel-00004846⟩
167 Consultations
620 Téléchargements

Partager

Gmail Facebook X LinkedIn More