For the identification of time-series models. application to arma processes. - Archive ouverte HAL Access content directly
Theses Year : 2006

For the identification of time-series models. application to arma processes.

Pour l'identification de modèles factoriels de séries temporelles: Application aux ARMA stationnaires

(1)
1

Abstract

This thesis is centered on the problem of the identification of time series models with the meeting of two fields of the Statistics, Time Series Analysis and Data Analysis with its descriptive methods. The first stage of our work is to extend to several discrete time series the Jenkins' principal component study developed in the Seventies. Our approach adapts "classic" Principal Component Analysis (PCA) to time series while taking as a starting point the technique Singular Spectrum Analysis (SSA). A principle is deduced and applied to the multidimensional process generating series. A Toeplitz bloc covariance matrix is built around lagged random vectors: it exploits the chronology, the stationarity and the double dimension of the process. Using two corollaries based on the tensorial product of matrices and established by Friedman B. in the Fifties, like the covariance properties of a circular process, we approach the eigenvalues and the eigenvectors of the covariance matrix. The general shape of the principal components of several time series is deduced. In the case of the "independent" processes, a scores property is established and the principal components become moving averages of time series. From the obtained results, we propose a methodology allowing to build reference factorial models on "independent" vector ARMA. The objective is then to project a new series in one of the graphic models for its identification and a first estimate of its parameters. We work within a theoretical framework, then within an experimental framework by simulating samples of stationary, "independent" with symmetrical coefficients AR(1) and MA(1) processes. Based on simulated temporal matrices, several PCA produce good qualities of processes representation, with significant groupings and oppositions preserving the scores property and the eigenvalues symetric behavior. But above all, these factorial models reflect the variability of simulated white noises. Directly based on autocorrelation matrices, PCA give better results whatever the samples except for some processes said "weak". A first reference graphic model ensues with identification and estimation. Description and measure of possible structural changes lead us to introduce oscillators, frequencies and measures of entropy. This is the structural approach. To establish non-linearity between the numerous criteria and to increase the discriminative ability between the series, classifications on MCA are built over measures of entropy and produce outstanding quality of classes' characterization. A second reference graphic model ensues with the class of "weak" processes. This work also makes it possible to deduce a method of time series analysis which combines the usual approach by autocorrelations and a structural approach, less usual, by analysis of oscillators and theory of information, through visualization by factorial methods. The method is applied to simulated AR(2) and MA(2) processes and provides two more reference factorial models.
Cette thèse est axée sur le problème de l'identification de modèles factoriels de séries temporelles et est à la rencontre des deux domaines de la Statistique, l'analyse des séries temporelles et l'analyse des données avec ses méthodes descriptives. La première étape de notre travail a pour but d'étendre à plusieurs séries temporelles discrètes, l'étude des composantes principales de Jenkins développée dans les années 70. Notre approche adapte l'analyse en composantes principales "classique" (ou ACP) aux séries temporelles en s'inspirant de la technique Singular Spectrum Analysis (ou SSA). Un principe est déduit et est appliqué au processus multidimensionnel générateur des séries. Une matrice de covariance à structure "remarquable" est construite autour de vecteurs al9;atoires décalés: elle exploite la chronologie, la stationnarité et la double dimension du processus. A l'aide de deux corollaires établis par Friedman B. dans les années 50 basés sur le produit tensoriel de matrices, et de propriétés de covariance des processus circulaires, nous approchons les éléments propres de la matrice de covariance. La forme générale des composantes principales de plusieurs séries temporelles est déduite. Dans le cas des processus "indépendants", une propriété des scores est établie et les composantes principales sont des moyennes mobiles des séries temporelles. A partir des résultats obtenus, une méthodologie est présentée permettant de construire des modèles factoriels de référence sur des ARMA vectoriels "indépendants". L'objectif est alors de projeter une nouvelle série dans un des modèles graphiques pour son identification et une première estimation de ses paramètres. Le travail s'effectue dans un cadre théorique, puis dans un cadre expérimental en simulant des échantillons de trajectoires AR(1) et MA(1) stationnaires, "indépendantes" et à coefficients symétriques. Plusieurs ACP, construites sur la matrice temporelle issue de la simulation, produisent de bonnes qualités de représentation des processus qui se regroupent ou s'opposent selon leur type en préservant la propriété des scores et la symétrie dans le comportement des valeurs propres. Mais, ces modèles factoriels reflètent avant tout la variabilité des bruits de la simulation. Directement basées sur les autocorrélations, de nouvelles ACP donnent de meilleurs résultats quels que soient les échantillons. Un premier modèle factoriel de référence est retenu pour des séries à forts coefficients. La description et la mesure d'éventuels changements structurels conduisent à introduire des oscillateurs, des fréquences et des mesures entropiques. C'est l'approche structurelle. Pour établir une possible non-linéarité entre les nombreux critères et pour augmenter la discrimination entre les séries, une analyse des correspondances multiples suivie d'une classification est élaborée sur les entropies et produit un deuxième modèle de référence avec trois classes de processus dont celle des processus à faibles coefficients. Ce travail permet également d'en déduire une méthode d'analyse de séries temporelles qui combine à la fois, l'approche par les autocorrélations et l'approche par les entropies, avec une visualisation par des méthodes factorielles. La méthode est appliquée à des trajectoires AR(2) et MA(2) simulées et fournit deux autres modèles factoriels de référence.
Fichier principal
Vignette du fichier
these.pdf (2.41 Mo) Télécharger le fichier
Loading...

Dates and versions

pastel-00001966 , version 1 (29-01-2007)

Identifiers

  • HAL Id : pastel-00001966 , version 1

Cite

Carole Toque. For the identification of time-series models. application to arma processes.. Mathematics [math]. Télécom ParisTech, 2006. English. ⟨NNT : ⟩. ⟨pastel-00001966⟩
356 View
1341 Download

Share

Gmail Facebook Twitter LinkedIn More