Les séries temporelles représentent une séquence ordonnée de données mesurées ou observées à des intervalles de temps successifs. Contrairement aux données statiques, telles que celles utilisées dans l'analyse de données classiques, les séries temporelles capturent l'évolution d'une variable sur une période donnée.
L'analyse des données expérimentales observées à différents moments conduit à de nouveaux problèmes uniques dans la modélisation statistique et l'inférence. La corrélation évidente introduite par l'échantillonnage de points temporels adjacents peut restreindre considérablement l'applicabilité des nombreuses méthodes statistiques conventionnelles traditionnellement dépendantes de l'hypothèse que ces observations adjacentes sont indépendantes et identiquement distribuées.
Les principales caractéristiques de nombreuses séries temporelles sont les tendances et les variations saisonnières qui peuvent être modélisées de manière déterministe avec des fonctions mathématiques du temps.
Cependant, une autre caractéristique importante de la plupart des séries temporelles est que les observations proches dans le temps ont tendance à être corrélées. Une grande partie de la méthodologie dans une analyse de séries temporelles vise à expliquer cette corrélation et les principales caractéristiques des données en utilisant des modèles statistiques appropriés et des méthodes descriptives.
La compréhension des séries temporelles est cruciale pour anticiper les tendances, effectuer des prévisions, et prendre des décisions éclairées basées sur l'évolution passée d'une variable. Les méthodes d'analyse et de modélisation des séries temporelles jouent alors un rôle central en machine learning et en data science, permettant de transformer ces données temporelles en informations exploitables.
Une série stationnaire est une série pour laquelle ses propriétés statistiques ne varient pas dans le temps. Il s’agit là d’une condition préalable importante pour une modélisation précise afin de pouvoir réaliser des prédictions.
Une série temporelle est dite stationnaire lorsque ses moments ne dépendent plus du temps $t$ :
$$ \begin{aligned} &E[X_t] = \mu \\ &Var(X_t) = \sigma^2 \\ &Cov(X_t, X_{t+h}) = \gamma(h) \end{aligned} $$
Afin de tester si une série temporelle est bel et bien dans un état stationnaire, plusieurs tests statistiques existent :
Test de Dickey-Fuller (ADF)
Le test de Dickey-Fuller évalue l'hypothèse nulle selon laquelle une série temporelle possède une racine unitaire, indiquant la non-stationnarité. Si la statistique du test est inférieure à la valeur critique, l'hypothèse nulle est rejetée, indiquant la stationnarité.