Modèle de data science: Retard d’avion

Modèle de data science: Retard d’avion

Près de 6 millions de passagers en Europe ont été victimes d’une annulation ou d’un retard conséquent sur la période juillet-août 2018. Modéliser les retards d’avion est une première étape pour résoudre ce problème et concevoir nos produits d’assurance voyage. C’est ce que nous allons théoriser dans cet article, qui présente notre data science model pour le retard d’avion.

Entre les tempêtes, les orages, la neige et autres perturbations exceptionnelles (grèves des contrôleurs aériens et du personnel navigant), les décollages et atterrissages peuvent être soumis à rude épreuve. Au-delà de ces causes extrêmes, la solution est d’étudier les facteurs qui augmentent le risque de retard grâce aux outils de la Data science.

Dans notre modèle de data science, les données d’entrée sont les informations issues du vol (aéroport de départ et d’arrivée, heure de départ, mois, type de compagnie …) et la donnée en sortie correspond à la probabilité de retard de plus d’1h.

Notre approche consiste à utiliser une technique d’apprentissage qui vise à rendre plus performant un système où le taux de retards constatés dans la base est très faible (~4%).

A la recherche de la période idéale de l’année avec un modèle de data science

La période de l’année détermine beaucoup le risque de retard.

Le graphique ci-dessus montre l’impact du mois sur la probabilité de retard. Ce qu’il faut retenir :

Les mois exposés au risque de retard de plus d’une heure correspondent à des périodes de grands départs et retours de vacances (été, hiver, beaucoup plus de trafic, plus de contrôles à la douane …).

Quel jour et à quelle heure partir ? Notre data science model vous explique tout.

Il convient de retenir les éléments suivants quelle que soit votre destination.

L’effet marginal de l’heure d’arrivée locale sur la probabilité de retard est mesuré par le graphique ci-dessus. Ce qu’il faut retenir :

Lorsque votre avion atterrit sur la plage horaire entre 13h et 21h, vous êtes exposés à un risque de retard qui peut aller jusqu’à 13% (pic à 20h). De plus dans le même contexte, partir l’après-midi augmente la probabilité de retard à l’arrivée. Privilégiez plus le matin (entre 5h et 10h) comme heure d’arrivée locale.

Le graphe ci-dessous montre les variations de probabilité de retard en fonction du jour de la semaine :

Les vols effectués le mardi et mercredi diminuent en moyenne de 15% la probabilité de retard. On observe cependant le phénomène inverse pour le jeudi (+11%), le vendredi (+8%) et le lundi (+5%) d’augmentation de risque de retard.

Cela s’explique par les grands départs et retours de week-end.

Et les compagnies aériennes dans tout ça ?

Le modèle fait ressortir deux niveaux de risque pour les compagnies aériennes (low-cost ou non).

Le risque de retard augmente de 4% lorsque la compagnie est low-cost.

Les compagnies aériennes font l’objet d’un classement annuel (note de satistifaction auprès des clients). Si la compagnie aérienne est classée dans le Top 30 auprès des passagers, le risque de retard peut diminuer jusqu’à 25%.

Vol retardé ou annulé … faites-vous indemniser

La réglementation européenne (261/2004) est particulièrement protectrice en la matière. Elle stipule que tout vol régulier, low-cost ou charter, décollant d’un pays européen quelle que soit la compagnie et sa destination donne droit à une indemnisation forfaitaire (jusqu’à 600€) à partir de 3 heures de retard. C’est le cas aussi pour les vols de compagnies européennes atterrissant en Europe.