Intelligence artificielle Une IA pour prédire l’évolution des marchés financiers ? Le trading prédictif fait...

Pour approfondir le sujet

Sur le même thème :

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...

Une IA pour prédire l’évolution des marchés financiers ? Le trading prédictif fait un bond de géant

Des chercheurs de l’université d’Oxford ont mis au point en partenariat avec Man Group PLC un programme d’apprentissage automatique capable de prédire le cours des actions. Les chercheurs affichent un taux de réussite de 80 % sur une période de 30 secondes de trading en direct.

Prédire l’évolution du prix des actions est le rêve de tout fonds d’investissement et trader. À ce jour, les prédictions les plus performantes portent sur une évolution à 1 ou 2 millisecondes — ce qui est peu. Les travaux des chercheurs de l’Oxford-Man Institute of Quantitative Finance pourraient changer la donne. En utilisant des approches fondées sur le traitement du langage naturel et des processeurs IPU (Intelligence Processing Unit) de Graphcore, l’équipe de chercheurs à largement réduit le temps d’entraînement des modèles de prévisions multihorizon pour prédire l’évolution des marchés.

Les carnets d’ordre : source de données

Pour entraîner leur modèle, les chercheurs puisent dans le carnet d’ordre à cours limité qui recense tous les ordres d’achat à un instant T, soit plusieurs millions d’ordres comportant chacun des informations sur le prix d’achat et de vente ainsi qu’un marqueur temporel (timestamp) pour l’exécution. En passant au tamis algorithmique ce carnet de liquidité, il est alors possible de déterminer une trajectoire pour des mouvements du marché dans un sens ou dans l’autre et surtout le moment décisif pour réaliser une opération.

Passer d’un seul horizon à un horizon multiple

Pour gagner en précision, l’équipe d’Oxford a mis en œuvre une analyse multihorizon, là où ce type d’analyse par l’IA a jusqu’alors recouru à une prévision mono horizon pour corréler les prix des ordres et les prix du marché dans une fenêtre temporelle définie et surtout unique. En effet, l’apprentissage supervisé monohorizon est limité par la multitude de facteurs à prendre en compte et le rapport signal/bruit pour obtenir une prévision fiable. À l’inverse, la prévision multihorizon étudie les mouvements de prix sur une série d’intervalles, les résultats de chaque horizon informant le suivant. En agrégeant ces fenêtres, les prévisions portent ainsi sur un temps plus long.

IA Trading Graphcore Prévision multihorizon
Prévision multihorizon

Le NLP au secours du multihorizon

Pour développer cette approche multihorizon, l’équipe de chercheurs s’est inspirée du traitement en langage naturel en ayant recours aux modèles Seq2seq et Attention fondés sur des couches neuronales récurrentes complexes comprenant un encodeur et un décodeur. L’encodeur Seq2Seq résume les informations des séries temporelles passées et le décodeur combine les états cachés avec les entrées futures connues pour générer des prédictions. Le modèle Attention permet pour sa part de remédier aux limitations des modèles Seq2Seq adaptés au traitement de séquences courtes.

Pourquoi ce modèle NLP ? Selon l’équipe, la structure récurrente de la combinaison Seq2Seq/Attention permet de s’aligner parfaitement avec la nature des séries temporelles dans la prévision multihorizon. Un alignement idéal pour synthétiser les informations du passé et les projeter à une date ultérieure.

Stefan Zohren, chercheur à l’Oxford-Man Institute (OMI), et récemment fait sociétaire du Alan Turing Institute souligne que ce modèle peut être comparé à un programme qui traduit une phrase de l’anglais au français en construisant des inférences de manière incrémentielle.

Pour effectuer les calculs, les chercheurs de l’OMI, Zihao Zhang et Stefan Zohren, ont exploité l’architecture de l’IPU, beaucoup plus proche des couches neuronales récurrentes utilisées dans les prévisions multihorizons, évitant ainsi les goulets d’étranglement généralement constatés sur ce type de calcul par les CPU et GPU classiques saturés par le rythme des échanges de données.

“Nous avons effectué des tests comparatifs avec un large éventail de réseaux de pointe intéressants et nous avons constaté que les IPU sont au moins plusieurs fois plus rapides que les GPU courants. Pour donner un chiffre, je pense que c’est au moins 10 fois plus rapide”, a déclaré le Dr Zhang.

IA trading Graphcore Mécanisme d’attention
Mécanisme d’attention

Un gain de plus de 30 secondes sur les prédictions

De fait, les données LOB ont été utilisées pour entraîner un certain nombre de modèles sur l’IPU, dont un — DeepLOB — développé par la même équipe de l’OMI (Zhang et al, 2019). En termes de prévision multihorizon, les chercheurs ont testé deux variantes de DeepLOB, nommées DeepLOB-Seq2Seq, et DeepLOB-Attention, qui utilisent respectivement des modèles Seq2Seq et Attention comme décodeurs.

Ces nouveaux modèles ont fourni une précision de prédiction supérieure à la fois à des horizons plus courts, tels que K=10, et, surtout, à des horizons plus longs, tels que K=50 et K=100. Dans ce cas, K représente le « tick time », l’heure à laquelle les messages sont reçus à la bourse. Il s’agit d’un temps naturel qui tique plus rapidement pour les actions plus liquides et plus lentement pour les actions moins liquides. En particulier, les modèles multihorizons DeepLOB-Seq2Seq et DeepLOB-Attention ont atteint les plus hauts niveaux d’exactitude et de précision lorsqu’ils ont été utilisés pour faire des prédictions à des horizons plus larges.

Pour le dire autrement, l’algorithme a réussi à déterminer la direction de prix sur une période de 100 ticks, soit environ une prédiction pouvant aller de 30 secondes à 2 minutes selon les conditions du marché ! Au regard de ces premiers résultats, le Dr Zohren est très optimiste pour la suite :

“Les algorithmes d’apprentissage par renforcement constituent un excellent cadre pour appliquer ces prévisions multihorizons dans un contexte d’exécution optimale ou de tenue de marché. Étant donné la complexité de calcul de ces algorithmes, les gains de vitesse obtenus avec les IPU pourraient même être plus importants dans cette configuration”.

Vous pouvez lire leur article de recherche actuel publié sur ArXiv et voir leur code sur Github.

Contributeur expert

Gautier Soubrane

Gautier Soubrane est directeur Commercial – Europe de l’Ouest, Moyen Orient et Afrique ch

Partager l'article

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...