9.6 C
New York

Un scientifique des données explique : Quand l’apprentissage automatique fonctionne-t-il bien sur les marchés financiers ?


En tant que information scientist, l’un des avantages de travailler avec les purchasers de DataRobot est la grande variété de questions très intéressantes qui se posent. Récemment, un shopper potentiel m’a demandé remark je concilie le fait que Robotic de données a plusieurs banques d’investissement très prospères utilisant DataRobot pour améliorer le P&L de leurs activités commerciales avec mes commentaires selon lesquels les modèles d’apprentissage automatique ne sont pas toujours efficaces pour prédire les prix des actifs financiers. Jetez un coup d’œil à notre dialog pour savoir quand l’apprentissage automatique fonctionne bien (et ne fonctionne pas) dans les cas d’utilisation des marchés financiers.

Pourquoi l’apprentissage automatique est-il succesful de bien fonctionner dans les functions de buying and selling à haute fréquence, mais est-il si mauvais pour prédire les prix des actifs à plus lengthy terme ?

Bien qu’il y ait eu quelques succès dans l’industrie en utilisant l’apprentissage automatique pour la prévision des prix, ils ont été rares. En règle générale, plus l’horizon temporel de la prédiction est court docket, meilleures sont les probabilities de succès.

Applications ML dans le commerce

De manière générale, les cas d’utilisation de market making dans lesquels DataRobot (et d’autres approches d’apprentissage automatique) glorious partagent une ou plusieurs des caractéristiques suivantes :

  • Pour la prévision des prix à terme : un horizon de prédiction très court docket (généralement dans les 1 à 10 prochaines secondes), la disponibilité de bonnes données de carnet de commandes et la reconnaissance du fait que même un modèle précis à 55 % à 60 % est utile – c’est finalement un jeu de pourcentage.
  • Pour la découverte des prix (par exemple, établir un prix approprié pour les titres illiquides, prédire où se situera la liquidité et déterminer les ratios de couverture appropriés) ainsi que plus généralement : l’existence de bonnes données commerciales historiques sur les actifs à évaluer (par exemple, TRACE, les rapports sur le marché obligataire asiatique, l’historique des transactions des ECN) ainsi qu’un ensemble clair d’actifs plus liquides qui peuvent être utilisés comme prédicteurs (par exemple, des crédits plus liquides , contrats à terme obligataires, marchés de swaps, and so on.).
  • Pour la prédiction du comportement de la contrepartie : une forme de données structurées qui contient non seulement des transactions gagnées, mais également des demandes/réponses infructueuses.
  • À travers les functions: un bord de l’data, par exemple en contrôlant une grande partie du flux dans cette classe d’actifs, ou en disposant de données sur le comportement des purchasers qui peuvent être utilisées.

Les domaines où toute forme d’apprentissage automatique aura des difficultés sont généralement caractérisés par un ou plusieurs de ces points :

  • Régimes, comportements et moteurs en évolution rapide : une des principales raisons pour lesquelles les prévisions à plus lengthy terme sont si difficiles. Nous constatons très souvent que les pilotes clés du modèle changent très régulièrement dans la plupart des Marchés financiers, avec une variable qui est un indicateur utile pour une semaine ou un mois ayant peu de contenu informatif dans la suivante. Même dans les functions réussies, les modèles sont recyclés et redéployés très régulièrement (généralement au moins une fois par semaine).
  • Données peu fréquentes : un exemple classique ici est celui des données mensuelles ou moins fréquentes. Dans de tels cas, le comportement modélisé change généralement si souvent qu’au second où suffisamment de données de formation pour l’apprentissage automatique se sont accumulées (24 mois ou plus), le marché se trouve dans un régime différent. Pour ce que ça vaut, quelques-uns de nos purchasers ont en effet réussi, par exemple, à sélectionner des actions en utilisant des prévisions sur un horizon d’un mois, mais ils ne nous disent (naturellement) pas remark ils s’y prennent.
  • Données fragmentées : où il n’y a pas suffisamment de données disponibles pour obtenir une bonne picture du marché dans son ensemble, comme certains marchés OTC où il n’y a pas de bons ECN.
  • Une absence de prédicteurs : en général, les données sur le comportement passé de la variable prédite (par exemple, les prix) ne suffisent pas. Vous avez également besoin de données décrivant les moteurs de cette variable (par exemple, les carnets de commandes, les flux, les attentes, le positionnement). Les performances passées ne représentent pas les résultats futurs… .
  • Historique limité des régimes similaires : Parce que les modèles d’apprentissage automatique constant à reconnaître des modèles dans les données historiques, de nouveaux marchés ou actifs peuvent être très difficiles pour les modèles ML. Ceci est connu dans le milieu universitaire comme le « problème de démarrage à froid ». Il existe différentes stratégies pour y faire face, mais aucune n’est parfaite.
  • N’étant pas réellement un problème d’apprentissage automatique : La modélisation de la valeur à risque en est l’exemple classique : la VaR n’est pas une prédiction de quoi que ce soit, c’est une sommation statistique des résultats de simulation. Cela dit, prédire le résultat d’une simulation est un problème de ML, et il existe de bonnes functions de ML dans la tarification de dérivés complexes et dépendants du chemin.

Enfin, et en dehors de ce qui précède, un facteur critique de succès dans tout cas d’utilisation d’apprentissage automatique qui ne doit pas être sous-estimé est l’implication de des personnes capables et motivées (généralement des quants et parfois des scientifiques des données) qui comprennent les données (et remark les manipuler), les processus métier et les leviers de valeur. Le succès est généralement motivé par de telles personnes effectuant de nombreuses expériences itératives sur le problème à résoudre, qui est finalement où notre plateforme entre en jeu. Comme discuté, nous accélérons massivement ce processus d’expérimentation. Il y a beaucoup de choses qui peuvent être automatisées dans l’apprentissage automatique, mais la connaissance du domaine ne peut pas l’être.

Pour résumer : il est juste de dire que la probabilité de succès dans les cas d’utilisation de buying and selling est positivement corrélée avec la fréquence du buying and selling (ou au moins négativement avec la période/l’horizon de détention) à quelques exceptions près pour confirmer la règle. Il convient également de garder à l’esprit que l’apprentissage automatique est souvent meilleur dans les cas d’utilisation de second ordre tels que la prédiction des moteurs des marchés, par exemple, le risque d’événement et, dans une certaine mesure, les volumes, plutôt que les prévisions de prix de premier ordre, sous réserve de la au-dessus des mises en garde.

A propos de l’auteur

Pierre Simon
Pierre Simon

Directeur général, Science des données des marchés financiers

Peter dirige la pratique de science des données des marchés financiers de DataRobot et travaille en étroite collaboration avec les purchasers de la fintech, de la banque et de la gestion d’actifs sur de nombreux cas d’utilisation à haut retour sur investissement pour la plate-forme DataRobot AI. Avant de rejoindre DataRobot, il a acquis vingt-cinq ans d’expérience dans la recherche quantitative senior, la gestion de portefeuille, le buying and selling, la gestion des risques et la science des données dans des banques d’investissement et des gestionnaires d’actifs, notamment Morgan Stanley, Warburg Pincus, Goldman Sachs, Credit score Suisse, Lansdowne Companions. et Invesco, ainsi que passer plusieurs années en tant que partenaire d’un fonds spéculatif d’actions mondiales en démarrage. Peter a un M.Sc. en science des données de Metropolis, College of London, un MBA de Cranfield College College of Administration et un B.Sc. en comptabilité et analyse financière de l’Université de Warwick. Son article, « Looking Excessive and Low: Visualizing Shifting Correlations in Monetary Markets », a été publié dans le numéro de juillet 2018 de Pc Graphics Discussion board.


Rencontrez Pierre Simon

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles