L’IA à l’air de l’analyse financière : LLM contre analyste financier

26 juin 2024

L'analyse des états financiers est un pilier de la finance moderne, essentielle pour évaluer la santé financière des entreprises et prédire leurs performances futures.

Traditionnellement réalisée par des analystes financiers, cette tâche pourrait bientôt connaître une transformation radicale grâce aux avancées en intelligence artificielle. Une étude récente, intitulée « Financial Statement Analysis with Large Language Models », menée par trois chercheurs de l'Université de Chicago, explore cette révolution potentielle en se concentrant sur l'utilisation des grands modèles de langage (LLMs) comme GPT-4 pour l'analyse financière. 

Martin Baer, CFA

Manager Salustro & Associés

 

L'étude vise à déterminer si un modèle de langage avancé comme GPT-4 peut non seulement égaler, mais aussi surpasser les analystes financiers humains dans la prédiction des changements de bénéfices futurs. Les résultats de cette recherche pourraient redéfinir la manière dont les analyses financières sont réalisées, offrant ainsi de nouvelles perspectives pour les professionnels de la finance.

Méthodologie et Résultats

Données et Prompts

Les chercheurs ont utilisé des données financières annuelles de Compustat[1] couvrant la période de 1968 à 2021, et les prévisions des analystes financiers provenant d'IBES[2].

Deux types de prompts ont été utilisés pour guider le modèle :

  • Prompt simple : Instruire le LLM pour prédire la direction des bénéfices futurs à partir des états financiers sans directives détaillées.

  • Prompt de chaîne de pensée (Chain-of-Thought, CoT) : Guide le modèle à travers une analyse étape par étape imitant le raisonnement humain, y compris l'identification des tendances, le calcul des ratios et la fourniture d'interprétations économiques.

[1] Compustat est une base de données d'informations financières, statistiques et de marché sur les entreprises mondiales actives et inactives à travers le monde.

[2] The Institutional Brokers' Estimate System (IBES) est une base de données utilisée par les courtiers et les investisseurs actifs pour accéder aux estimations faites par les analystes boursiers concernant les bénéfices futurs des sociétés américaines cotées en bourse.

Résultats

Les résultats sont sans équivoques. GPT-4, avec les prompts CoT, a montré une précision de 60% dans la prédiction des bénéfices futurs, surpassant les analystes humains dont la précision se situait entre 53% et 57%. La performance de GPT-4 est comparable aux modèles de machine learning (ML) entraînés pour cette tâche comme les réseaux de neurones artificiels (ANNs). Les résultats de GPT-4 sans CoT présentent des performances similaires voire inférieures aux prévisions des analystes (52-53%).

L'une des forces de GPT-4 réside dans sa capacité à générer des scénarios détaillés (« narrative insights ») à partir de données numériques. En analysant les ratios financiers tels que la marge opérationnelle, la rotation des actifs et les ratios de liquidité, GPT-4 fournit des explications et des interprétations qui enrichissent la compréhension des tendances financières.

Source : Financial Statement Analysis with Large Language Models - Alex G. Kim, Maximilian Muhn, Valeri V. Nikolaev - May 20, 2024

Graph 2. GPT vs Analystes Humains (page 39)

Ce graphique compare les performances de prédiction de GPT et des analystes humains. « Analyst 1m » (3m, 6m) désigne la prévision médiane des analystes émise un (trois, six) mois après la publication des bénéfices.

Il est présenté la précision moyenne (le pourcentage de prédictions correctes sur le total des prédictions) pour chaque méthode (à gauche) et le score F1[1] (à droite). Ils obtiennent des « bootstrapped standard errors » en échantillonnant aléatoirement 1 000 observations 1 000 fois et incluent des intervalles de confiance à 95 %.

[1] Le score F1 est une façon de mesurer la qualité des prédictions d'un modèle en combinant la précision et le rappel (ou sensibilité) en une seule métrique. Ici ; le score F1 est utilisé pour évaluer la performance des prédictions de GPT et des analystes humains en matière de direction des bénéfices futurs.

 

Stratégies d’investissement

Les chercheurs ont également testé l'efficacité des stratégies de trading basées sur les prédictions de GPT-4. Les résultats montrent que ces stratégies offrent des performances (« alpha ») et des ratios de Sharpe plus élevés que celles basées sur les prévisions humaines ou d'autres modèles MLs, démontrant une performance économique supérieure.

Un autre point clé de l'étude est la complémentarité entre GPT-4 et les analystes humains. En effet, GPT-4 excelle dans les situations où les analystes humains peuvent montrer des biais ou des inefficacités, tandis que les humains apportent une compréhension contextuelle et qualitative indispensable.

L’IA, le futur allié des gérants et des l'analystes financiers ?

Les résultats de cette étude suggèrent que les LLMs pourraient jouer un rôle central dans l'analyse financière, non seulement en complément du travail des analystes mais aussi en les surpassant dans certaines tâches. Les auteurs nous donnent quelques applications clés pour le futur :

  • Automatisation : Les LLMs peuvent automatiser des tâches complexes d'analyse financière, réduisant ainsi le temps et les coûts tout en augmentant la précision des prédictions.

  • Nouveaux rôles des analystes : Les analystes financiers pourraient se concentrer davantage sur les aspects qualitatifs et contextuels de l'analyse, laissant les tâches quantitatives et répétitives aux LLMs.

  • Amélioration des stratégies de trading : L'intégration des prédictions des LLMs dans les stratégies de trading pourrait améliorer les performances des portefeuilles, offrant des avantages compétitifs significatifs.

  • Démocratisation de l'analyse financière : Les capacités des LLMs pourraient démocratiser l'accès à des analyses financières sophistiquées, aidant les investisseurs individuels et les petites entreprises à prendre des décisions plus informées.

Suivant
Suivant

Venture Capital Method