Le texte d’une révolution de l’investissement


Lorsque US Steel a publié le premier rapport annuel de l’Amérique il y a plus d’un siècle, il s’agissait d’un admirablement coupé de 40 pages, et principalement de photos de cheminées. Son rapport annuel 2020 comptait 162 pages emballées – et même cela est concis selon les normes modernes.

Les entreprises publiques publient des tonnes d’informations financières et d’informations sur leurs activités chaque trimestre, mais le rapport annuel est la grande baleine bleue des rapports d’entreprise. De nos jours, la longueur moyenne est l’équivalent d’un roman de 240 pages, selon S&P Global.

Il est courant de déplorer que les rapports trimestriels et annuels soient désormais des salades de mots, consistant principalement en de grandes quantités d’exigences de rapport souvent inutiles et de mises en garde juridiques standardisées, puis saupoudrées d’une grande dose de mauvaise presse. Les chiffres comptables de base n’ont pas changé de manière significative en quantité et en qualité au cours du siècle dernier, se plaignent les cyniques.

Il est vrai que les rapports d’entreprise contiennent un verbiage qui ferait rougir même un journaliste. Mais au lieu de mépriser ces rapports, les investisseurs avisés devraient adopter ces informations textuelles, certes farfelues, comme une mine d’or potentielle qui peut enfin être exploitée avec la technologie moderne.

Téléchargements automatiques des dépôts d'entreprise 10-K et 10-Q

Historiquement, l’investissement a principalement reposé sur un socle de chiffres, tels que les cours des actions et les bénéfices, les revenus et les dépenses de recherche. Les stockpickers traditionnels compléteraient naturellement cela par de nombreuses analyses qualitatives, telles que des entretiens avec le directeur financier d’une entreprise, des discussions avec des experts du secteur et des rapports annuels.

Pourtant, le volume croissant des déclarations d’entreprise signifie que personne ne peut tout consommer de manière réaliste. Aux États-Unis, la section « facteurs de risque » des rapports annuels a à elle seule presque triplé depuis 2006 et compte désormais en moyenne plus de 11 000 mots, selon un récent rapport de S&P Global. Pourtant, même dans les changements les plus subtils, des signaux précieux sont cachés, note Frank Zhao, analyste de l’équipe Market Intelligence de S&P.

L’outil permettant de glaner des signaux négociables à partir du bruit textuel est connu sous le nom de « traitement du langage naturel », un domaine de plus en plus populaire de l’intelligence artificielle qui consiste à apprendre aux machines à lire et à comprendre les subtilités du langage humain. La PNL permet de récolter systématiquement et d’analyser à des vitesses vertigineuses des ensembles de données « non structurées » non numériques précédemment refondues.

Le potentiel est immense. Kai Wu, un ancien analyste d’OGM qui dirige maintenant Sparkline Capital, une start-up d’investissement, affirme que de nombreuses stratégies de trading basées sur des données traditionnelles sont « exploitées », après avoir été analysées à mort pendant des décennies et maintenant exploitées jusqu’à l’oubli. « Mais une fois que vous avez franchi le Rubicon dans le monde des données non structurées, le fruit est soudainement beaucoup plus bas », a écrit Wu dans un article le mois dernier.

Les algorithmes de trading dirigés par le traitement du langage naturel sont particulièrement sensibles à certains mots

Positif:

De manière proactive

Satisfaisant

Révolutionner

Négatif:

Aggraver

Retraité

Goulot

Incertitude:

Anomalie

Apparaît

Clarification

Source : dictionnaire Loughran-McDonald

De nombreux investisseurs quantitatifs sophistiqués – ceux qui utilisent principalement des algorithmes pour négocier systématiquement, plutôt que les gestionnaires de fonds humains traditionnels – saisissent déjà ce fruit. L’année dernière, un article du NBER a estimé que les téléchargements algorithmiques de rapports trimestriels et annuels aux États-Unis ont explosé, passant d’environ 360 000 en 2003 à 165 millions en 2016, alors qu’ils représentaient 78 % de tous les téléchargements.

Depuis 2016, le taux a presque certainement encore augmenté. Les initiés de l’industrie disent qu’il y a aujourd’hui une quasi course aux armements entre les algorithmes de PNL qui parcourent les déclarations d’entreprise et les dirigeants d’entreprise qui tentent de les tromper en évitant certains mots et expressions délicats.

Pourtant, en réalité, la PNL est une opportunité pour tous les gestionnaires d’investissement, pas seulement pour les quants qui tentent d’exploiter systématiquement les signaux textuels. Par exemple, l’analyste de Nomura Joe Mezrich a utilisé un système de PNL pour parcourir les transcriptions de dirigeants d’entreprise parlant à des analystes financiers, notant les entreprises en fonction de leur adhésion apparente aux normes ESG. Il a découvert que les actions des sociétés les plus conformes aux critères ESG se sont mieux comportées que le marché boursier au sens large.

Les rapports trimestriels et annuels sont désormais généralement publiés dans un format convivial, mais ils ne sont que la pointe de l’iceberg des informations écrites que les investisseurs peuvent fouiller pour trouver des signaux précieux. Les transcriptions d’appels de la direction avec des analystes ou d’interviews télévisées avec des directeurs généraux, des articles de journaux, des discours de la banque centrale ou même des discussions sur les réseaux sociaux peuvent tous être extraits.

L’industrie financière aime ses mots à la mode, et tout ce qui a trait à l’intelligence artificielle est particulièrement chaud de nos jours et doit être traité avec prudence. Mais nous pourrions être au début d’une révolution de l’investissement textuel qui pourrait bouleverser l’industrie.

Twitter: @robinwigg

robin.wigglesworth@ft.com



Laisser un commentaire