Décrypter la politique monétaire grâce à l'analyse linguistique
À travers leurs discours soigneusement conçus, les banques centrales influencent les marchés financiers. Les déclarations déclenchent souvent des réactions immédiates sur les marchés. Dans ses analyses, le KOF utilise le traitement du langage naturel pour décoder des indicateurs issus des procès-verbaux des banques centrales, ce qui permet de reproduire et de prédire les mouvements du marché en temps réel.
Les procès-verbaux des réunions du comité de la banque centrale (Federal Open Market Committee - FOMC) constituent des outils importants pour communiquer au public et aux acteurs du marché les discussions et les décisions du comité en matière de politique économique et de conditions économiques. Le langage utilisé est clair, mais contient également des expressions subtilement intégrées et nuancées ainsi que des indications sur les mesures et actions futures en matière de politique économique, de sorte que l'analyse et l'interprétation de ces documents sont essentielles à la compréhension des orientations économiques et politiques futures.
Alors que l’on interprète les expressions de façon manuelle et que l’on peut en tirer des enseignements, l'utilisation de méthodes informatiques permet d'extraire systématiquement et de manière reproductible des indicateurs spécifiques du texte et de transformer le langage nuancé en données quantifiables pour les prévisions économiques.
Dans ce contexte, le KOF utilise des méthodes simples de traitement du langage naturel (Natural Language Processing, NLP) et recourt à une approche basée sur un dictionnaire, qui permet d'analyser le texte par calcul et de formuler des indicateurs spécifiques. Cette approche, relativement simple mais efficace, permet d'extraire des informations pertinentes, issues procès-verbaux du FOMC et de transformer les données textuelles en indicateurs quantifiables qui peuvent être utilisés pour les prévisions économiques.
Décryptage des indicateurs économiques
La méthode vise à identifier les termes économiques clés du texte (cf. G2 - la taille représentée du terme clé est relative à la fréquence) du texte et à examiner les mots qui les entourent quant à leur connotation positive ou négative. Le dictionnaire Loughran, spécialement conçu pour les contenus financiers, sert de base à cette évaluation. Cela permet de s'assurer que les humeurs identifiées s'inscrivent dans le contexte de discussions économiques et financières.
Dans la pratique, cela signifie que cette méthode identifie les termes les plus fréquents dans le texte, tels que « Inflation » ou « Chômage ». Cette approche examine ensuite les 20 mots les plus proches du terme clé en question pour déterminer leur humeur - positive ou négative - dans le dictionnaire. Enfin, une moyenne est établie pour chaque terme et chaque date de publication. Le résultat est une représentation en série chronologique des sentiments concernant différents aspects économiques.
Un coup d'œil sur le sentiment général net (cf. graphique 4), qui a été déduit de la méthode, montre les liens possibles avec les événements économiques et les crises. On remarque que le sentiment général moyen (représenté par la ligne grise) a tendance à être négatif pendant la plupart des crises économiques (indiquées en rouge clair).
Présentation des différents indices
Alors que les séries chronologiques de mots peuvent fournir un aperçu précieux du sentiment économique, elles peuvent être sujettes à des fluctuations en raison de leur nature sporadique et de leur rareté. C'est la raison pour laquelle la méthode présentée ici combine plusieurs séries temporelles de mots afin de créer un agrégat de mots qui offre une représentation plus claire et plus stable des variables économiques sous-jacentes. Grâce à l'utilisation de méthodes d'apprentissage automatique, les séries chronologiques de mots sont automatiquement sélectionnées et regroupées dans un index.
Le graphique 3 donne un aperçu visuel des indices créés. Chaque sous-graphique visualise une variable économique spécifique, représentée par deux lignes standardisées: la ligne verte représente l'indice généré par l'harmonisation des sentiments de mots clés sélectionnés (énumérés dans le sous-titre), tandis que la ligne rouge représente les données d'observation réelles.
Un exemple est l'indice « Inflation » (CPI Durables), qui est composé des significations des mots « Future », « Direct », « Value », « Committee seek » et « Open market committee ». En observant le graphique, on constate que la ligne verte, qui représente notre indice construit, est remarquablement proche des chiffres réels du chômage (ligne rouge). On observe un schéma similaire dans le graphique des « Heures de travail », où l'indice est synthétisé à partir de termes tels que « Employment », « Indicate », « Nonfarm » et « Job ».
Les mots utilisés pour créer les indices n'ont pas tous un lien direct avec la variable économique à suivre en soi. Des termes comme « Committee », « Future » et « Run objective » sont souvent mentionnés dans les protocoles et capturent donc un sentiment général. L'algorithme sélectionne ensuite ces mots et les mélange aux mots ciblés - le résultat est ainsi moins marqué par les valeurs aberrantes.
La voie de l'avenir: des données en temps réel à partir du texte
L'analyse des procès-verbaux du FOMC nous permet de créer des indices capables de retracer la tendance de véritables ratios. Il convient de noter que de nombreuses variables économiques sont mises à jour avec un décalage de plusieurs mois. Dans les situations où les informations fournies en temps réel peuvent être précieuses, par exemple en période de crise, les indices obtenus à partir de données textuelles offrent une perspective supplémentaire. Il reste à voir dans quelle mesure cette méthode apporte des avantages concrets pour les prévisions économiques. Le KOF continue de suivre cette recherche afin de mieux comprendre le potentiel et les limites de l'utilisation des données textuelles pour les prévisions économiques.
Contact
KOF FB Konjunktur
Leonhardstrasse 21
8092
Zürich
Switzerland