Etude
Choisir une méthode externe de notation extra-financière
Ce qu’il faut savoir
La notation extra financière s’est largement répandue depuis quelques années. Elle est devenue incontournable car elle répond à plusieurs besoins, dont l’obligation croissante pour les entreprises de communiquer sur la prise en compte de critères relatifs au respect d’objectifs ESG dans leurs stratégies d’investissement1.
Il est ainsi devenu nécessaire de disposer d’indicateurs traduisant « l’implication » d’une entreprise dans le respect de critères ESG. Les notations ou scores apparaissent donc comme une réponse a priori pertinente vis-à-vis de ces exigences. Couvrant plusieurs milliers d’entreprises, basée sur des centaines d’indicateurs ESG et abordant des sujets aussi divers que la quantité d’émission carbone, la surface affectée par les ouragans, les discriminations dans une entreprise, ou la lutte anti-corruption, la notation ESG semble reposer sur des bases solides, détaillées et exhaustives.
Une comparaison nécessaire, mais délicate
Cependant, la multiplicité même de ces données, leur hétérogénéité ainsi que le nombre d’agences proposant leur service de scoring et ayant chacune leur propre méthodologie soulèvent d’importantes questions, parmi lesquelles la clarté des objectifs assignés à la notation (que mesure un score exactement ?, à quoi sert-il ?), la logique, forcément complexe, permettant d’agréger des centaines de données (les « datapoints ») en une unique information finale, ou encore la comparabilité des notations et les conclusions que l’on peut opérationnellement tirer des études mettant en évidence d’importantes divergences entre les scores d’agences.
Ainsi, les objectifs des notations apparaissent multiples ou répondent à des philosophies différentes. Certaines approches visent à intégrer les risques ESG dans la mesure du risque de crédit, d’autres se concentrent sur certaines des composantes ESG, d’autres encore tentent une approche holistique, couvrant l’ensemble de ces risques. Il est intéressant de comparer les présentations par les agences elles-mêmes de leur système de notations, qui mettent en avant, de manière plus ou moins prononcée, des objectifs comme la performance ESG, la prise en compte du couple risque / opportunité, les considérations forward looking ou de long terme, la capacité de l’entreprise à gérer les risques futurs propres à l’ESG.
L’articulation ou la cohérence entre la notion, quelque peu obscure, de performance ESG avec celle, plus classique, de performance financière, pose également question et devrait être précisée dans une approche de notation. En effet, un objectif possible de la notation peut être d’apprécier comment une entreprise fait face aux problèmes ESG, comment elle s’insère dans un certain nombre de dispositifs, d’incitations ou de réglementations, et à quel point elle s’y conforme. Il s’agit là d’une vision de l’entreprise tournée vers la société et son équilibre dans son environnement. Un autre objectif possible fait intervenir des considérations de performances d’investissement qui, pour pouvoir être reliées à la question de l’ESG, sont volontiers accompagnées du terme « durables ». La notion de performance n’est malheureusement pas définie, sauf lorsqu’elle renvoie, de manière tautologique, à celle du score, qui est justement censé la mesurer. S’il s’agit de performance financière, parfois évoquée en filigrane, il reste cependant à valider l’hypothèse, implicitement admise, qu’elle s’accorde avec les objectifs ESG, et pas uniquement sur du long-terme.
Sur le plan méthodologique, la construction d’un score ESG a ceci de complexe qu’elle doit intégrer une multitude de données (les « datapoints », au nombre de plusieurs centaines) sans que ceux-ci soient directement comparables, homogènes et donc qu’il est possible d’agréger selon une logique naturelle ou intuitive. Dans ce contexte, il est peu probable que les méthodologies mises en place par les agences soient similaires ou mêmes comparables.
Ainsi, la définition des axes ESG apparaît dans une large mesure différente d’un fournisseur à l’autre, surtout dès que l’on passe à leur déclinaison pratique. Il est toutefois possible que la clarification relative aux axes ESG et apportée dans le cadre réglementaire conduise certaines agences à reconsidérer certains de leurs datapoints, en vue de s’aligner sur ces nouvelles définitions. En effet, une méthodologie reposant sur des composantes ESG qui s’éloigneraient des standards admis risquerait de se retrouver hors-jeu vis-à-vis de ses concurrents.
Le sujet de la constitution des données et de leur utilisation est un autre exemple de la difficulté à comparer les fournisseurs. Véritables atomes constitutifs du score ESG, les datapoints présentent des enjeux essentiels à plusieurs niveaux, dont celui de disposer d’un ensemble pertinent de données au regard des objectifs du score, suffisamment complet pour appréhender les multiples aspects des risques ESG, suffisamment exhaustif pour traiter un grand nombre d’entreprises, et accompagné d’un process garantissant la qualité des données.
S’agissant du processus garantissant la qualité des données, les informations sur le process de collecte et les diligences de contrôle associées, ou encore les méthodes de complétude des données manquantes, sont généralement insuffisamment décrite dans la documentation disponible.
Par ailleurs, bon nombre de fournisseurs utilisent volontiers leur propre référentiel sectoriel. Or, les scores sont pour la plupart relatifs, c’est-à-dire qu’ils sont calculés via des métriques dépendant directement du choix du référentiel et des entreprises qui constituent les secteurs. L’impact sur le score est donc potentiellement significatif.
Les méthodes de scoring varient également de manière significative selon les fournisseurs. Certains ont adopté une approche « pyramidale » (calculs de sous scores à un niveau détaillé puis agrégations successives selon chacun des axes E, S ou G.) tandis que d’autres ont opté pour une vision transverse, sans distinction des axes ESG.
On s’attend en outre à ce que la méthodologie de scoring traduise effectivement les objectifs annoncés. Dans certains cas, ce lien est directement vérifiable, par exemple, l’existence d’un sous score dédié aux opportunités. Dans d’autres cas, le lien apparaît ténu : les éléments sont évoqués dans les étapes de la méthodologie, mais, faute d’analyse explicite, il est difficile d’apprécier dans quelle mesure ils contribuent effectivement à l’objectif annoncé.
S’agissant de méthodologies de scoring, la question de la présence d’éléments forfaitaires et de leur importance dans le score nous semble déterminante. Il apparaît que les philosophies des agences divergent nettement, entre celles présentant un corpus méthodologique où la part forfaitaire est réduite au maximum et celles où elle domine largement. Le degré forfaitaire d’une méthodologie doit pouvoir être appréciée lors du choix d’un fournisseur et en tout état de cause, celui-ci devrait justifier les pondérations utilisées, ne serait-ce que par des arguments qualitatifs. La part de jugement de l’analyste est également variable selon les approches, tout comme l’importance donnée à l’analyse quantitative versus l’appréciation qualitative.
Enfin, la manière dont est combinée l’appréciation du management se fait à différentes étapes de la méthodologie selon les fournisseurs : celle-ci peut être globale (c’est-à-dire commune à un ensemble de composantes) ou au contraire détaillée (par composante). Les pondérations appliquées aux sous scores sont indispensables pour obtenir un score agrégé et apparaissent très qualitatives et à dire d’expert dans certains cas.
Quelques critères clés
Face à ces difficultés et à ces diversités d’approches, une grande vigilance s’impose lors du choix d’un fournisseur et une investigation minimale est nécessaire. Plusieurs critères nous semblent devoir faire l’objet d’une attention particulière, dont :
la définition d’objectifs que l’on souhaite assigner au score : part plus ou moins importante de la performance financière versus une orientation clairement environnementale et sociétale, score tourné vers des aspects spécifiques comme le risque de crédit ou une composante particulière de l’ESG, intégration d’opportunités comme celles liées au risque de transition, importance donnée au long-terme, etc.
les données, incluant leur collecte et les processus de contrôle mis en œuvre, en particulier sur le traitement des données manquantes, la certification éventuelle, la conformité de la définition des axes ESG et des facteurs ESG avec les initiatives ou référentiels internationaux (TCFD, régulateurs) ;
la méthodologie : en quoi est-elle conforme aux objectifs assignés ? quel est le degré de forfaitaire (par exemple sur les pondérations) ? la part du jugement de l’analyste, les parts respectives du quantitatif et du qualitatif, le poids des controverses et la manière dont elles sont intégrées dans le score ;
la transparence et l’auditabilité : la disponibilité de la documentation et surtout son niveau de détail, la capacité à reproduire tout ou partie de la méthode ;
les aspects de déontologie : code de conduite, existence d’une muraille de Chine, certification éventuelle, autant de sujets par ailleurs relevés par l’AMF dans un récent rapport2 ;
l’information et le reporting : détail du score en ses composantes, mise en perspective temporelle, positionnement par rapport aux autres entreprises, en général, du même secteur, indicateur de qualité visant à apprécier la fiabilité du score.
On note que certaines institutions financières ont recours à plusieurs méthodes de scores, ce qui peut offrir l’avantage d’une comparaison de certaines des composantes ESG ou de compléter certains axes éventuellement non présents dans une seule méthode. Cette démarche permet d’enrichir l’analyse mais peut aussi conduire à une certaine confusion dans la mesure où, comme rappelé plus haut, les scores peuvent être fortement différents selon le fournisseur.
D’autres préfèrent s’en tenir à une seule méthodologie de scoring et se concentrer plutôt sur l’enseignement qu’il est possible de tirer au travers notamment de l’évolution dans le temps de ses valeurs, partant du principe que les méthodes sont de toute façon irréconciliables du fait de leur complexité, quand bien même elles traduiraient les mêmes objectifs. Si cette approche fait sens, elle nécessite cependant une connaissance approfondie de la méthodologie, de ses hypothèses (et notamment de leur évolution dans le temps) et de ses limites.
En tout état de cause, une démarche d’investigation sur la manière dont une notation est définie et construite nous paraît essentielle même si la difficulté de comparer entre eux des fournisseurs la rend complexe et délicate. Par ailleurs, les divergences observées entre les notes des fournisseurs et largement analysées, constituent une raison supplémentaire qui doit inciter à une réflexion approfondie sur toute méthode de scoring ESG afin de prendre conscience de ses limites.
Du côté des agences, notre revue de la documentation disponible révèle que celle-ci est globalement perfectible pour permettre une bonne compréhension de la méthodologie de scoring. Un effort important de documentation nous semble d’autant plus essentiel que les résultats des évaluations divergent fortement entre fournisseurs. En l’absence d’éléments explicatifs et donc de transparence documentaire, cette situation est génératrice de confusion, alors que certaines divergences pourraient probablement être admises si elles étaient mieux analysées et expliquées (par exemple, les écarts de notation peuvent résulter d’objectifs différents poursuivis par chacune des méthodologie). La capacité à reproduire la méthode pourrait constituer par exemple un bon indicateur de la qualité de la documentation.
1 Article 173-VI de la loi du 17 août 2015 relative à la transition énergétique pour la croissance verte.
2 20201208-fourniture-de-donnees-esg_cartographie_vf_publication.pdf. Décembre 2020
Souhaitez-vous en savoir plus, ou accéder à notre étude détaillée ?