Corrélation et illusion de causalité

Illusion de causalité - Causes et effets - Usageo

Un article pour illustrer une corrélation et une illusion de causalité. L’illusion de causalité consiste à percevoir une cause entre deux variables corrélées or une corrélation ne signifie pas toujours une causalité. Spurious correlations est le nom du projet de Tyler Vigen. A travers de nombreux jeux de données à sa disposition, il superpose des univers qui n’ont absolument aucun rapport les uns avec les autres. Pourtant, les sets de données sont corrélés, et de manière univoque. Pour certains exemples la corrélation est même de 99%, et cela est vraiment troublant.

L’illusion de causalité par l’exemple

Exemple de corrélation avec la consommation de margarine et les divorces

Cet exemple de Tyler VIGEN affiche une corrélation de 99.26% entre la baisse des divorces et la baisse de la consommation de margarine dans l’état du Maine aux États-unis sur une période de 10 années. Les sources des données sont communiquées en bas de page.

Puis-je conclure qu’en consommant moins de margarine, j’ai moins de chance de divorcer ? Puis-je extrapoler en concluant que la margarine impacte négativement l’entente au sein d’un couple ? Puis-je donner des conseils comme : Ne consommez plus de margarine pour le bien être de votre couple…. Bref, la créativité et l’interprétation n’ont pas de limite.

Nous pouvons dire tout et surtout n’importe quoi, en étant parfois sous couvert et légitimé par des statistiques et des sources pourtant bien réelles. Car dans cet exemple, les données sont réelles, sourcées, la période de l’observation est longue, et le coefficient de corrélation très fort. C’est ainsi que commence les illusions et parfois la malhonnêteté pour faire commerce de ses idées.

Exemple de corrélation entre la vente de glaces et la polio

Dans ce second exemple nous observons encore une fois une forte corrélation entre le nombre de vente de glaces vendues et les cas de polio. Si nous en restons là, nous pouvons conclure que la consommation de glaces engendre la polio. Sur le graphique nous observons un pic en juin, juillet, août et septembre. Nous pouvons supposer que manger des glaces n’est pas la cause de la polio , mais que la cause s’explique plutôt par la température. Plus il fait chaud, plus nous consommons de glaces, et plus il fait chaud, plus la polio se développe. C’est un exemple assez caricatural, mais parfois les éléments sont plus ambigus et nous pouvons facilement nous faire piéger. Cela demande de sortir de sa zone de confort pour rechercher des causes.

L’illusion de causalité

L’illusion de causalité consiste à percevoir une cause entre deux variables corrélées. Cette notion de corrélation, autrement dit quand 2 données semblent liées, est tout à fait différente de celle de causalité, le lien de cause à effet. C’est aussi la source de nombreuses confusions et erreurs. Nous comprenons aisément que pour de mauvaises intentions, il est très facile d’utiliser les corrélations. Corrélation ne se traduit pas par causalité.

La véritable cause de l’effet peut tout simplement ne pas être prise en compte. De plus, lorsqu’une corrélation nous ai présenté, elle peut générer un biais de cadrage. Le biais de cadrage est la tendance à être influencé par la manière dont un problème est présenté.

Quand les corrélations deviennent une arme de défense

Dans les années 70, de nombreux chercheurs commençaient à pointer du doigt l’industrie du tabac, en corrélant le nombre important de cancers du poumon avec les fumeurs. Pour les chercheurs, le tabac était l’une des causes principales à l’origine du cancer des poumons. Cette période fut donc délicate pour l »industrie du tabac et les intérêts économiques des grandes marques. Pour riposter, les principaux fabricants de tabac se sont unis pour créer leur propres laboratoires de recherche, et pour contre argumenter leurs adversaires. Quand nous cherchons, nous trouvons. De nombreux exemples de corrélations ont donc été trouvés, dans le but d’occuper l’espace et les médias, de troubler l’opinion, et de gagner du temps. Le seul objectif de ces travaux fût de contrer leurs adversaires et de minimiser l’effet du tabac sur la santé aux yeux du grand public.

Découvrez de nombreux autres exemples de Tyler VIGEN sur son site.

Conclusion

A travers le projet Spurious correlations, Tyler nous montre, indirectement et de manière caricaturale, que des données corrélées peuvent être à la source de nombreuses dérives. La moralité est qu’une corrélation est une piste à creuser et qu’il faut investiguer davantage pour démontrer une causalité, sans tomber dans les pièges. Or, cela est synonyme de temps, ce qui n’est pas toujours compatible avec le système de pensée « rapide » décrit par le modèle théorique de Kahneman.

Sources

Illusion de causalité - Causes et effets - Usageo