L`utilisation d`un cadre de causalité formel garantit que les hypothèses nécessaires pour augmenter l`interprétation statistique avec une interprétation causale sont explicites. Par exemple, si nous croyons que la figure 2D ou E représente la véritable structure causale qui a généré nos données, notre estimation de l`équation 2 peut être interprétée comme une estimation de l`effet de traitement moyen. L`utilisation d`un modèle causal et une distinction claire entre les hypothèses fondées sur la commodité et fondées sur la connaissance font clairement comprendre que la valeur réelle d`un estimet peut différer de la valeur réelle de l`effet causal de l`intérêt. L`ampleur de cette différence est une quantité causale; choix de l`estimateur statistique ne l`affecte pas. Le biais statistique dans un estimateur peut être minimisé par des méthodes axées sur les données, tout en évaluant l`ampleur probable ou potentielle de la différence entre l`estimet la quantité causale souhaitée nécessite des approches alternatives (parfois appelées comme analyses de sensibilité). 54 – 58 Pearl définit un modèle causal comme un triple ⟨ ordonné U, V, E ⟩ {displaystyle langle U, V, Erangle}, où U est un ensemble de variables exogènes dont les valeurs sont déterminées par des facteurs extérieurs au modèle; V est un ensemble de variables endogènes dont les valeurs sont déterminées par des facteurs dans le modèle; et E est un ensemble d`équations structurelles qui expriment la valeur de chaque variable endogène en fonction des valeurs des autres variables en vous et en V. [1] les modèles causaux ont des structures formelles avec des éléments avec des propriétés spécifiques. [3] les modèles causaux peuvent aider à la question de la validité externe (que les résultats d`une étude s`appliquent aux populations non étudiées). Les modèles causaux peuvent permettre de fusionner des données issues de plusieurs études (dans certaines circonstances) pour répondre à des questions qui ne peuvent pas être répondues par un ensemble de données individuel. La modélisation causale est un domaine interdisciplinaire qui a son origine dans la révolution statistique des années 1920, en particulier dans le travail du biologiste et statisticien américain Sewall Wright (1921). Les contributions importantes proviennent de l`informatique, de l`économétrie, de l`épidémiologie, de la philosophie, des statistiques et d`autres disciplines. Compte tenu de l`importance de la causalité dans de nombreux domaines de la philosophie, il y a eu un intérêt philosophique croissant dans l`utilisation de modèles de causalité mathématique. Deux ouvrages majeurs, SPIRTES, Glymour et Scheines 2000 (abréviation SGS), et Pearl 2009, ont été particulièrement influents.

Les modèles causaux sont des modèles mathématiques représentant des relations de causalité au sein d`un système ou d`une population. Ils facilitent les inférences sur les relations causales des données statistiques. Ils peuvent nous enseigner une bonne affaire sur l`épistémologie de la causalité, et sur la relation entre la causalité et la probabilité. Ils ont également été appliqués à des sujets d`intérêt pour les philosophes, tels que la logique des contrefactuels, la théorie de la décision, et l`analyse de la causalité réelle. [2] l`entrée sur la causalité probabiliste est écrite par le même auteur que cette entrée, et contient quelques chevauchements.