Les plans d’expérience

add\bullet Introduction:

Une expérience est une opération menée sous des hypothèses fixées et entièrement contrôlées dans le but de découvrir un effet inconnu, de tester une relation ou encore de démontrer une loi connue et donc clarifier la relation entre ces hypothèses et le résultat de l’expérience. L’experience devient une expérience aléatoire si les résultats possibles peuvent être décrit au travers d’une probabilité de réalisation bien définie. Dans le cadre de la présence de facteurs, nous parlerons d’expérience factorielle. Le plan d’expériences est alors construit en fonction de l’objectif de l’étude, des facteurs intervenant et du coût d’opération.

Les plans d’expérience représentent donc la seconde approche de collecte des données avec les plans de sondage. Ils ont pour objectif de proposer un modèle reliant les variables explicatives \mathbf{X} (appelés facteurs dans le jargon des plans d’expériences) à la variable à expliquer \mathbf{Y} et visant ainsi à optimiser l’étude de l’intéraction entre \mathbf{X} avec \mathbf{Y}. Le grand intérêt des plans d’expérience étant notamment de déterminer le nombre d’expériences minimum et optimal à effectuer afin de concilier coût de calculs et fiabilité des résultats.

Chaque plan d’expérience possède ses hypothèses d’utilisation et sa méthodologie à suivre.

\bullet Le problème:

L’objectif est d’estimer au mieux le vecteur \beta de paramètres du modèle linéaire:

\mathbf{Y} = \mathbf{X} \cdot \mathbf{\beta} + \mathbf{\epsilon}

, ce qui revient à obtenir des estimateurs de variance minimale et dépendant exclusivement de \mathbf{X}. Pour se faire, deux principaux critères sont utilisés:

– Le critère du déterminant maximal ou D-optimalité: max | \mathbf{X' X} |

– Le critère de la somme des variances minimale ou A-optimalité: min (Tr (\mathbf{X ' X} ^{-1}))

Concernant les facteurs qualitatifs, il est intéressant de noter qu’une condition d’orthogonalité nécessaire et suffisante pour les modèles à effets principaux sans interaction est que le plan soit équlibré ce qui revient à dire que nous sommes en présence du même nombre de mesures pour \mathbf{Y} quelque soit le croisement de nos facteurs.

Remarquons que pour des facteurs ordinaux ce problème revient à étudier la corrélation deux à deux des différents facteurs. Dans le cas de non-corrélation nous avons orthogonalité entre les facteurs ce qui implique un plan optimal. Ce fait n’est pas toujours respecté, nous nous intéressons alors à l’isovariance par rotation soit l’étude de la variance de la prédiction de \mathbf{Y} en un point de \mathbf{X}.

Une fois le plan d’expérience définit, il suffit alors de mesurer \mathbf{Y} pour les diférentes combinaisons de facteurs retenues et appliquer une analyse statistique (en générale l’analyse de variance) afin d’obtenir des résultats fiables. En général, les mesures sont prises une fois par combinaison de facteurs retenus, néanmoins il est tout à fait possible de prendre plusieurs mesures si l’expérimentateur juge plus important de diminuer le nombre d’expériences à effectuer au détriment du nombre de mesures à prendre.

\bullet Les différents plans:

1) Les plans carrés latins

Histoire: Première trace d’utilisation en 1624.

Principe: Les plans carrés latins sont des plans orthogonaux qui consistent à considérer trois facteurs qualitatifs (X ^1, X ^2, X ^3) à K \geq 2 groupes et de construire la matrice du plan d’expérience de dimension K \times K présentant les différentes combinaisons des trois facteurs croisés.

Critique: Les plans carrés latins permettent de réduire le nombre d’expériences de K ^3 à K ^2. Ils ne peuvent estimer que les effets principaux. Ce sont des plans orthogonaux D-optimal.

Exemple: Soit les trois facteurs (X ^1, X ^2, X ^3) à trois groupes tel que X ^1 \in \lbrace A1, B1, C1 \rbrace, X ^2 \in \lbrace A2, B2, C2 \rbrace et X ^3 \in \lbrace A3, B3, C3 \rbrace. La matrice du plan d’expérience est alors de dimensions 3 \times 3 et vaut:

\begin{pmatrix} X ^1 = / X ^2 = & A2 & B2 & C2 \\ A1 & A3 & B3 & C3 \\ B1 & B3 & C3 & A3 \\ C1 & C3 & A3 & B3 \end{pmatrix}

, la première ligne et la première colonne correspondent respectivement aux modalités prises par les facteurs X ^2, X ^1 et les cellules restantes la valeur du facteur X ^3 quand X ^1 = k_1, X ^2 = k_2.

2) Les plans carrés gréco-latins

Histoire: Première trace d’utilisation en 1782 par Leonhard Euler.

Principe: Les plans carrés gréco-latins sont des plans orthogonaux qui consistent à considérer quatre facteurs qualitatifs (X ^1, X ^2, X ^3, X ^4) à K \geq 2 groupes en superposant les deux plans carrés latins sur (X ^1, X ^2, X ^3) et (X ^1, X ^2, X ^4).

Critique: Les plans gréco-latins permettent de réduire le nombre d’expériences de K ^4 à K ^2. Il existe des plans carrés gréco-latins pour toutes dimensions à l’exception de K = 1, 2 et 6. Ce sont des plans orthogonaux D-optimal.

Exemple: Soit les quatre facteurs (X ^1, X ^2, X ^3, X ^4) à K = 3 tel que X ^1 \in \lbrace A1, B1, C1 \rbrace, X ^2 \in \lbrace A2, B2, C2 \rbrace, X ^3 \in \lbrace A3, B3, C3 \rbrace et X ^4 \in \lbrace A4, B4, C4 \rbrace. La matrice du plan d’expérience est alors,

\begin{pmatrix} X ^1 = / X ^2 = & A2 & B2 & B3 \\ A1 & A3 A4 & B3 B4 & C3 C4 \\ B1 & B3 C4 & C3 A4 & A3 B4 \\ C1 & C3 B4 & A3 C4 & B3 A4 \end{pmatrix}

, la première ligne et la première colonne correspondent respectivement aux modalités prises par les facteurs X ^2, X ^3 et les cellules restantes la valeur du croisement des facteurs X ^3, X ^4 quand X ^1 = k_1, X ^2 = k_2.

3) Les plans complètement randomisés

Histoire: Première trace d’utilisation en 1920 par Ronald Aylmer Fisher.

Principe: Les plans complètement randomisés consistent à considérer un ou plusieurs facteurs qualitatifs (X ^1, \cdots, X ^P) à K_1, \cdots, K_P \geq 2 groupes respectifs et attribuer aléatoirement pour chaque croisement de groupes des différents facteurs un nombre n_{k_1, \cdots, n_{k_P}} de mesures à prendre au sein de l’ensemble des unités statistiques supposées uniformes.

Si toutes les combinaisons apparaissent au moins une fois alors le plan est considéré complet, sinon incomplet.

Critique: Globalement il s’agit du plan d’expérience se rapprochant le plus d’un tirage aléatoire simple. Pas forcément le plus économique, néanmoins il permet de considérer des facteurs à nombre de modalités différents.

Exemple: Soit les deux facteurs (X ^1, X ^2) à, respectivement, K_1 = 3 et K_2 = 2 groupes. Nous décidons de tirer aléatoirement un effectif pour les différentes combinaisons de groupes des facteurs et obtenons n_{k_1 = 1, k_2 = 1} = 2, n_{1,2} = 3, n_{2,1} = 1, n_{2,2} = 5, n_{3,1} = 3, n_{3,2} = 4 d’observations. La matrice du plan d’expérience est alors,

\begin{pmatrix} X ^1 & X ^2 & Effectif \\ g_1 & g_1 \\ \vdots & & \times 2 \\ g_1 & g_2 \\ \vdots & & \times 3 \\ g_2 & g_1 \\ \vdots & & \times 1 \\ g_2 & g_2 \\ \vdots & & \times 5 \\ g_3 & g_1 \\ \vdots & & \times 3 \\ g_3 & g_2 \\ \vdots & & \times 4 \end{pmatrix}

4) Les plans randomisés à blocs

Histoire: Première trace d’utilisation en 1920 par Ronald Aylmer Fisher.

Principe: Les plans randomisés à blocs consistent à considérer des combinaisons de groupes de un ou plusieurs facteurs qualitatifs (X ^1, \cdots, X ^P) à K_1, \cdots, K_P \geq 2 groupes respectifs. Ces q = K_1 \times \cdots \times K_P combinaisons donnent q! permutations possibles et sont alors arrangées et tirées r (fixé au prélable) fois aléatoirement avec remise pour constituer les blocs du plan d’expérience.

Critique: Les plans randomisés par blocs permettent de réduire le nombre d’expériences de q! à r. De plus, ils permettent de considérer des facteurs à nombre de modalités différent.

Exemple: Soit les deux facteurs (X ^1, X ^2) à, respectivement, K_1 = 3 et K_2 = 2 groupes. Nous avons alors les combinaisons suivantes A = (X ^1 = g_1, X ^2 = g_1), B = (X ^1 = g_1, X ^2 = g_2), C = (X ^1 = g_2, X ^2 = g_1), D = (X ^1 = g_2, X ^2 = g_2), E = (X ^1 = g_3, X ^2 = g_1), F = (X ^1 = g_3, X ^2 = g_2) ce qui constitue 3 \times 2 = 6 combinaisons possibles et donc 6! = 720 permutations. La matrice du plan d’expérience est alors, pour r = 6 blocs construient par tirage aléatoire avec remise sur les différentes permutations de combinaisons,

\begin{pmatrix} \mbox{bloc 1 = } & E & D & C & B & A & F \\ \mbox{bloc 2 = } & D & C & B & A & E & F \\ \mbox{bloc 3 = } & E & B & A & C & D & F \\ \mbox{bloc 4 = } & E & D & C & B & A & F \\ \mbox{bloc 5 = } & A & B & C & F & E & D \\ \mbox{bloc 6 = } & E & C & D & A & B & F \end{pmatrix}

5) Les plans factoriels complets

Histoire: ND.

Principe: Les plans factoriels complets sont des plans orthogonaux qui consistent à considérer un ou plusieurs facteurs (X ^1, \cdots, X ^P) ordinaux en posant, par convention, -1 la valeur minimale pour le facteur X ^p et +1 pour la valeur maximale. Le plan d’expériences se construit à partir des 2 ^P expériences possibles soient les combinaisons des couples (-1, 1) des différents facteurs considérés. Si nous voulons intégrer les intéractions, il suffit de multiplier les colonnes des facteurs seuls entre eux pour construire celles des intéractions.

Si les combinaisons de niveaux sont présentes le même nombre de fois alors le plan factoriel complet est dit équilibré.

Les plans fractionnaires de type 2 ^{P - k} sont dérivés des plans factoriels complets et proposent une solution au problème suivant: proposer un plan d’expériences permettant d’étudier P facteurs à partir d’un nombre d’expériences moindres. L’approche est alors de considérer le plan factoriel complet associé au nombre maximum de facteurs compatibles avec le nombre d’expériences. Ce sous-ensemble, épuré de k facteurs et qui constituent les facteurs de « base », permet alors de construire les nouveaux facteurs qui sont le fruit du produit entre les facteurs de « base ». Nous dirons qu’ils sont confondus avec l’intéraction considérée. Ce type de plan se nomme également plan de Box et Hunter ou de Plackett et Burman (si le nombre d’expérience n’est plus un multiple de 2 mais de 4) et constituent les plans de criblage principalement adaptés aux études de faisabilité.

Critique: Ce sont des plans orthogonaux D-optimal et A-optimal.

Exemple: Soit les trois facteurs (X ^1, X ^2, X ^3) à deux niveaux chacun. Nous avons alors 2 ^3 = 8 expériences possibles. La matrice du plan d’expérience factoriel complet pour les facteurs d’ordre 1 et le facteur d’ordre 2 X ^1 \times X ^2 est alors,

\begin{pmatrix} Experience & X ^1 & X ^2 & X ^3 & X ^1 \times X ^2 \\ 1 & -1 & -1 & -1 & +1 \\ 2 & +1 & -1 & -1 & -1 \\ 3 & -1 & +1 & -1 & -1 \\ 4 & +1 & +1 & -1 & +1 \\ 5 & -1 & -1 & +1 & +1 \\ 6 & +1 & -1 & +1 & -1 \\ 7 & -1 & +1 & +1 & -1 \\ 8 & +1 & +1 & +1 & +1 \end{pmatrix}

6) Les plans composites

Histoire: ND.

Principe: Les plans composites sont des plans qui ne sont pas orthogonaux et qui consistent à considérer un ou plusieurs facteurs ordinaux (X ^1, \cdots, X ^P) seuls, à 3 niveaux, avec leur intéraction d’ordre 2 (soit le croisement deux à deux des facteurs considérés). Il faut poser, par convention, -1 la valeur minimale pour le facteur X ^p0 sa valeur médiane et +1 pour la valeur maximale. Les plans composites se placent dans une approche géométrique du problème en cherchant à visualiser le carré (pour deux facteurs), le cube (pour trois facteurs) ou l’hyper-cube (pour plus de trois facteurs) construit à partir du codage ci-dessus. Les P facteurs sont placés aux extrémités et les intéractions, d’ordre 2, le sont à une distance \alpha (fixée) des extrémités. Le plan d’expérience se construit à l’instar d’un plan factoriel complet (ou fractionnaire) et considère pour les facteurs d’ordre 2 la matrice d’experience de taille [2 \cdot (P - k)] \times (P - k) (où on soustrait à P le nombre k de facteurs non considérés comme de « base » si nous sommes en présence d’un plan fractionnaire, k = 0 pour le plan factoriel complet) de forme:

\begin{pmatrix} Experience & X ^1 & X ^2 & X ^3 & \cdots & X ^{P - k - 1} & X ^{P - k} \\ 2 ^{P - k} + 1 & -\alpha & 0 & 0 & \cdots & 0 & 0 \\ 2 ^{P - k} + 2 & +\alpha & 0 & 0 & \cdots & 0 & 0 \\ 2 ^{P - k} + 3 & 0 & -\alpha & 0 & \cdots & 0 & 0 \\ 2 ^{P - k} + 4 & 0 & +\alpha & 0 & \cdots & 0 & 0 \\ \vdots \\ 2 ^{P - k} + 2 \cdot (P - k - 1) & 0 & 0 & 0 & \cdots & 0 & -\alpha \\ 2 ^{P - k} + 2 \cdot (P - k) & 0 & 0 & 0 & \cdots & 0 & +\alpha \end{pmatrix}

, également complété par L0 lignes nulles représentant les points à l’origine de la figure géométrique.

Les principales caractéristiques des plans composites étant l’isovariance par rotation et la possibilité d’expérimentation séquentielle qui revient à augmenter un plan factoriel fractionnaire de criblage en lui ajoutant des points au centre et d’autres points pour estimer les autres effets. Les plans composites appartiennent à la famille des plans pour surfaces de réponse du second degré. Le plan de Box-Behnken (de la même famille) représente une alternative au plan composite qui n’est pas isovariant par rotation mais adapté aux expériences difficiles à réaliser. Le plan d’expérience devient alors l’ensemble des permutations du triplet (-1, 0, +1) tel qu’au moins un facteur soit égal à 0 par expérience. Le plan de Doelhert, dont la stratégie repose sur la visualisation géométrique d’un polygone et plus d’un cube, peut également être cité comme l’un des plus connus.

Critique: Les plans composites ne sont pas orthogonaux mais permettent de travailler sur des facteurs à K = 3 niveaux.

Exemple: Soit les trois facteurs (X ^1, X ^2, X ^3) à trois niveaux chacun. Nous avons alors 2 ^3 = 8 expériences possibles pour le plan factoriel complet. La matrice du plan d’expérience se divise alors en 3 blocs, pour \alpha = 1, L0 = 2,

\begin{pmatrix} Experience & X ^1 & X ^2 & X ^3 \\ 1 & -1 & -1 & -1 \\ 2 & +1 & -1 & -1 \\ 3 & -1 & +1 & -1 \\ 4 & +1 & +1 & -1 \\ 5 & -1 & -1 & +1 \\ 6 & +1 & -1 & +1 \\ 7 & -1 & +1 & +1 \\ 8 & +1 & +1 & +1 \\ & & & \\ 9 & -1 & 0 & 0 \\ 10 & +1 & 0 & 0 \\ 11 & 0 & -1 & 0 \\ 12 & 0 & +1 & 0 \\ 13 & 0 & 0 & -1 \\ 14 & 0 & 0 & +1 \\ & & & \\ 15 & 0 & 0 & 0 \\ 16 & 0 & 0 & 0 \end{pmatrix}

7) Les plans asymétriques

Histoire: ND.

Principe: Les plans asymétriques consistent à considérer un ou plusieurs facteurs qualitatifs (X ^1, \cdots, X ^P) à, respectivement, K_1, \cdots, K_P \geq 2 groupes. Il existe plusieurs méthodes sous contrainte que le nombre d’expériences minimum doit être égal au nombre de paramètres à estimer  > \sum_{p = 1} ^P (K_p - 1) + 1. La plus populaire est celle de fusion qui consiste à considérer le plan fractionnaire pour P - k facteurs de « base » et à construire par combinaison de facteurs ceux dont nous avons besoin pour respecter le nombre de groupes respectifs voulus.

Critique: L’orthogonalité D-optimal est obtenu pour les plans asymétriques si le nombre d’expériences est un multiple des K_{p1}, K_{p2}, \forall p_1, p_2, ce qui est rare sauf dans le cas d’un plan complet.

Exemple: Nous voulons le plan pour trois facteurs, l’un de quatre niveaux et les deux autres à deux niveaux. Par la méthode de fusion. Nous partons du plan fractionnaire 2 ^{4 -1} = 8 suivant:

\begin{pmatrix} Experience & A & B & C & D \\ 1 & -1 & -1 & -1 & -1 \\ 2 & +1 & -1 & -1 & +1 \\ 3 & -1 & +1 & -1 & +1 \\ 4 & +1 & +1 & -1 & -1 \\ 5 & -1 & -1 & +1 & +1 \\ 6 & +1 & -1 & +1 & -1 \\ 7 & -1 & +1 & +1 & -1 \\ 8 & +1 & +1 & +1 & +1 \end{pmatrix}

Afin de construire notre facteur à quatre niveaux nous posons (C = -1, D = +1) \Rightarrow E = 1, (C = -1, D = +1) \Rightarrow E = 2, (C = +1, D = -1) \Rightarrow E = 3 et (C = +1, D = +1) \Rightarrow E = 1. Par conséquent nous obtenons le plan d’expérience suivant:

\begin{pmatrix} Experience & A & B & E \\ 1 & -1 & -1 & 1 \\ 2 & +1 & -1 & 2 \\ 3 & -1 & +1 & 2 \\ 4 & +1 & +1 & 1 \\ 5 & -1 & -1 & 4 \\ 6 & +1 & -1 & 3 \\ 7 & -1 & +1 & 3 \\ 8 & +1 & +1 & 4 \end{pmatrix}

\bullet Bibliographie:

– Statistique, dictionnaire encyclopédique de Yadolah Dodge

– Probabilité, analyse des données et Statistique de Gilbert Saporta

– Plan d’expérience pour l’estimation de la surface réponse de B. Govaerts

– Le document: http://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/st-m-modmixt4-plans.pdf

– Le document: Plans factoriels complets, plans fractionnaires. Cas des facteurs ayant deux modalités de Frédéric Bertrand