Calculatrice de Valeur p



Valeur p





La valeur p est une valeur quantitative qui nous permet de déterminer si une hypothèse nulle (ou une hypothèse revendiquée) est vraie.

La détermination de la valeur p nous permet de déterminer si nous devons rejeter ou non une hypothèse revendiquée.

Nous définissons le niveau de signification, qui sert de seuil, pour savoir si une hypothèse doit être rejetée ou non. Ce point de coupure est également appelé niveau alpha (α).

Les valeurs typiques des niveaux alpha sont 0,1%, 0,5%, 1%, 2,5%, 5%, 10%, 20%, 25% et 40%.

Si la valeur p est inférieure à α, cela représente une valeur p statistiquement significative. Ça signifie que nous pouvons rejeter l'hypothèse revendiquée.

Si la valeur p est supérieure ou égale à α, nous ne pouvons pas rejeter l'hypothèse revendiquée.

Pour calculer la valeur p, cette calculatrice a besoin de 4 éléments de données: la statistique de test, la taille de l'échantillon, le type de test d'hypothèse (unilatéral à gauche, unilatéral à droite, ou bilatéral) et le niveau de signification (α).

Lorsque vous travaillez avec des données, le nombre de valeurs de données lui-même n'est pas très significatif car il n'est pas normalisé. Vous pouvez obtenir tout un tas de points de données pour un scénario donné, mais vous devez en extraire des éléments significatifs. C'est là que la statistique de test joue un rôle important.

La statistique de test représente la distance entre les résultats réels de l'échantillon et la valeur réclamée en termes d'erreurs standard. Les erreurs standard sont une mesure standardisée qui nous indique dans quelle mesure les résultats réels des données sont éloignés des données revendiquées (par rapport à l'hypothèse nulle). Si la distance entre la valeur revendiquée et les résultats réels obtenus est faible en termes d'erreurs standard, les données ne sont pas loin de la réclamation et il est probable que l'hypothèse (les données) revendiquée soit vraie. Si la distance est plus grande, les données montrent que nous devrions rejeter l'hypothèse nulle (H0).

La statistique de test est donc très importante car elle nous donne une mesure standardisée qui montre à quel point les résultats réels sont éloignés des données revendiquées.

La taille de l'échantillon est une autre variable dont nous avons besoin pour calculer la valeur p. La taille de l'échantillon est très importante car elle détermine si nous utilisons la distribution normale standard (distribution Z) pour rechercher la valeur p ou si nous utilisons la distribution t pour rechercher la valeur p.

Si la taille de l'échantillon est inférieure à 30 (n <30), nous considérons qu'il s'agit d'une petite taille d'échantillon. Lorsque la taille de l'échantillon est petite, nous utilisons la distribution t pour calculer la valeur p. Dans ce cas, nous calculons les degrés de liberté, degrés de liberté = n-1. Nous utilisons ensuite les degrés de liberté, ainsi que la statistique de test, pour calculer la valeur p.

Si la taille de l'échantillon est supérieure à 30 (n> 30), nous considérons qu'il s'agit d'un échantillon de grande taille. Lorsque la taille de l'échantillon est grande, nous utilisons la distribution Z pour calculer la valeur p.

C'est pourquoi la taille de l'échantillon est très importante. Il détermine si nous devons utiliser la distribution t ou la distribution Z

Ensuite, nous devons connaître le type de test d'hypothèse. Il peut s'agir de tests unilatéraux à gauche (Ha: μ H0) ou bilatéral (Ha: μ ≠ H0).

Le type de test d'hypothèse nous donne un cadre de référence. Si le type de test est unilatéral à gauche au lieu de unilatéral à gauche, alors la valeur p est 1 - valeur p. Si le type de test est bilatéral, nous devons doubler la valeur p obtenue à partir de la statistique de test. Cela tient compte des possibilités de queue gauche et de queue droite. C'est pourquoi il doit être doublé.

Le niveau de signification, α, est la valeur que nous définissons comme point de coupure pour savoir si nous rejetons une hypothèse nulle ou non. Plus le niveau de signification est bas, plus la plage d'acceptation de l'hypothèse nulle est étroite. Plus le niveau de signification est élevé, plus l'intervalle que nous avons pour accepter l'hypothèse nulle est large. Le niveau de signification le plus couramment utilisé est probablement de 5%. Cela signifie que si la valeur p est inférieure au niveau de signification de 5%, cela signifie que nous pouvons accepter l'hypothèse nulle avec une confiance de 95%. Si le niveau de signification est de 1% et que la valeur p est inférieure à ce 1%, cela signifie que nous pouvons accepter l'hypothèse nulle avec une confiance de 99%. Si le niveau de signification est de 0,1% et que la valeur p est inférieure à ce montant, cela signifie que nous pouvons accepter l'hypothèse nulle avec une confiance de 99,9%. Si le niveau de signification est de 10% et que la valeur p est inférieure à ce montant, cela signifie que nous pouvons accepter l'hypothèse nulle avec une confiance de 90%.

Ainsi, le niveau de signification représente le point de coupure que nous choisissons et détermine avec quel niveau de confiance nous pouvons accepter les résultats.

Passons en revue quelques exemples sur le calcul de la valeur p.

Supposons qu'une entreprise revendique l'hypothèse nulle selon laquelle le montant moyen dépensé par les clients par transaction est de 32$ (H0: μ = 32). Cependant, vous pensez que la moyenne est bien inférieure à cela (Ha: μ < 32). Vous calculez que la statistique de test est de -2,5 sur la base d'une taille d'échantillon de 100 (n = 100). Quelle est la valeur p?

La première chose est qu'il s'agit de tests d'hypothèses unilatéraux à gauche. La taille de l'échantillon étant supérieure à 30, elle est considérée comme une grande taille d'échantillon. Par conséquent, nous recherchons la valeur p sur la table de distribution Z. La statistique de test est déjà donnée. En regardant cela sur le graphique, vous obtenez une valeur p de 0,0062 ou 0,62%.

Autre exemple: Supposons qu'une entreprise prétende recevoir en moyenne 4 réclamations clients par an (μ = 4). Cependant, vous avez eu des expériences terribles avec eux et pensez que le montant réel est beaucoup plus élevé (μ> 4). Supposons que vous localisiez 10 clients (n= 10) pour connaître leur expérience et obtenir une statistique de test de 1,96. Quelle est la valeur p?

Ceci est un test de l'hypothèse unilatéral à droite. La taille de l'échantillon est de 10, nous allons donc trouver la valeur p basée sur la table de distribution T. Calcul des degrés de liberté, degrés de liberté= 10 - 1 = 9. Cela nous donne une valeur p de 0,95. Cependant, puisqu'il s'agit d'un test d'hypothèse unilatéral à droite, pour calculer la valeur p réelle, nous devons prendre 1 et soustraire 0,95, ce qui nous donne une valeur de 0,025.

Autre exemple: supposons qu'une entreprise déclare recevoir 200 commandes par jour mais que vous pensez que ce nombre n'est pas correct (Ha: μ ≠ 200). Vous obtenez une statistique de test de 0,5 basée sur une taille d'échantillon de 400. Quelle est la valeur p?

Il s'agit donc d'un test d'hypothèse bilatéral car l'hypothèse alternative est que μ ≠ 200. Comme la taille de l'échantillon est grande, nous recherchons la valeur p sur la table de distribution Z. La valeur p correspondante est 0,6915. Mais nous voulons trouver la zone au-delà de cela. Nous prenons donc 1 et en soustrayons la valeur p. Cela nous donne 0,3085. Comme il s'agit d'un test d'hypothèse bilatéral, nous doublons cette valeur et obtenons 0,617 ou 61,7%.

Un point à savoir est que les valeurs p sont des probabilités; par conséquent, ils doivent être compris entre 0 et 1. Une valeur p supérieure à 1 ou inférieure à 0 représente un résultat erroné.

Ressources associées








Page d'accueil