如何计算 P 值:7 个步骤(附图片)

目录:

如何计算 P 值:7 个步骤(附图片)
如何计算 P 值:7 个步骤(附图片)
Anonim

P 值是一种统计量度,可帮助科学家确定他们的假设是否正确。 P 值用于确定他们的实验结果是否在所观察事件的正常值范围内。通常,如果数据集的 P 值低于某个预先确定的数量(例如,0.05),科学家将拒绝他们实验的“零假设”--换句话说,他们将排除假设他们的实验变量对结果没有有意义的影响。今天,通常通过首先计算卡方值在参考表中找到 p 值。

脚步

计算 P 值步骤 1
计算 P 值步骤 1

步骤 1. 确定实验的预期结果。

通常,当科学家进行实验并观察结果时,他们会事先了解“正常”或“典型”结果会是什么样子。这可以基于过去的实验结果、可信的观察数据集、科学文献和/或其他来源。对于您的实验,确定您的预期结果并将其表示为数字。

  • 示例:假设先前的研究表明,在全国范围内,红色汽车比蓝色汽车更常收到超速罚单。假设全国平均结果显示对红色汽车的偏好为 2:1。我们想通过分析我们镇警察开出的超速罚单,了解我们镇的警察是否也表现出这种偏见。如果我们随机抽取 150 张给我们镇上红色或蓝色汽车的超速罚单,我们会期望 100 用于红色汽车和 50 如果我们镇的警察根据国家偏见开罚单,那就是蓝色汽车。
计算 P 值步骤 2
计算 P 值步骤 2

步骤 2. 确定实验的观察结果。

现在您已经确定了您的预期值,您可以进行实验并找到您的实际(或“观察到”)值。同样,将这些结果表示为数字。如果我们操纵某些实验条件并且观察到的结果与此预期结果不同,则有两种可能性:这可能是偶然发生的,或者我们对实验变量的操纵导致了差异。寻找 p 值的目的基本上是为了确定观察到的结果是否与预期结果的差异达到了“零假设”--实验变量与观察到的结果之间没有关系的假设- 不太可能拒绝

  • 示例:假设在我们镇上,我们随机选择了 150 张超速罚单,这些罚单分别开给红色或蓝色汽车。我们发现 90 红车票和 60 是为蓝色汽车。这些与我们预期的结果不同 10050, 分别。我们的实验操作(在这种情况下,将我们的数据源从国家数据源更改为本地数据源)是否会导致结果发生这种变化,或者我们镇的警察是否如全国平均水平所暗示的那样有偏见,而我们只是观察到机会变异? p 值将帮助我们确定这一点。
计算 P 值步骤 3
计算 P 值步骤 3

步骤 3. 确定实验的自由度。

自由度衡量研究中涉及的可变性量,这取决于您正在检查的类别数量。自由度方程为 自由度 = n-1 ,其中“n”是您的实验中正在分析的类别或变量的数量。

  • 示例:我们的实验有两类结果:一类是红色汽车,一类是蓝色汽车。因此,在我们的实验中,我们有 2-1 = 1 自由度。

    如果我们比较红色、蓝色和绿色汽车,我们会

    第2步。 自由度等等。

计算 P 值步骤 4
计算 P 值步骤 4

步骤 4. 使用卡方将预期结果与观察到的结果进行比较。

卡方(写作“x2") 是衡量实验预期值和观察值之间差异的数值。卡方的方程为: X2 = Σ((o-e)2/e) ,其中“o”是观测值,“e”是期望值。将所有可能结果的等式结果相加(见下文)。

  • 请注意,此等式包括 Σ (sigma) 运算符。换句话说,您需要计算 ((|o-e|-.05)2/e) 对于每个可能的结果,然后将结果相加以获得您的卡方值。在我们的示例中,我们有两个结果 - 收到罚单的汽车是红色或蓝色。因此,我们将计算 ((o-e)2/e) 两次 - 一次用于红色汽车,一次用于蓝色汽车。
  • 示例:让我们将预期值和观察值代入方程 x2 = Σ((o-e)2/e)。请记住,由于 sigma 运算符,我们需要执行 ((o-e)2/e) 两次 - 一次用于红色汽车,一次用于蓝色汽车。我们的工作如下:

    • X2 = ((90-100)2/100) + (60-50)2/50)
    • X2 = ((-10)2/100) + (10)2/50)
    • X2 = (100/100) + (100/50) = 1 + 2 = 3.
计算 P 值第 5 步
计算 P 值第 5 步

步骤 5. 选择显着性水平。

现在我们知道了实验的自由度和卡方值,在找到 p 值之前,我们只需要做最后一件事--我们需要决定显着性水平。基本上,显着性水平是衡量我们对结果的确定程度的衡量标准 - 低显着性值对应于实验结果偶然发生的低概率,反之亦然。显着性水平写为小数(例如 0.01),这对应于随机抽样产生的差异与您观察到的差异一样大的百分比,如果总体中没有潜在差异。

  • 一个常见的误解是 p=0.01 意味着结果有 99% 的可能性是由科学家对实验变量的操纵引起的。不是这种情况。如果你在 7 个不同的日子穿着你的幸运裤,而且股市每天都在上涨,你的 p<0.01,但你仍然有充分的理由相信结果是偶然产生的,而不是由市场和你的裤子之间的联系。
  • 按照惯例,科学家通常将实验的显着性值设置为 0.05,即 5%。这意味着满足此显着性水平的实验结果在随机抽样过程中最多有 5% 的机会被重现。对于大多数实验,生成不太可能由随机抽样过程产生的结果被视为“成功”,表明实验变量的变化与观察到的效果之间存在相关性。
  • 示例:对于我们的红色和蓝色汽车示例,让我们遵循科学惯例并将显着性水平设置为 0.05.
计算 P 值步骤 6
计算 P 值步骤 6

步骤 6. 使用卡方分布表来估算您的 p 值。

科学家和统计学家使用大表来计算他们实验的 p 值。这些表格通常设置为左侧的纵轴对应于自由度,而顶部的横轴对应于 p 值。使用这些表格时,首先找到您的自由度,然后从左到右读取该行,直到找到第一个值大于您的卡方值。查看列顶部的相应 p 值 - 您的 p 值介于该值和下一个最大值(紧邻其左侧的值)之间。

  • 卡方分布表可从多种来源获得--它们可以很容易地在网上或科学和统计教科书中找到。如果您手边没有,请使用上面照片中的那个或免费的在线表格,例如此处由 medcalc.org 提供的表格。
  • 示例:我们的卡方是 3。所以,让我们使用上图中的卡方分布表来找到一个近似的 p 值。因为我们知道我们的实验只有

    第1步。 自由度,我们将从最高的行开始。我们将沿着这一行从左到右,直到我们找到一个更高的值

    第 3 步。 - 我们的卡方值。我们遇到的第一个是 3.84。查看此列的顶部,我们看到相应的 p 值为 0.05。这意味着我们的 p 值是 在 0.05 和 0.1 之间 (表中下一个最大的 p 值)。

计算 P 值步骤 7
计算 P 值步骤 7

步骤 7. 决定是拒绝还是保留原假设。

由于您已经找到了实验的近似 p 值,您可以决定是否拒绝实验的原假设(提醒一下,这是您操纵的实验变量不会影响您观察到的结果的假设。)如果您的 p 值低于您的显着性值,那么恭喜您 - 您已经表明,如果您操纵的变量与您观察到的效果之间没有真正的联系,那么您的实验结果将极不可能发生。如果你的 p 值高于你的显着性值,你就不能自信地做出这样的声明。

  • 示例:我们的 p 值介于 0.05 和 0.1 之间。它不小于 0.05,因此,不幸的是,我们 不能拒绝我们的零假设.这意味着我们没有达到我们决定的标准,即我们镇的警察以与全国平均水平显着不同的速度向红色和蓝色汽车开罚单。
  • 换句话说,从全国数据中随机抽样会产生 5-10% 的时间比全国平均水平低 10 票的结果。由于我们希望这个百分比低于 5%,我们不能说我们是 当然 我们镇的警察不太偏向红色汽车。

视频 - 通过使用此服务,某些信息可能会与 YouTube 共享。

提示

  • 科学计算器将使计算变得容易得多。您也可以在网上找到计算器。
  • 您可以使用多种计算机程序计算 p 值,包括常用的电子表格软件和更专业的统计软件。

受主题流行