在来自独立来源的随机数据收集中,通常观察到数据分布是正常的。这意味着,在绘制一个图表时,在水平轴上显示变量的值,在垂直轴上绘制值计数时,我们得到一条钟形曲线。曲线的中心表示数据集的平均值。在图中,50% 的值位于平均值的左侧,另外 50% 的值位于图表的右侧。这在统计中称为正态分布。
R 有四个内置函数来生成正态分布。它们如下所述。
以下是上述函数中使用的参数的描述 -
- x 是数字向量。
- p 是概率向量。
- n 是观测值个数(样本量)。
- mean 是样本数据的平均值。它的默认值为零。
- SD 是标准差。它的默认值为 1。
dnorm()函数
此函数给出给定均值和标准差在每个点的概率分布高度。
当我们执行上述代码时,它会产生以下结果——
pnorm()函数
此函数给出正态分布的随机数小于给定数值的概率。它也被称为 “Cumulative Distribution Function”。
当我们执行上述代码时,它会产生以下结果——

qnorm()函数
此函数获取概率值并给出一个累积值与概率值匹配的数字。
当我们执行上述代码时,它会产生以下结果——
rnorm()函数
该函数用于生成分布正态的随机数。它采用样本大小作为输入并生成如此多的随机数。我们绘制一个直方图来显示所生成数字的分布。
当我们执行上述代码时,它会产生以下结果——
