1.随机变量 随机变量(random variable) 指取值不能事先确定的观察结果,通常简称为变量。随机变量有一个共同的特点就是不能用一个常数来表示,而且理论上讲,每个变量的取值服从特定的概率分布。
随机变量可分为两种类型:离散型变量和连续型变量。
2. 资料类型观察单位的某项特征的测量结果按其性质可分以下为三种类型。
( 1)计量资料:用定量的方法测定观察单位中某项指标量的大小,所得的资料称为计量资料(measurement data) 。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm) 、体重( kg) 、红细胞计数( lO 12 /L) 、脉搏(次/min) 、血压( kPa) 等。
(2) 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。 计数资料亦称定性资料或分类资料。其观察值是定性的,表现为可:不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数:调查一批少数民族居民的A 、B 、AB 、0 四种血型的人数等。
(3) 等级资料:将观察单位按测最结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data) 。 等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别, 但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
等级资料与计数资料不同:属性分组有科度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
3. 总体与样本 总体( population) 指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
4. 概率与频率 概率( probability) 又称几率,是度量某一随机事件A 发生可能性大小的一个数值,记为P(A)。 0 <P(A) < 1 。
在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n次试验中出现的频率( frequency) 。当试验重复很多次时P(A) =m/n。