第三节 数据分析
一、 基础统计分析
(一) 描述统计分析
1集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值。常用三个指标:
(1) 众数 数据出现次数最多的变量值
(2) 中位数 处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。
(3) 均值 用于反映一组数据的一般水平。
2离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量远离其中心值的程度,所以也叫离中趋势。
(1) 极差
(2) 平均差
(3) 方差和标准差
3相关分析
是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。变量之间的相关关系主要有线性相关和非线性相关、正相关和负相关。
(二) 推论统计分析
1单个样本的参数估计
参数是指总体的某一特征值,如均值、方差等,往往是未知数;而根据样本数据计算出来的均值、样本标准差、样本比例一般称为样本“统计量”。
(1) 点估计。
(2) 区间估计
当总体方差已知时,总体均值的区间估计
当总体方差未知时,总体均值的区间估计
2单个样本的假设检验
先对总体参数的值提出一个假设,然后利用样本信息,根据抽样分布的原理去检验原先提出的假设是否成立。步骤如下:
(1) 提出原假设和替换假设
(2) 确定并计算检验统计量。
(3) 规定显著性水平α,并确定接受域或拒绝域的临界值。
(4) 作出统计决策
一般来说,总体方差已知,用Z统计量检验;总体方差未知,用t统计量检验。
二、 多元统计分析
(一) 多元回归分析
(二) 方差分析 适用于实验数据、调查数据和观察数据的分析
步骤:(1)明确因变量与自变量,建立原假设;(2)计算总方差(3)显著性检验(4)分析结果
(三) 列联表分析
(四) 聚类分析 可用于研究消费者行为、寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。也称群分析或类分析,是对样品或变量进行分类的一种多元统计方法,目的在于将相似的事物归类。
变量的类型有三种尺度:间隔尺度,有序尺度,名义尺度
聚类分析方法;系统聚类法、样品聚类法、动态聚类法、模糊聚类法、图论聚类法和聚类预报法等
(五) 判别分析
根据判别的组数:两组判别分析和多组判别分析
根据判别函数的形式:线性判别和非线性判别
根据判别时处理变量的方法不同,逐步判别、序贯判别
根据判别标准的不同:距离判别、Fisher判别、Bayes判别等
(六) 因子分析
基本步骤:(1)确定研究变量(2)计算所有变量的相关矩阵(3)构造因子变量(4)因子旋转(5)计算因子得分
应用于:消费者使用习惯和态度研究,品牌形象和特性研究,服务质量调查,个性测试,形象调查,市场划分识别,顾客、产品及行为分类
(七) 结合分析
基本步骤:(1)确定产品或服务的属性与属性水平;(2)将产品的所有属性与属性水平通盘考虑,并采用正交设计的方法将这些属性与属性水平进行组合,生成一些列虚拟产品(3)请消费者对虚拟产品进行评价,通过打分、排序等方法调查消费者对虚拟产品的喜好、购买的可能性等(4)计算属性的效用、计算属性的模型和方法主要包括最小二乘法回归、多元方差分析;(5)解释结果(6)评估信度和效度,常用的有拟合优度和t检验等;(7)市场预测与市场模拟。
应用于如下几个方面:(1)决定各种属性在消费者选择品牌时的相对重要性;(2)估计不同属性水平的市场占有率;(3)确定最受欢迎品牌的属性水平组合;(4)根据消费者对属性水平喜好的相似性,进行消费者市场分类;(5)应用于新产品概念识别;(6)竞争分析;(7)定价研究;(8)广告研究(9)销售分布等。