3-数据的产生


数据的来源


1、轶闻数据
缺乏代表性,倾向性结论


2、可得数据
为某些特定目的已收集或积累的数据
特点:免费低廉、难以满足某些特定的研究目的


抽样调查数据与实验研究数据


1、观察性研究:抽样调查数据,对研究对象不施加任何干预措施
2、实验性研究:实验研究数据,对研究对象施加处理因素,即人为的实施干预,称为干预性研究
(最常见两种数据收集方法)

抽样调查数据
对样本进行了解(统计推断)进而得到总体的信息

实验数据
研究者决定研究对象状态的过程称为给予人为的干预措施
实验性研究的可比性更好,对因果关系的推断更具说服力


简单随机抽样


一、概念

1、总体:根据研究目的确定的同质研究个体的全体

2、样本:是为了解总体而观测的总体的一部分

3、简单随机抽样:
1)随机抽样:总体中每个个体都有相同的机会被选中作为样本参与调查,不带有主观意愿,降低避免样本的选择偏倚。最简单的抽样方法是将一系列编码放在箱子里进行抽取,即简单随机抽样
2)简单随机样本


二、潜在的问题

1、抽样涵盖不全
2、测量可能存在缺陷


三、随机对照实验

1、对照
安慰剂效应:医学研究中由于心理效应所产生的虚假现象
对照思想:设置对照组以减少非处理因素对处理因素效应的影响
意义:鉴别处理因素与非处理因素之间的差异,是进行比较的必要基础;消除和减少实验误差

2、随机化
思想:使用随机的方式使每个实验对象有同等的机会被分配到任意处理组
方法:抽签
意义:保证了各对比组间的均衡可比性
问题:不一定能完全避免偏倚

3、重复
思想:运用足够多的样本来降低实验的随机误差

4、潜在问题
安慰剂效应
主观偏倚
盲法:实验对象和实验人员均不知道实验对象接受哪一种处理
双盲意义:避免主观偏倚


样本的可靠性与代表性


1、统计推断:从样本数据推理而得到关于总体的结论的过程。也叫做用样本数据估计总体特征
2、参数:
用于刻画总体的数值特征,如:总体均数、总体中位数、总体标准差、总体率等。
参数被看成总体某种特征的固定数值
3、统计量
用于描述样本的数值特征,样本均数......
可用于估计未知参数的值
统计量随样本改变而改变
统计量会随着抽样不同而不同


一、抽样分布

1、变量的总体分布:总体中所有观测值的分布
2、统计量抽样分布:统计量的分布规律

从总体中进行多次独立的重复抽样过程
简单随机抽样
计算统计量
重复上述两步
展示多个统计量的分布特征


二、抽样误差

1、抽样变异:统计量随着样本的改变而变化的现象
2、抽样误差:表达了统计量与待估计总体参数之间不完全相等的事实。
3、标准误
(1)定义:统计量的标准差,统计量与总体参数之间或统计量之间的差异,定量刻画了抽样误差的大小
(2)均数标准误
(3)率标准误
(4)借助标准误大小来帮助判断估计的可靠性,越小越可靠。
(5)增加样本量来降低误差
(6)随机样本统计量,变异大小不依赖于总体的大小
4、统计量偏倚:
抽样分布的均值与待估计参数的差值
偏倚为0,称为无偏估计(人话:估计没错)
研究结果与真实结果存在方向性偏离,存在偏倚,样本不具备代表性


伦理问题


1、研究个体知情同意
2、保证研究个体的数据保密性,仅人群水平的统计汇总报告可以公开
3、通过伦理审查委员会审查

随机对照试验使目前研究新药疗效的唯一办法

研究局限公共场合
避免研究中的欺骗行为
不能隐瞒必要信息