因果推断导论笔记-Lecture8-Design & Analysis

理论上,哪种研究必须考察协变量的混杂性?

  1. RE
  2. OBS

答案:是只有OBS。问题的意思是找到某些X使得在X下W和Y独立,而随机试验中W已经是随机分配的了,已经是和Y独立了。

Design

是在看到Y之前进行的。研究W的分布。

Goal:Valid Inference

Rule:1)Inference Precision:higher、better

​ 2)Valid Range:longer、better

下面三步是一个循环。

0.估计倾向得分

见上节课。

1.Assessing Covariate Balance

How difference are the two distribution?

  1. 单变量XiX_i的比较(这里的XX应该指的是某一个维度的协变量)(优点:model free):

除以2的意思是不需要很精确,两个分布相似就行了

  1. 总体X\vec X的比较,马氏距离(倾向得分本身就体现了协变量的重要性差异,依赖倾向得分的估计,这部分是model的):

l_hat的意思是样本均值

p=EWi=P(Wi=1)P(Wi=1Xi=x)=E(WiXi=x)=e(x)所以p=E(e(x))p=EW_i=P(W_i=1)\\ P(W_i=1|X_i=x)=E(W_i|X_i=x)=e(x)\\ 所以p=E(e(x))

ftE(e)=f(e(X)=eWi=1)f_t^E(e)=f(e(X)=e|W_i=1)

由上节课知道在e(X)下,W和X是独立的。

所以P(Wi=1e(Xi)=e)=P(Wi=1e(Xi)=e,Xi=x)=P(Wi=1Xi=x)=e(x)=eP(W_i=1|e(X_i)=e)=P(W_i=1|e(X_i)=e,X_i=x)=P(W_i=1|X_i=x)=e(x)=e

由上面的引理得到:

Whether exists similar units?

能不能找到对照?

可能要考虑舍弃一些数据。

2.Improving Balance

如果评估失败,需要平衡。

Trimming

修整:

每个个体算倾向得分,然后从0-1排列画图如上

注意这里的倾向得分计算是用那个逻辑回归模型估计的,输入X得到倾向得分。

Blocking

Trimming切完之后内部也可能不均衡


每次用中位数切,直到t值不超过1或者样本量过小

在单个层内是否均衡

多个层

QQ图的例子

Matching

找1个相似还是M个相似,选择过程是不是无放回?(即,已经被选走的能不能被别人选走)。

Analysis

Analysis based on Blocking

blocking处理后估计的结果是不是无偏的?

期望

关心E(τ^difτfsX)E(\hatτ^{dif}-τ_{fs}|X)是否为0。(简化了,不是τspτ_{sp}

无分层的时候,是有偏差的

第一步第一项哪来的:

E(1Nti=1NWiYi(1)1Ni=1NYi(1)X)=E[E(1Nti=1NWiYi(1)1Ni=1NYi(1)X,W)]=E(1Nti=1NWiYi(1)1Ni=1NYi(1)X,Wi=1)P(Wi=1)+E(1Nti=1NWiYi(1)1Ni=1NYi(1)X,Wi=0)P(Wi=0)E(\frac{1}{N_t}\sum_{i=1}^{N}W_iY_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X)\\ =E[E(\frac{1}{N_t}\sum_{i=1}^{N}W_iY_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X,W)]\\ =E(\frac{1}{N_t}\sum_{i=1}^{N}W_iY_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X,W_i=1)P(W_i=1)+\\ E(\frac{1}{N_t}\sum_{i=1}^{N}W_iY_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X,W_i=0)P(W_i=0)\\

上式的第一项:

=E(1Nti=1NYi(1)1Ni=1NYi(1)X)NtN=E(1Nti=1NYi(1)1Ni=1NYi(1)Xi)NtN=NcNtNi=1NE(Yi(1)Xi)NtN=NcNE(Yi(1)Xi)=E(\frac{1}{N_t}\sum_{i=1}^{N}Y_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X)·\frac{N_t}{N}\\ =E(\frac{1}{N_t}\sum_{i=1}^{N}Y_i(1)-\frac1N\sum_{i=1}^{N}Y_i(1)|\vec X_i)·\frac{N_t}{N}\\ =\frac{N_c}{N_tN}\sum_{i=1}^{N}E(Y_i(1)|\vec X_i)·\frac{N_t}{N}\\ =\frac{N_c}{N}E(Y_i(1)|\vec X_i)

第二项就比较容易算了。

结果有偏(完全随机化试验下结果也一样,但这个平均差是0,所以无偏)。

分层后:

线性模型假定下:

这张图不太理解,用回归修正偏差

如果真实模型不是线性模型,使用回归法调整是否还有帮助?

。如果是高阶的ΔY=f(ΔX)ΔY=f(ΔX),也能用Taylor展开。

方差

引入回归,不仅可以减少偏差,还能减少方差。(因为ε拆出了Xβ出来)

和Weighting方法的比较

右边例子是假设第一个个体在j组,且在处理组

也就是说Blocking是更粗的Weighting方法,用所在层的平均倾向得分e(j)来代替,而不是个体的倾向得分。

Blocking的优点就是更稳定,而Weighting是无偏的。

Analysis base on Matching

配对的顺序、配对的度量方法是很有影响的。

有放回的匹配:

偏差会变小,方差会变大。

反过来就是

修正偏差


因果推断导论笔记-Lecture8-Design & Analysis
https://bebr2.com/2022/11/14/因果推断导论笔记-Lecture8-Design & Analysis/
作者
BeBr2
发布于
2022年11月14日
许可协议