在进行CVR预估时,我们通常采取的策略和CTR一样,只不过训练样本有所变化。这样会导致两个问题:
-
Sample selection bias (SSB)
通常我们CVR的训练是在有点击的曝光样本上进行的,而在线上服务的时候是要对所有曝光的商品进行打分的,这种样本分布的偏差会影响模型的效果。
-
Data Sparsity (DS)
CVR的数据量通常要比CTR低1~3个数量级,所以会造成稀疏性问题。
在进行CVR预估时,我们通常采取的策略和CTR一样,只不过训练样本有所变化。这样会导致两个问题:
Sample selection bias (SSB)
通常我们CVR的训练是在有点击的曝光样本上进行的,而在线上服务的时候是要对所有曝光的商品进行打分的,这种样本分布的偏差会影响模型的效果。
Data Sparsity (DS)
CVR的数据量通常要比CTR低1~3个数量级,所以会造成稀疏性问题。