推荐系统论文精读——ESMM

全空间多任务模型

Posted by AJW on September 16, 2019

在进行CVR预估时,我们通常采取的策略和CTR一样,只不过训练样本有所变化。这样会导致两个问题:

  1. Sample selection bias (SSB)

    image-20190917201101129

    通常我们CVR的训练是在有点击的曝光样本上进行的,而在线上服务的时候是要对所有曝光的商品进行打分的,这种样本分布的偏差会影响模型的效果。

  2. Data Sparsity (DS)

    CVR的数据量通常要比CTR低1~3个数量级,所以会造成稀疏性问题。