用Dropout思想做特征选择保证效果,还兼顾了线上性能?-linux运维-PHP中文网

用Dropout思想做特征选择保证效果,还兼顾了线上性能?

星夢妙者

发布： 2025-07-19 09:40:17

原创

838人浏览过

这篇论文《towards a better tradeoff between effectiveness and efficiency in pre-ranking: a learnable feature selection based approach》向我们展示了如何在粗排模型中平衡模型的效率和效果。文中提出了基于可学习特征选择的fscd方法，并在真实的电商系统中进行了应用。

简介

用Dropout思想做特征选择保证效果,还兼顾了线上性能? 如图(a)所示，由于系统时延的限制，推荐系统通常是多阶段的。图(b)中，论文指出，简单的representation-focused(RF)模型会严重限制模型的表达能力（如传统的双塔模型，最后一层向量点积，就是简单的RF模型），主要是因为缺乏特征交叉。因此，我们能否在特征上进行优化，只保留效果好的特征，同时保证模型推断效率更高，使用与精排相同的高交互性（interaction-focused, IF）的模型呢？答案是肯定的！

FSCD

用Dropout思想做特征选择保证效果,还兼顾了线上性能? 粗排模型使用精排模型并保持高效率，就意味着在某些方面需要做出牺牲，而这无疑是在特征上进行的。因此，IF的粗排模型使用的是精排模型的特征子集。如图所示，FSCD方法通过梯度优化来保证效果，通过特征维度的正则化来保证效率。在训练过程中，可以挖掘出一批有用的特征。