短视频推荐粗排模型优化：如何提升链路目标一致性？

在短视频推荐系统中，链路目标一致性（Linkage Target Consistency, LTC）是衡量推荐效果的核心指标之一。它要求推荐链路中各环节（召回、粗排、精排、重排）的目标与业务最终目标（如用户观看时长、互动率、留存率）高度对齐。粗排模型作为连接召回与精排的关键环节，其优化对提升LTC至关重要。本文结合行业实践经验，系统阐述粗排模型优化的技术路径与关键方法。

一、链路目标一致性的核心挑战

1.1 目标传递的“衰减效应”

推荐链路通常包含多级模型（召回→粗排→精排→重排），每一级模型的目标优化若未与最终业务目标对齐，会导致目标传递的“衰减效应”。例如，粗排模型若仅优化点击率（CTR），而忽略播放完成率（Playthrough Rate, PTR），可能导致精排阶段输入的候选集质量下降，最终影响用户观看时长。

1.2 粗排模型的定位矛盾

粗排模型需在“效率”与“效果”间平衡：一方面需快速筛选百万级候选集至万级，计算效率要求高；另一方面需保证筛选后的候选集与精排目标一致。若粗排模型过度简化（如仅用线性模型），可能导致目标偏差；若复杂度过高（如深度神经网络），则可能因计算延迟影响实时性。

1.3 多目标冲突的协调难题

短视频推荐需同时优化多个目标（如CTR、PTR、互动率、留存率），不同目标间可能存在冲突。例如，优化CTR可能推荐“标题党”内容，但会降低PTR；优化互动率可能推荐争议性内容，但影响长期留存。粗排模型需在多目标间找到平衡点，避免局部优化导致全局目标受损。

二、粗排模型优化的技术路径

2.1 多目标建模：从单目标到联合优化

传统粗排模型通常采用单目标优化（如仅优化CTR），但单目标模型易导致目标偏离。多目标建模通过联合优化多个指标，提升链路目标一致性。常见方法包括：

加权求和法：将多目标转化为加权和，如 Loss = w1*Loss_CTR + w2*Loss_PTR，通过调整权重 w1, w2 平衡目标。需注意权重需根据业务阶段动态调整（如新用户期侧重CTR，成熟用户期侧重PTR）。
帕累托最优法：通过多目标优化算法（如MOEA/DD）寻找帕累托前沿，避免权重主观设定。例如，使用进化算法生成一组模型，每个模型在不同目标上表现最优，业务方根据需求选择。
MMoE（Multi-gate Mixture-of-Experts）：通过专家网络共享底层特征，门控网络动态分配权重，适应不同目标的需求。例如，在短视频场景中，MMoE可同时学习CTR和PTR的专家特征，门控网络根据用户行为动态调整权重。

2.2 特征工程：从浅层到深度特征

粗排模型的特征设计直接影响目标一致性。传统方法依赖统计特征（如历史CTR、PTR），但浅层特征难以捕捉用户动态兴趣。深度特征通过以下方式提升一致性：

用户长期兴趣建模：使用序列模型（如RNN、Transformer）挖掘用户历史行为中的长期兴趣。例如，通过用户过去7天的观看序列，预测其当前兴趣分布，避免仅依赖短期行为导致目标偏差。
上下文感知特征：融入时间、地点、设备等上下文信息，提升目标对齐的精准度。例如，晚间场景下用户更倾向长视频，粗排模型可调整PTR权重，优先推荐长内容。
负反馈特征：引入用户显式/隐式负反馈（如快速划走、未播放完成），避免推荐与用户兴趣不符的内容。例如，若用户多次快速划走某类视频，粗排模型可降低该类内容的CTR权重。

2.3 模型架构：从线性到深度学习

粗排模型的架构演进经历了从线性模型到深度学习的转变：

线性模型（LR）：计算高效，但表达能力有限，易导致目标偏差。例如，LR模型可能过度推荐热门内容，忽略长尾优质内容。
浅层DNN：通过多层感知机（MLP）提升表达能力，但需控制层数以避免计算延迟。例如，使用3层MLP（输入层→隐藏层→输出层），在保证效率的同时提升目标一致性。
深度双塔模型：将用户特征和内容特征分别编码，通过点积或注意力机制计算相似度。例如，用户塔编码用户兴趣，内容塔编码视频主题，双塔交互可捕捉用户-内容的精准匹配，提升目标对齐。
图神经网络（GNN）：通过用户-视频交互图挖掘高阶关系，提升推荐多样性。例如，使用GraphSAGE算法聚合用户邻居信息，避免推荐过度同质化内容。

2.4 评估体系：从离线到全链路

粗排模型的评估需覆盖离线指标与全链路指标：

离线指标：包括AUC、GAUC（分组AUC）、NDCG（归一化折损累积增益）等，衡量模型在测试集上的排序能力。例如，GAUC可按用户分组计算AUC，避免不同用户行为分布导致的偏差。
全链路指标：通过AB测试验证粗排优化对最终业务目标的影响，包括用户观看时长、互动率、留存率等。例如，若粗排模型优化后，用户次日留存率提升5%，则证明目标一致性显著提升。
实时监控：部署实时指标看板，监控粗排模型的关键指标（如CTR、PTR、计算延迟），及时调整模型参数或特征。例如，若发现某时段PTR下降，可排查是否因粗排模型过度优化CTR导致。

三、最佳实践与注意事项

3.1 渐进式优化策略

粗排模型优化需遵循“小步快跑”原则：

单目标验证：先优化单一目标（如CTR），确保模型收敛后再引入多目标。
特征分批上线：逐步引入深度特征，避免一次性上线过多特征导致模型不稳定。
AB测试闭环：通过AB测试验证每次优化的效果，保留有效改进，回滚无效变更。

3.2 计算效率与效果平衡

粗排模型需在计算效率与效果间找到平衡点：

模型压缩：使用量化（如FP16→INT8）、剪枝（如移除低权重连接）等技术减少计算量。
特征选择：通过特征重要性分析（如SHAP值）筛选关键特征，避免冗余特征增加计算延迟。
异步计算：将部分特征计算（如用户长期兴趣）异步化，减少实时请求的延迟。

3.3 业务目标动态对齐

粗排模型的目标需随业务阶段动态调整：

冷启动期：侧重用户留存，粗排模型可优先推荐高PTR内容，帮助用户快速找到兴趣点。
成熟期：侧重用户活跃度，粗排模型可平衡CTR与互动率，提升用户参与度。
特殊场景：如节假日、活动期间，粗排模型可临时调整目标权重，适配业务需求。

四、总结

提升链路目标一致性是短视频推荐系统的核心挑战，粗排模型作为关键环节，其优化需从多目标建模、特征工程、模型架构、评估体系四方面系统推进。通过渐进式优化、计算效率与效果平衡、业务目标动态对齐等策略，可显著提升粗排模型的目标一致性，最终实现用户观看时长、互动率、留存率等业务目标的增长。