胡亮相关研究成果介绍①：会话推荐怎么从“越推越像”走到“越推越准”

2026-05-19

会话推荐怎么从“越推越像”走到“越推越准”

一、研究背景与问题提出

推荐系统在很多场景里都已经做得足够快、足够自动，但真正让用户满意的推荐并不只是“猜你喜欢相似的东西”。这篇发表于 IJCAI 2017 的论文《Diversifying Personalized Recommendation with User-session Context》抓住的正是这个老问题：系统往往能判断你长期喜欢什么，却不一定知道你此时此刻真正需要什么。对用户来说，连续买过面包，并不意味着下一个还想买面包；在当前会话里，黄油、火腿或牛奶反而可能更相关。作者想解决的，就是推荐系统如何从“相似延续”转向“情境相关”。

围绕这一目标，论文首先把矛头指向了两类常见做法的局限。一类是传统协同过滤，它擅长利用历史偏好寻找相似用户或相似物品，但容易把推荐主线锁死在相似性上，因此常常造成结果同质化。另一类是会话推荐方法，它确实更接近即时需求，但不少方法又默认会话数据具有严格的时间顺序，或者只关注会话里的物品序列而忽略了用户本人。作者认为，真实电商和内容浏览场景里，大量会话其实是“弱顺序”甚至“集合式”的，过于强调顺序反而可能偏离问题本身。

二、核心方法与关键机制

在此基础上，论文提出了 SWIWO（session-based wide-in-wide-out）网络。它的设计思路并不复杂，却很有针对性：一条输入支路负责表示用户，另一条输入支路负责表示当前会话中的物品集合，然后在隐层中学习用户嵌入、物品嵌入和上下文嵌入，最后映射到候选物品空间，输出哪些项目最适合在此时被推荐。换句话说，这个模型不是单纯问“用户过去喜欢什么”，而是在问“当这个用户正在浏览或购买这一组东西时，下一项最合理的选择是什么”。这种联合建模让个性化偏好和即时会话语境第一次在同一条推理链里同时生效。

论文核心方法图：SWIWO 网络结构示意，展示用户向量、会话上下文与目标项目预测之间的关系。

如果进一步拆开来看，SWIWO 真正关键的地方在于它如何处理“用户”和“会话”这两类信息。论文没有让二者彼此替代，而是让它们在网络中并行进入，然后在后续映射中共同决定候选项目的得分。这样做的含义是，模型不再把用户长期偏好当成唯一主导，也不把当前会话当成短期噪声，而是明确承认两者都在影响一次推荐。对于电商场景尤其如此，因为很多时候用户买的不是“与过去最像的东西”，而是“在本次购买链条中最搭配的东西”。

从方法表达上看，论文还借鉴了语言模型中的宽输入宽输出思想。作者注意到，推荐任务和自然语言预测有一个相似点：输入空间和输出空间都很大。如果在这种问题上盲目加深网络，计算代价会迅速失控。SWIWO 选择用更浅但更宽的结构来学用户与上下文的组合表示，本质上是在效率和表达力之间做取舍。这个取舍之所以重要，是因为推荐系统不是实验室里的离线分类器，而是要进入真实线上环境的工业模型。

三、实验结果与结论

更有意思的是，作者并没有把模型做得很深，而是刻意采用浅层、宽输入、宽输出的结构。这背后反映出一个非常务实的判断：推荐系统面向的是海量用户和海量物品，如果模型过深、参数过重，即便效果略好，也不一定适合在线场景。SWIWO 的优势恰恰在于它既保留了足够的表示能力，又在训练和部署上更接近真实系统能够接受的复杂度。论文在真实电商数据集上的实验也说明，这样的结构不仅能提升关键指标，还能让推荐结果看起来更自然，不再只是过去偏好的重复回放。

论文的实验结论也不只是“比基线高几个点”这么简单。它真正证明的是：只要把问题从“相似推荐”换成“上下文相关推荐”，系统就有机会跳出过去偏好的回音室。也就是说，方法带来的提升并不只是统计意义上的，而是推荐目标本身被重新定义后带来的效果变化。这一点对后来大量强调会话意图、组合推荐和情境推荐的工作影响很大。

四、研究价值与启示

从更长远的视角看，这篇论文的重要意义并不只是提出了一个具体模型，而是重新定义了“会话个性化”的含义。真正好的推荐不应该只服务于历史画像，而应该理解用户在当前场景中的意图变化。也正因为如此，这项工作对后来购物篮补全、上下文推荐和会话建模研究都很有启发：推荐系统真正需要学会的，不只是你一贯喜欢什么，更是你此刻最需要什么。

作者简介：胡亮，同济大学计算机科学与技术学院教授、博导，分别毕业于上海交通大学与悉尼科技大学，研究方向涵盖人工智能、推荐系统、机器学习、深度学习与数据科学，入选上海海外高层次人才，获国家自然科学基金优秀青年科学基金项目（海外）支持。