胡亮教授相关成果介绍③:冷启动用户域推荐:用跨域先验替代“盲迁移” Learning Informative Priors from Heterogeneous Domains to Improve
2026-04-15
9550
作者简介
胡亮,同济大学计算机科学与技术学院教授、博导,毕业于上海交通大学与悉尼科技大学,研究方向涵盖人工智能、推荐系统、机器学习与数据科学,入选上海海外高层次人才,获国家自然科学基金优秀青年科学基金项目(海外)支持。
一、研究背景
现实世界中,用户往往只在少数熟悉领域有丰富行为,在陌生领域中却几乎没有反馈。这使得跨域推荐虽然看起来很有前景,却始终绕不开冷启动难题。论文从贝叶斯视角出发指出:当目标域数据极少时,真正决定模型表现的往往不是观测数据本身,而是先验是否足够有信息量。因此,与其把其他领域学到的用户向量直接迁移过去,不如先学习能够反映跨域关系的高质量先验。
二、论文信息
发表时间/来源 | ACM TOIS 2016 |
论文标题 | Learning Informative Priors from Heterogeneous Domains to Improve Recommendation in Cold-Start User Domains |
作者 | Liang Hu, Longbing Cao, Jian Cao, Zhiping Gu, Guandong Xu, Dingyu Yang |
关键词 | 冷启动、跨域推荐、WITF、先验学习、异构领域 |
三、核心发现
核心发现 论文提出 Weighted Irregular Tensor Factorization(WITF),用来从多个异构领域中学习用户与物品的跨域先验,并将这些先验用于加权矩阵分解模型中,提升冷启动域中的推荐效果。与传统 CDMF 相比,作者特别强调“blind transfer(盲迁移)”问题:如果目标域毫无数据,直接迁移用户因子往往会因为领域差异而失效。 |
图示:论文原文中的盲迁移问题与 WITF 建模直观示意(Figure 1)
四、研究内容解读
1. 这项研究要回答什么问题?
研究首先要回答的是:面对不同领域物品集合不一致、用户在目标域又极其稀疏的情况,跨域知识究竟应该如何利用?作者的回答是,不应把跨域推荐仅理解为参数共享,而应先学习能表达领域异质性的高阶结构,再把它转化为对目标域学习过程有约束力的先验。
2. 研究团队发现了什么?
为此,论文构建了“用户-物品-领域”的不规则三元关系。之所以说“不规则”,是因为每个领域的物品集合不同,无法直接用常规张量分解处理。WITF 正是在这一前提下设计的:它既保留不同领域的异质性,又通过共享用户和领域信息,学习出跨域可迁移的潜在结构。
3. 他们是如何证明的?
当 WITF 学到用户因子、物品因子和领域因子后,这些结果不直接用于最终打分,而是作为 Weighted Regularized Matrix Factorization 中的 informative priors。这种“先学先验、再做目标域矩阵分解”的两阶段思路,使模型在目标域数据极少甚至接近全冷启动时,仍能较稳定地推断用户偏好。论文同时统一支持显式反馈与隐式反馈两类数据。
五、关键机制与功能验证
机制上,这篇论文最关键的贡献是把跨域推荐从“参数迁移”改成了“先验迁移”。WITF 负责从多域数据中学习信息充分的跨域结构,WRMF 则在目标域利用这些结构完成偏好估计。在三类真实场景实验中,作者展示了该方法在冷启动、全冷启动及噪声数据条件下都优于多种对比模型,说明 informative priors 的思路具有较强鲁棒性。
六、总结与意义
总体而言,这项工作把跨域推荐的重点从“怎么传递参数”转移到“怎么学习可迁移的先验知识”。它不仅更契合贝叶斯建模逻辑,也为后续的元学习、预训练推荐和跨域知识蒸馏提供了很有价值的思想基础。
DOI:10.1145/2976737