胡亮教授相关成果介绍③：冷启动用户域推荐：用跨域先验替代“盲迁移” Learning Informative Priors from Heterogeneous Domains to Improve

2026-04-15

10989

作者简介

胡亮，同济大学计算机科学与技术学院教授、博导，毕业于上海交通大学与悉尼科技大学，研究方向涵盖人工智能、推荐系统、机器学习与数据科学，入选上海海外高层次人才，获国家自然科学基金优秀青年科学基金项目（海外）支持。

一、研究背景

现实世界中，用户往往只在少数熟悉领域有丰富行为，在陌生领域中却几乎没有反馈。这使得跨域推荐虽然看起来很有前景，却始终绕不开冷启动难题。论文从贝叶斯视角出发指出：当目标域数据极少时，真正决定模型表现的往往不是观测数据本身，而是先验是否足够有信息量。因此，与其把其他领域学到的用户向量直接迁移过去，不如先学习能够反映跨域关系的高质量先验。

二、论文信息

发表时间/来源	ACM TOIS 2016
论文标题	Learning Informative Priors from Heterogeneous Domains to Improve Recommendation in Cold-Start User Domains
作者	Liang Hu, Longbing Cao, Jian Cao, Zhiping Gu, Guandong Xu, Dingyu Yang
关键词	冷启动、跨域推荐、WITF、先验学习、异构领域

三、核心发现

核心发现

论文提出 Weighted Irregular Tensor Factorization（WITF），用来从多个异构领域中学习用户与物品的跨域先验，并将这些先验用于加权矩阵分解模型中，提升冷启动域中的推荐效果。与传统 CDMF 相比，作者特别强调“blind transfer（盲迁移）”问题：如果目标域毫无数据，直接迁移用户因子往往会因为领域差异而失效。

图片3.png 图示：论文原文中的盲迁移问题与 WITF 建模直观示意（Figure 1）

四、研究内容解读

1. 这项研究要回答什么问题？

研究首先要回答的是：面对不同领域物品集合不一致、用户在目标域又极其稀疏的情况，跨域知识究竟应该如何利用？作者的回答是，不应把跨域推荐仅理解为参数共享，而应先学习能表达领域异质性的高阶结构，再把它转化为对目标域学习过程有约束力的先验。

2. 研究团队发现了什么？

为此，论文构建了“用户-物品-领域”的不规则三元关系。之所以说“不规则”，是因为每个领域的物品集合不同，无法直接用常规张量分解处理。WITF 正是在这一前提下设计的：它既保留不同领域的异质性，又通过共享用户和领域信息，学习出跨域可迁移的潜在结构。

3. 他们是如何证明的？

当 WITF 学到用户因子、物品因子和领域因子后，这些结果不直接用于最终打分，而是作为 Weighted Regularized Matrix Factorization 中的 informative priors。这种“先学先验、再做目标域矩阵分解”的两阶段思路，使模型在目标域数据极少甚至接近全冷启动时，仍能较稳定地推断用户偏好。论文同时统一支持显式反馈与隐式反馈两类数据。

五、关键机制与功能验证

机制上，这篇论文最关键的贡献是把跨域推荐从“参数迁移”改成了“先验迁移”。WITF 负责从多域数据中学习信息充分的跨域结构，WRMF 则在目标域利用这些结构完成偏好估计。在三类真实场景实验中，作者展示了该方法在冷启动、全冷启动及噪声数据条件下都优于多种对比模型，说明 informative priors 的思路具有较强鲁棒性。

六、总结与意义

总体而言，这项工作把跨域推荐的重点从“怎么传递参数”转移到“怎么学习可迁移的先验知识”。它不仅更契合贝叶斯建模逻辑，也为后续的元学习、预训练推荐和跨域知识蒸馏提供了很有价值的思想基础。

DOI：10.1145/2976737