如何给只买书的“书虫”精准推音乐?

2026-06-01 12

42.png


想象一下,你在亚马逊(Amazon)上是个不折不扣的“书虫”,买了成百上千本书,系统通过你的历史评分对你的阅读品味了如指掌。但与此同时,你几乎从未在这个平台上买过音乐CD、DVD或录像带。 某天,系统想要“跨界”利用你买书的数据,为你推荐几张音乐专辑。传统的跨界推荐算法会认为:“你喜欢看科幻小说,一定也喜欢电子乐!”于是,它把你在书籍领域积累的“用户特征”生搬硬套过去,结果推荐出来的音乐完全不合你的胃口。


这种尴尬的跨界体验,在互联网世界中极为普遍。这篇论文指出,传统跨界推荐之所以屡屡碰壁,是因为它们都忽视了隐藏在数据背后的巨大盲区——陌生世界现象Unacquainted-World Phenomenon


根据互联网普遍存在的长尾理论(Power Law,只有极少数用户会频繁在各个领域留下评分(显式反馈),绝大多数人在大部分新领域里都是完全沉默的。由于不同领域的商品属性千差万别(比如书籍和音乐本身就是异质的),用户在自己“未涉足的领域”(即陌生世界)中,无法像在熟悉领域里那样直接被画出精准的用户画像。


43.png


44.png


传统的跨域矩阵分解(CDMF)就像图1(b)和图2展示的那样,把用户在不同领域的表格(如Book、DVD、Music)像摊煎饼一样横向强行拼接在一起。当面对最后两位在目标领域(DVD)毫无历史记录的用户时(图1b中红色虚线框标记的“陌生世界”),由于他们在这个新世界里没有产生任何行为来修正自己的向量参数,系统只能用他们在别的领域学到的、未经调整的通用特征硬套新商品(如通过uTw粗暴计算),从而导致跨界推荐的严重失真。要解决这一问题,就必须打破平面的束缚,在数学上升级推荐系统的“维度”。


为了让推荐系统具备空间感,研究团队创造性地提出了一种全新模型-跨域三阶因子分解(CDTFCross-Domain Triadic Factorization。传统的算法只考虑“用户-商品”这两个维度的平面关系,而 CDTF 引入了第三个极其关键的维度:领域(Domain。它将跨界推荐重新定义为一个三维的互动过程


然而,在数学上构建这个“三维魔方”面临一个巨大的天然障碍:常规的三维张量分解要求每个frontal slice(即每个领域的切片表格)大小必须完全一致,就像一个规则的魔方。但在现实中,商城的图书可能有几十万种,DVD可能只有几万种,参差不齐的表格根本拼不成一个完美的正方体。受到数学家Harshman提出的PARAFAC2模型的启发,CDTF巧妙地解开了这个死结:它允许每个领域拥有自己独立且长度不同的商品矩阵,用来保留该领域独特的异质特征;同时,在空间的另一侧,让所有领域共享一个通用的用户矩阵,并引入独一无二的“领域因子矩阵”。


46.png


如图4和图1(c)所示,原本由于商品数量不同而参差不齐的Book、Movie、Music矩阵切片,在经过特定的数学变换后,被成功映射为了一个由“虚拟商品(Virtual Item)”组成的、整齐划一的三维立体张量。在这个立体魔方中,用户在某个特定领域的最终偏好,不再是生搬硬套的单一向量,而是由通用用户特征、特定商品特征、以及独一无二的领域特征三者共同在空间中交织、因式分解出来的结果(图1c右侧框)。这样一来,即使你在某个领域是张白纸,系统也能通过“领域特征”的折射,精准算出的你个性化潜在偏好,完美避开了陌生世界的误差。


跨域推荐最微妙的地方,在于对辅助领域知识借用分寸的把握。如果从数据丰富的领域(如书籍)中借用的知识权重太大,就会喧宾夺主,把目标领域(如音乐)原本的特质完全淹没;如果借得太少,又无法达到破除冷启动的效果。为此,团队引入了聪明的遗传算法(GA,让计算机自己去繁衍、寻找那个最完美的跨界平衡点。


47.png


如图5所示,算法将各个领域的权重组合(如w1, w2, w3, w4)视作生物的染色体编码。通过模拟生物界的“交叉(Crossover)”(图5a)和符合高斯分布的“突变(Mutation)”(图5b),系统让不同的权重组合在虚拟空间中不断进行优胜劣汰的繁衍迭代。实验表明,这种进化机制收敛极快,通常在10个世代以内就能自动锁定多领域知识共享的“黄金配比”,实现了完全自动化的跨域参数调优。


在真实的网络生活中,其实绝大多数人买完东西或看完视频是懒得打分(显式反馈)的。我们留下更多的,是购买历史、浏览点击或关注记录等“隐式反馈”。为了让三维魔方模型真正能应用落地,研究团队进一步将模型升级为了CDTF-IF(隐式反馈增强版)。它引入了置信度建模(Confidence Level:将未涉足的空白entries赋予一个极低的“隐式不喜欢”信任度(因为你可能只是不知道它的存在),而对你频繁点击或购买的行为赋予成倍增长的置信得分。这让一类盲目的行为数据变成了AI可以读懂的“身体语言”。


在包含了图书、音乐、DVD、录像带四大领域的超大型真实亚马逊(Amazon)数据集肉搏测试中,CDTF模型在最极端的“陌生世界(TRuw)”冷启动环境下,评分预测准确率(MAE)显著碾压了传统的所有平面矩阵分解(CMF)和近邻算法。


在社交网络(SNS)数据集的真实物品推荐测试中,团队考察了推荐列表是否能准确召回用户真正悄悄关注的个性化物品(Recall@K):


48.png


图7展示了在两大不同目标领域(Domain A与Domain B),以及常规稀疏(TR25)和极端陌生世界(TRuw)四种不同组合环境下的Recall@k性能表现。可以非常直观地看到,无论在哪个测试场景下,代表CDTF-IF模型(紫色带有五角星标记的曲线)都稳稳地在最上方,其推荐长尾个性化物品的命中率,将老一代算法(如 Most-Pop热门推荐、N-CDCF-U近邻法等)远远甩在了身后。


本篇发表在顶会上的里程碑式论文,通过将复杂的跨界数据从“平面拼接”升维为“三维魔方拆解”,成功攻克了推荐系统多年来在多领域联合推荐时的“陌生世界”冷启动死穴。


作者简介:胡亮,同济大学计算机科学与技术学院教授、博导。研究方向涵盖人工智能、推荐系统、机器学习、深度学习与数据科学。入选上海海外高层次人才,获国家自然科学基金优秀青年科学基金项目(海外)支持。 


ORCID:0000-0001-8588-2177。


DOI10.1145/2488388.2488441

会议官网

扫码关注艾思科蓝订阅号 回复“0”即可领取该资料

去登录