您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
400-607-9388

胡亮相关研究成果介绍⑥:冷启动跨域推荐最怕盲迁移,真正有用的是先验而不是生搬硬套

2026-05-19
25

冷启动跨域推荐最怕盲迁移,真正有用的是先验而不是生搬硬套

一、研究背景与问题提出

跨域推荐常被看作冷启动问题的一剂良方,因为用户在一个领域里没有数据,不代表在别的领域里也完全没有痕迹。但 TOIS 2016 论文《Learning Informative Priors from Heterogeneous Domains to Improve Recommendation in Cold-Start User Domains》提醒我们,事情并没有那么简单。很多方法虽然做了跨域迁移,却默认辅助域里学到的用户表示可以直接搬到目标域里使用,于是当目标域特别稀疏时,模型看似在‘利用多域信息’,实际上却可能陷入一种更隐蔽的偏差:把不适合的知识强行迁移到陌生领域中。

作者用贝叶斯视角重述了这个问题。在他们看来,当目标域数据极少时,真正左右模型表现的往往不是那一点点观测反馈,而是先验是否足够有信息量。如果先验本身就是模糊的、粗糙的,或者根本没有针对目标域调整,那么模型即便引入跨域信息,也只是换一种方式在做盲猜。因此,与其直接迁移评分或向量,不如先从多个异构领域中学习更可靠、更有结构感的跨域先验,再让这些先验去支持目标域中的推荐建模。

二、核心方法与关键机制

围绕这一点,论文提出了 WITF(Weighted Irregular Tensor Factorization)。这个模型首先把多领域反馈组织成加权的不规则张量,从中学习用户和项目在多个领域之间的潜在结构;随后,再把这些学到的结构化表示作为 informative priors 注入到加权矩阵分解模型中,用于目标域的推荐预测。这个过程看似多了一步,实际上却让迁移变得更稳:系统不再把别的领域学到的结论直接塞进目标域,而是先把这些信息提炼成更适合作为先验的知识,然后再逐步影响目标域的参数学习。

论文核心方法图:WITF 与跨域先验迁移示意图,展示多领域反馈、张量建模与目标域推荐之间的关系。

方法上的关键不只是‘先学张量,再做矩阵分解’,而是这两步分别承担了不同角色。前一步负责从多域数据中抽取跨域共性和差异,后一步负责把这些整理好的知识真正用到目标域的预测上。这样拆开的好处是,模型既能利用丰富的多域信息,又不会因为直接迁移而把辅助域的噪声或偏差原封不动带进目标域。对于冷启动用户域来说,这种分层处理尤其重要,因为目标域几乎没有数据容错空间。

论文还特别强调了它对显式反馈和隐式反馈的统一处理能力,这并不是一个次要细节。因为跨域推荐在真实场景里往往面对的是混合数据:有的域有评分,有的域只有点击、收藏或购买。如果一个模型只能在单一反馈形式下成立,它的实际适用范围会非常有限。WITF 试图解决的,正是跨域推荐如何在现实数据条件下真正落地的问题。

三、实验结果与结论

这一策略的优势在实验中体现得很清楚。论文不仅考虑了显式反馈,也兼顾了隐式反馈场景,并在多个典型真实案例中与多种主流方法进行比较。结果显示,WITF 在冷启动用户域中表现更好,说明‘先验学习 + 目标域建模’的两阶段思路,确实比粗粒度的直接迁移更适合处理跨域冷启动。更重要的是,它让系统有机会区分哪些跨域信号值得相信,哪些只能作为弱参考,而不是一股脑地把辅助域知识全盘接收。

从结论层面看,这篇论文最大的推进,是把跨域推荐研究从‘如何搬运知识’转向了‘如何提炼知识’。这看似只是视角变化,实际上却改变了整个问题的技术路线。后来的很多迁移学习方法之所以重视 meta-prior、shared representation 或者 domain-invariant knowledge,本质上都在回应同一个问题:什么才是值得迁移的那部分东西。

四、研究价值与启示

这篇论文的启发意义在今天依然很强。很多迁移学习和推荐问题看似是在争论‘有没有额外数据可用’,但真正决定成败的往往是‘这些额外数据能否被整理成对当前任务真正有帮助的先验’。作者把跨域推荐中的迁移问题,从参数搬运推进到了先验建模层面,也让我们更清楚地看到:对冷启动系统来说,好的起点有时比复杂的拟合过程更重要。

作者简介:胡亮,同济大学计算机科学与技术学院教授、博导,分别毕业于上海交通大学与悉尼科技大学,研究方向涵盖人工智能、推荐系统、机器学习、深度学习与数据科学,入选上海海外高层次人才,获国家自然科学基金优秀青年科学基金项目(海外)支持。

已收藏 0
点赞 0

学术会议

2026年机器学习与数据安全国际学术会议(MLDS 2026)
2026年机器学习与数据安全国际学术会议(MLDS 2026)将于2026年6月12日至14日在中国广州召开,会议聚焦机器学习、数据安全、隐私计算与系统安全、安全智能系统与应用等领域开展交流。
2026-06-12
【EI会议+EI期刊,北航主办,高录用快检索】第十二届机械工程、材料与自动化技术国际学术会议(MMEAT 2026)
第十二届机械工程、材料和自动化技术国际会议(MMEAT 2026)将于2026年6月5日-7日在北京隆重举行,会议把机械工程、材料和自动化技术领域的创新学者和工业专家聚集到一个共同的论坛。
2026-06-05
【IEEE出版|南方科技大学主办】第十一届电气、电子和计算机工程研究国际学术研讨会(ISAEECE 2026)
第十一届电气、电子和计算机工程研究国际学术研讨会(ISAEECE 2026)定于2026年6月12至14日在中国深圳市召开,会议旨在为相关领域专家学者提供一个可交流学术成果,促进合作的平台。
2026-06-12
【IEEE丨山东大学牵头六所高校合办】第八届电子工程与信息学国际学术会议(EEI 2026)
第八届电子工程与信息学国际学术会议(EEI 2026)将于2026年6月26日至28日在中国济南召开。EEI 2026将围绕“电子工程”、“信息学”与“计算机科学”等相关最新研究领域展开交流探讨。
2026-06-26
【5.22截稿|艺术类大会、双刊号】第五届艺术设计与数字化技术国际学术会议 (ADDT 2026)
第五届艺术设计与数字化技术国际学术会议(ADDT 2026)将于2026年6月05-07日在中国成都盛大举办。自2022年创始以来,该会议已连续成功举办四届,由全球顶尖艺术与科技高校和研究机构联合主办
2026-06-05
【IEEE出版】第八届能源系统与电气电力国际学术会议(ICESEP 2026)
随着ICESEP前7届的成功举办,第八届能源系统与电气电力国际学术会议(ICESEP 2026)将计划于2026年6月5日至7日在中国·武汉召开,大会诚挚邀请您拨冗出席。
2026-06-05