与 UDA 问题类似,我们需要处理源域和目布转变(换句话说,差异)。
* 这被称为“数据分布偏移”,因为数据分布通常是逐渐偏移的,而不是突然改变的。
* 例如,如果我们有一个模型来识别驾照上的文字,一些州的格式可能会在几年后发生变化。我们的模型也应该能够处理新的格式(“分布偏移”)。
* 另一个例子:人们可能希望在合成数据上训练模型,同时仍然希望它们在真实图像上也能表现良好(如下图所示)。然而,合成图像和真实图像之间存在巨大的领域差距。
除了分布转移问题之外,我们还关注在线任务的基本挑战——缺乏多样化的跨域数据对。
* 为了应对这一挑战,我们提出了一种新颖的跨域引导算法(简称 CroDoBo)。
* CroDoBo 的目标:增加跨域数据多样性,并充分利用源数据样本和目标数据样本的多样化组合之 手机号数据库列表 间的宝贵差异。
深入探究
我们的方法如何运作
我们直击在线任务最根本的挑战——缺乏多样化的跨域数据对——并提出了一种基于跨域引导的新型在线域自适应算法。在每次在线查询中,我们通过引导源域与当前查询形成多样化的组合,从而增加跨域数据多样性。为了充分利用不同组合之间宝贵的差异,我们训练了一组独立的学习器来保存这些差异。之后,我们通过交换这些学习器在当前目标查询上的预测伪标签来整合它们的知识,从而共同监督目标域的学习,但不共享权重以保持学习器的发散性。通过平均集成所有学习器的多样化专业知识,我们获得了对当前目标查询更准确的预测。