Phone Data Set

Posted: **Wed Feb 19, 2025 8:28 am**

通过严谨的数学推导，研究人员发现，这两个属性等同于要求分布聚合函数具有单调性。这一发现缩小了分布聚合函数的设计空间，使得模型设计和分析更加简洁。

支付函数负责确定每个智能体需要支付的费用。支付单调性意味着如果一个智能体提高了出价，那么它在最终的联合输出中应该得到更好的待遇，也就是聚合后的分布应该朝着它更偏好的方向变化。

一致聚合则要求不同的LLM在参与拍卖时，它们的分布能够以一种合理、一致的方式进行聚合。

「第二价格」支付机制
在拍卖理论中，「第二价格」支付方式被证明能够提供良好的激励效果。

在传统的单物品拍卖中，「第二价格」支付是指把物品卖给出价最高的竞拍者，但让他支付第二高的出价。

在token拍卖模型中，研究人员也借鉴了这一理念。他们证明了（在一些合理的假设条件下），任何单调的分布聚合函数都可以采用类似「第二价格」的支付方式。

这种支付方式的好处在于，它可以促使智能体更真实地出价，因为即使他们提高出价赢得了竞拍，也不需要支付过高的费用，从而避免了智能体为了获得更好的结果而盲目抬高出价的情况。

最优聚合策略
为了设计最优的分布聚合函数，研究人员从先进的LLM训练方法印度尼西亚 whatsapp 号码列表中汲取灵感，构建了聚合损失函数。

该函数为每个输出分布关联一个总损失值，目标是，使总损失最小化。

研究人员提出了两种有效的分布聚合函数：

线性分布聚合函数：输出分布为出价加权平均值。

对数线性分布聚合函数：在对数空间中执行加权平均操作。

这两种聚合函数在不同的场景下都有着良好的表现，为实际应用提供了更多的选择。

实验结果
为了验证token拍卖模型的有效性，研究人员进行了一系列实验。

他们选择了现有的LLM，并通过提示调整（prompt tuning）的方式，让模型扮演不同的广告商角色。

Phone Data Set

通过调整分布聚合函数

通过调整分布聚合函数