Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 5|回復: 0
打印 上一主題 下一主題

从而引起指标跷跷板问题为此

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
跳轉到指定樓層
樓主
發表於 2024-5-14 17:03:19 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

优化方式:底层稀疏很容易受到各个多目标梯度反传的影响,造成梯度冲突,针对重要的表征增加参数量或新增任务特定表征,并对重要表征控制梯度反传,时长或交互目标不更新底层部分或更新时设置较小学习率最后是模型输出层,为促进新内容、长尾内容分发,并保证模型输出的预估分的稳定性和准确性,我们从探索结构和学习目标上进行了对应优化


探索结构:搜索场景消 科威特手机号码列表 费内容个数比推荐少,马太效应问题也更加严重,对行为积累不够充足的新内容或长尾内容,预估不够准确为此设计全链路冷启和探索通道,并基于不确定性预估范式,在模型中引入基于对抗梯度的探索网络,基于预估的不确定性和对抗梯度在输入侧做扰动和探索学习目标:之前搜索场景采用的学习目标是w的,在排序能力上优于w,但预估准确性上不足,会造成后续链路无法使用预估分



业界有不少研究关于w损失如何做预估校准,例如中阿里巴巴校准工作、中校准工作等参考相关工作并结合场景特点,在原有的基础上增加用于校准的,在梯度更新上控制校准不影响底层的更新,只更新多目标建模层和输出塔的参数,提高预估分数的稳定性和准确性,方便后续融合、混排等环节使用



回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|踏浪論壇  

GMT+8, 2025-2-7 15:54 , Processed in 0.071132 second(s), 25 queries .

抗攻擊 by GameHost X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |