Li artigos sobre aprendizado de currículo para LLMs há cerca de 3 anos. Usando algum recurso/redução nos gradientes para ordenar corpora textuais, o que acelerou a convergência. Gostaria de lembrar o artigo.

ORDER-0.53%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Compartilhar
Comentário
0/400
TokenAlchemistvip
· 08-01 21:21
para ser honesto, a ordenação de gradientes é apenas copium... o roteamento ótimo é onde está o verdadeiro alpha
Ver originalResponder0
LucidSleepwalkervip
· 07-30 05:26
Mais um paper que não consigo lembrar...
Ver originalResponder0
StablecoinAnxietyvip
· 07-30 05:20
O código antigo de três anos, onde é que se pode encontrar?
Ver originalResponder0
DiamondHandsvip
· 07-30 05:09
Os acadêmicos também têm momentos de amnésia.
Ver originalResponder0
pvt_key_collectorvip
· 07-30 05:02
Eu também não consigo lembrar.
Ver originalResponder0
GasFeeSobbervip
· 07-30 04:58
Top, esqueci todos os detalhes do artigo.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)