He leído artículos sobre el aprendizaje del currículo para LLMs hace aproximadamente 3 años. Usando alguna característica/reducción en los gradientes para ordenar los corpus textuales, lo que aceleró la convergencia. Ojalá pudiera recordar el artículo.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
6
Compartir
Comentar
0/400
TokenAlchemist
· 08-01 21:21
la verdad es que el ordenamiento por gradiente es solo copium... el enrutamiento óptimo es donde está el verdadero alpha.
Ver originalesResponder0
LucidSleepwalker
· 07-30 05:26
otra vez el paper que no puedo recordar...
Ver originalesResponder0
StablecoinAnxiety
· 07-30 05:20
El viejo código de hace tres años, ¿dónde se puede encontrar?
He leído artículos sobre el aprendizaje del currículo para LLMs hace aproximadamente 3 años. Usando alguna característica/reducción en los gradientes para ordenar los corpus textuales, lo que aceleró la convergencia. Ojalá pudiera recordar el artículo.