Внутреннее состояние llm параметризует чертовски триллион или около того размерный градиентный обновление. Это много степеней свободы для влияния. В отличие от инженеров, устанавливающих одномерную "награда функцию"…

LOT-1.28%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
GasWhisperervip
· 21ч назад
градиентная оптимизация побеждает братков в любой день, серьезно
Посмотреть ОригиналОтветить0
NFTRegrettervip
· 22ч назад
награда взорвалась, принадлежит
Посмотреть ОригиналОтветить0
NullWhisperervip
· 22ч назад
технически градиентное пространство более сложное, чем они думают, смх
Посмотреть ОригиналОтветить0
MrDecodervip
· 22ч назад
Вот так, человек действительно может победить природу.
Посмотреть ОригиналОтветить0
  • Закрепить