No treinamento de grandes modelos de linguagem (LLMs), como o GPT-4, uma técnica...

questão de informática da banca fgv aplicada no concurso tce pe (2025). confira a resolução completa abaixo:

Publicidade
No treinamento de grandes modelos de linguagem (LLMs), como o GPT-4, uma técnica importante, utilizada para estabilizar o treinamento e favorecer a convergência - especialmente ao lidar com camadas profundas -, é a normalização por camada, conhecida como Layer Normalization, que consiste em:
Publicidade