No treinamento de grandes modelos de linguagem (LLMs), como o GPT-4, uma técnica...

Questão de Informática da banca FGV aplicada no concurso TCE PE (2025). Confira a resolução completa abaixo:

No treinamento de grandes modelos de linguagem (LLMs), como o GPT-4, uma técnica importante, utilizada para estabilizar o treinamento e favorecer a convergência - especialmente ao lidar com camadas profundas -, é a normalização por camada, conhecida como Layer Normalization, que consiste em: