Início

Questões de Concursos Tecnologia da Informação Ciência de Dados

Resolva questões de Tecnologia da Informação Ciência de Dados comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática.


21Q1047742 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

22Q1050739 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Seja o conjunto de dados abaixo cuja média aritmética é 30:

{21, 42, 29, 15, 27, 36, 25, 45}

Considerando o exposto, analise os itens a seguir.

I. A amplitude dos dados é igual àI, II média.
II. A mediana é 28.
III. A moda é 45.

Está correto o que se afirma em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

23Q910347 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;
II. utilizar uma das partes para teste e as outras k-1 para treinamento;
III. repetir o processo para cada uma das k partes do conjunto de dados; e
IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

24Q1060418 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.
Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

25Q1050741 | Estatística, Cálculo de Probabilidades, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um símbolo binário, digamos 0 ou 1, é transmitido incorretamente por meio de um canal de comunicação com ruído, com probabilidade 0,10 e 0,05, respectivamente.
Supondo que a probabilidade do canal transmitir um 0 é 0,4, assinale a opção que indica a probabilidade de um símbolo escolhido aleatoriamente ser recebido corretamente.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

26Q1047748 | Matemática, Álgebra Linear, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

A decomposição em valores singulares (Singular Value Decomposition - SVD) de uma matriz é uma fatoração importante por ser aplicável em diversos algoritmos de inteligência artificial. Considere o trecho de código em linguagem R a seguir.

1. A <- matrix(c(1,2,1,2), ncol=2, nrow=2) 2. svd_result <- svd(A) 3. V <-svd_result$v 4. M <- V %*% t(V) 5. cat(M[1,1], "--", M[2,2])

Assinale a opção que indica a saída esperada para a execução do trecho de código.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

27Q910349 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.

Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.


I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.
II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.
III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.


Está correto o que se afirma em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

28Q1047741 | Algoritmos e Estrutura de Dados, Algoritmos, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Algoritmos de agrupamento são fundamentais para a área de aprendizado de máquina não supervisionado. Em geral, esses algoritmos determinam clusters de instâncias de dados que possuem algum traço de similaridade entre si.

Relacione os métodos de agrupamento hierárquico e o K-means às suas principais características.

1. Agrupamento Hierárquico 2. K-means


( ) Seus resultados são altamente sensíveis ao número de clusters que deve ser pré-definido pelo usuário do algoritmo.

( ) Baseia-se em abordagens top-down ou bottom-up, isto é, com a divisão ou com a união sucessiva de clusters.

( ) Seus resultados costumam ser graficamente visualizados por dendrogramas, que podem ser seccionados de acordo com o número de clusters determinado pelo usuário do algoritmo.

( ) Avalia distâncias entre as instâncias de dados e os centroides dos clusters e atualiza a posição dos centroides dos clusters sucessivamente, até a convergência.


Assinale a opção que indica a relação correta, na ordem apresentada.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.