Início Questões de Concursos Tecnologia da Informação Ciência de Dados Resolva questões de Tecnologia da Informação Ciência de Dados comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática. Tecnologia da Informação Ciência de Dados Ordenar por: Mais populares Mais recentes Mais comentadas Filtrar questões: Exibir todas as questões Exibir questões resolvidas Excluir questões resolvidas Exibir questões que errei Filtrar 21Q1047742 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados. Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador. ✂️ a) A substituição por um valor de tendência central. ✂️ b) A predição por meio de um modelo de regressão linear simples. ✂️ c) O algoritmo EM. ✂️ d) O último valor observado. ✂️ e) O método de Monte Carlo. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 22Q1050739 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Seja o conjunto de dados abaixo cuja média aritmética é 30: {21, 42, 29, 15, 27, 36, 25, 45} Considerando o exposto, analise os itens a seguir. I. A amplitude dos dados é igual àI, II média. II. A mediana é 28. III. A moda é 45. Está correto o que se afirma em ✂️ a) I, apenas. ✂️ b) I e II, apenas. ✂️ c) I e III, apenas. ✂️ d) II e III, apenas. ✂️ e) I, II e III. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 23Q910347 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting. Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em I. dividir o conjunto de dados em k partes; II. utilizar uma das partes para teste e as outras k-1 para treinamento; III. repetir o processo para cada uma das k partes do conjunto de dados; e IV. avaliar a média das métricas de performance para o modelo. O método acima é chamado de ✂️ a) k vizinhos mais próximos (k nearest neighbors ou k-NN). ✂️ b) retropropagação (backpropagation). ✂️ c) validação cruzada (cross-validation). ✂️ d) regularização Lasso (Lasso regularization). ✂️ e) comitê de modelos (model ensembling). Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 24Q1060418 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência. Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência. ✂️ a) Gráfico de Dispersão. ✂️ b) Gráfico de Séries Temporais. ✂️ c) Gráfico de Barras. ✂️ d) Histograma. ✂️ e) Boxplot. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 25Q1050741 | Estatística, Cálculo de Probabilidades, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um símbolo binário, digamos 0 ou 1, é transmitido incorretamente por meio de um canal de comunicação com ruído, com probabilidade 0,10 e 0,05, respectivamente. Supondo que a probabilidade do canal transmitir um 0 é 0,4, assinale a opção que indica a probabilidade de um símbolo escolhido aleatoriamente ser recebido corretamente. ✂️ a) 0,950. ✂️ b) 0,945. ✂️ c) 0,930. ✂️ d) 0,925. ✂️ e) 0,900. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 26Q1047748 | Matemática, Álgebra Linear, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024A decomposição em valores singulares (Singular Value Decomposition - SVD) de uma matriz é uma fatoração importante por ser aplicável em diversos algoritmos de inteligência artificial. Considere o trecho de código em linguagem R a seguir. 1. A <- matrix(c(1,2,1,2), ncol=2, nrow=2) 2. svd_result <- svd(A) 3. V <-svd_result$v 4. M <- V %*% t(V) 5. cat(M[1,1], "--", M[2,2]) Assinale a opção que indica a saída esperada para a execução do trecho de código. ✂️ a) 10 -- 2.4652e-32 ✂️ b) 0.7071068 -- 0.7071068 ✂️ c) -0.4472136 -- 0.4472136 ✂️ d) 3.162278e+00 -- 1.570092e-16 ✂️ e) 1 -- 1 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 27Q910349 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento. Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir. I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial. II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro. III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais. Está correto o que se afirma em ✂️ a) I, apenas. ✂️ b) II, apenas. ✂️ c) I e III, apenas. ✂️ d) II e III, apenas. ✂️ e) I, II e III. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 28Q1047741 | Algoritmos e Estrutura de Dados, Algoritmos, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Algoritmos de agrupamento são fundamentais para a área de aprendizado de máquina não supervisionado. Em geral, esses algoritmos determinam clusters de instâncias de dados que possuem algum traço de similaridade entre si. Relacione os métodos de agrupamento hierárquico e o K-means às suas principais características. 1. Agrupamento Hierárquico 2. K-means ( ) Seus resultados são altamente sensíveis ao número de clusters que deve ser pré-definido pelo usuário do algoritmo. ( ) Baseia-se em abordagens top-down ou bottom-up, isto é, com a divisão ou com a união sucessiva de clusters. ( ) Seus resultados costumam ser graficamente visualizados por dendrogramas, que podem ser seccionados de acordo com o número de clusters determinado pelo usuário do algoritmo. ( ) Avalia distâncias entre as instâncias de dados e os centroides dos clusters e atualiza a posição dos centroides dos clusters sucessivamente, até a convergência. Assinale a opção que indica a relação correta, na ordem apresentada. ✂️ a) 2 – 1 – 2 – 1. ✂️ b) 2 – 2 – 2 – 1. ✂️ c) 2 – 1 – 2 – 2. ✂️ d) 2 – 1 – 1 – 2. ✂️ e) 1 – 1 – 2 – 2. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 🖨️ Baixar PDF← Anterior
21Q1047742 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados. Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador. ✂️ a) A substituição por um valor de tendência central. ✂️ b) A predição por meio de um modelo de regressão linear simples. ✂️ c) O algoritmo EM. ✂️ d) O último valor observado. ✂️ e) O método de Monte Carlo. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
22Q1050739 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Seja o conjunto de dados abaixo cuja média aritmética é 30: {21, 42, 29, 15, 27, 36, 25, 45} Considerando o exposto, analise os itens a seguir. I. A amplitude dos dados é igual àI, II média. II. A mediana é 28. III. A moda é 45. Está correto o que se afirma em ✂️ a) I, apenas. ✂️ b) I e II, apenas. ✂️ c) I e III, apenas. ✂️ d) II e III, apenas. ✂️ e) I, II e III. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
23Q910347 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting. Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em I. dividir o conjunto de dados em k partes; II. utilizar uma das partes para teste e as outras k-1 para treinamento; III. repetir o processo para cada uma das k partes do conjunto de dados; e IV. avaliar a média das métricas de performance para o modelo. O método acima é chamado de ✂️ a) k vizinhos mais próximos (k nearest neighbors ou k-NN). ✂️ b) retropropagação (backpropagation). ✂️ c) validação cruzada (cross-validation). ✂️ d) regularização Lasso (Lasso regularization). ✂️ e) comitê de modelos (model ensembling). Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
24Q1060418 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência. Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência. ✂️ a) Gráfico de Dispersão. ✂️ b) Gráfico de Séries Temporais. ✂️ c) Gráfico de Barras. ✂️ d) Histograma. ✂️ e) Boxplot. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
25Q1050741 | Estatística, Cálculo de Probabilidades, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Um símbolo binário, digamos 0 ou 1, é transmitido incorretamente por meio de um canal de comunicação com ruído, com probabilidade 0,10 e 0,05, respectivamente. Supondo que a probabilidade do canal transmitir um 0 é 0,4, assinale a opção que indica a probabilidade de um símbolo escolhido aleatoriamente ser recebido corretamente. ✂️ a) 0,950. ✂️ b) 0,945. ✂️ c) 0,930. ✂️ d) 0,925. ✂️ e) 0,900. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
26Q1047748 | Matemática, Álgebra Linear, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024A decomposição em valores singulares (Singular Value Decomposition - SVD) de uma matriz é uma fatoração importante por ser aplicável em diversos algoritmos de inteligência artificial. Considere o trecho de código em linguagem R a seguir. 1. A <- matrix(c(1,2,1,2), ncol=2, nrow=2) 2. svd_result <- svd(A) 3. V <-svd_result$v 4. M <- V %*% t(V) 5. cat(M[1,1], "--", M[2,2]) Assinale a opção que indica a saída esperada para a execução do trecho de código. ✂️ a) 10 -- 2.4652e-32 ✂️ b) 0.7071068 -- 0.7071068 ✂️ c) -0.4472136 -- 0.4472136 ✂️ d) 3.162278e+00 -- 1.570092e-16 ✂️ e) 1 -- 1 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
27Q910349 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento. Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir. I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial. II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro. III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais. Está correto o que se afirma em ✂️ a) I, apenas. ✂️ b) II, apenas. ✂️ c) I e III, apenas. ✂️ d) II e III, apenas. ✂️ e) I, II e III. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
28Q1047741 | Algoritmos e Estrutura de Dados, Algoritmos, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024Algoritmos de agrupamento são fundamentais para a área de aprendizado de máquina não supervisionado. Em geral, esses algoritmos determinam clusters de instâncias de dados que possuem algum traço de similaridade entre si. Relacione os métodos de agrupamento hierárquico e o K-means às suas principais características. 1. Agrupamento Hierárquico 2. K-means ( ) Seus resultados são altamente sensíveis ao número de clusters que deve ser pré-definido pelo usuário do algoritmo. ( ) Baseia-se em abordagens top-down ou bottom-up, isto é, com a divisão ou com a união sucessiva de clusters. ( ) Seus resultados costumam ser graficamente visualizados por dendrogramas, que podem ser seccionados de acordo com o número de clusters determinado pelo usuário do algoritmo. ( ) Avalia distâncias entre as instâncias de dados e os centroides dos clusters e atualiza a posição dos centroides dos clusters sucessivamente, até a convergência. Assinale a opção que indica a relação correta, na ordem apresentada. ✂️ a) 2 – 1 – 2 – 1. ✂️ b) 2 – 2 – 2 – 1. ✂️ c) 2 – 1 – 2 – 2. ✂️ d) 2 – 1 – 1 – 2. ✂️ e) 1 – 1 – 2 – 2. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro