Questões de Concursos Tecnologia da Informação Ciência de Dados

Resolva questões de Tecnologia da Informação Ciência de Dados comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática.

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.

1Q910345 | Programação, Python, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Na Ciência de Dados é muito comum a utilização da linguagem Python e do R para visualização de dados.

Sobre as diferenças entre essas duas ferramentas, analise as afirmativas a seguir.


I. Python possui um padrão mais bem definido, permitindo que diferentes tipos de funcionalidades sejam escritos da mesma forma, enquanto no R, a mesma funcionalidade pode ser escrita de diversas formas diferentes.

II. Python é principalmente usada quando a análise de dados precisa ser integrada com aplicativos web ou se o código estatístico precisa ser integrado em um servidor em ambiente de produção, que vai servir muitos usuários, enquanto o R é principalmente usado quando as atividades de análise de dados requerem computação standalone (em um único computador) ou análise em servidores individuais.

III. Tanto o Python quanto o R foram criados inicialmente para análise de dados.


Está correto o que se afirma em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

2Q910348 | Algoritmos e Estrutura de Dados, Conceitos Básicos de Estrutura de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

A análise de componentes principais (Principal Component Analysis - PCA) é uma técnica consagrada para a redução de dimensionalidade e para a identificação de padrões estruturais lineares em conjuntos de dados.

Com relação à análise de componentes principais, analise as afirmativas a seguir e assinale (V) para a verdadeiras e (F) para a falsa.


( ) Baseia-se na identificação dos autovetores da matriz de covariâncias dos dados, permitindo ao analista determinar direções de maiores variações nas instâncias de dados.

( ) Permite a seleção e a eliminação das dimensões referentes às direções de maiores variações nas instâncias de dados, que por sua vez contribuem com poucas informações úteis para a análise do conjunto de dados.

( ) É utilizada em compressão de dados, pois permite a representação dos dados em menos dimensões que são facilmente interpretáveis pelo analista, sem grandes perdas de informações.


As afirmativas são, respectivamente.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

3Q910341 | Banco de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Uma plataforma de desenvolvimento fornece recursos como servidores, bancos de dados e ambientes de desenvolvimento integrados (IDEs) necessários para criar, testar e implantar uma aplicação web.
Assinale a opção que apresenta o modelo de serviço de computação em nuvem no qual essa plataforma se enquadra
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

4Q910351 | Geografia, Projeções e Representações, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

O problema básico das projeções cartográficas é a representação de uma superfície curva em um plano. Nesse sentido, foram elaborados diversos modelos matemáticos baseados em superfícies geométricas que minimizam as distorções decorrentes de tais projeções e, em alguns casos, preservam a verdadeira grandeza de ângulos, distâncias e áreas.
Nesse contexto, assinale a opção que apresenta, respectivamente, a superfície de referência e a grandeza preservada na projeção empregada no sistema de coordenadas UTM.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

5Q910338 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Há uma família de modelos de IA generativa que tem dois modelos treinados em conjunto: o gerador e o discriminador.
O gerador tenta criar dados falsos que sejam indistinguíveis dos dados reais, enquanto que o discriminador tenta distinguir entre dados reais e falsos. O treinamento é um jogo min-max, em que o gerador melhora suas habilidades para enganar o discriminador, e o discriminador melhora suas habilidades para detectar dados falsos.
Assinale a opção que apresenta as características do modelo de IA generativa descritas no texto.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

6Q910346 | Programação, R, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

O pacote dplyr do R é um dos mais usados para manipulação de dados.
Assinale a opção que indica o conjunto de funções auxiliares desse pacote que são muito úteis para a seleção de colunas.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

7Q910342 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Considerando as técnicas e as ferramentas da gerência de um projeto, analise as afirmativas a seguir.

I. As técnicas de coleta de dados, tais como listas de verificação, grupos de discussão, entrevistas e brainstorming, são utilizadas para obter dados de forma mais eficiente.

II. Análise de dados, opinião especializada, representação de dados e mapa mental não são exemplos de ferramentas e técnicas da gerência de um projeto.

III. Como técnica e ferramenta de um projeto é possível encontrar as estimativas análoga, paramétrica, única, de três pontos e a bottom-up, por exemplo.


Está correto o que se afirma em:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

8Q910350 | Programação, R, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

O pacote neuralnet, da linguagem R, é uma ferramenta útil para a definição e para o treinamento de redes neurais, disponibilizando ao usuário uma interface relativamente simples.
Uma das limitações do pacote neuralnet é não oferecer ao usuário muitas opções pré-definidas de funções de ativação. Caso o usuário deseje utilizar uma função de ativação diferente das únicas duas já pré-definidas no pacote, é preciso definí-la e atribuí-la por meio do argumento act.fct.
Ao invocar o método neuralnet para o treinamento de uma rede neural, caso o argumento act.fct não seja explicitamente determinado na chamada do método, a função de ativação padrão utilizada nos neurônios da rede será
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

9Q910343 | Banco de Dados, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.
Sobre as a construção de dashboards, assinale a afirmativa correta.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

10Q910339 | Informática, Microsoft Excel, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

O Excel é um programa de desenvolvimento de planilhas digitais criado pela Microsoft na década de 1980.

Devido ao renome da marca, a longa trajetória do software e as suas excelentes funcionalidades, atualmente, o Excel é um dos aplicativos mais utilizados por empresas no mundo.

Assinale a opção que apresenta a funcionalidade do Excel que permite automatizar tarefas repetitivas.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

11Q910340 | Engenharia de Software, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

A respeito dos conceitos de DevOps, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Uma das práticas da Integração Contínua é estimular que a equipe de desenvolvimento agregue código em um repositório compartilhado várias vezes ao dia.
( ) Executar casos de teste automatizados e compilar o código fonte são tarefas de ferramentas de automação de build, como Cucumber, Travis CI e Zabbix.
( ) Configuration Management é eficiente quando nem todas as instalações e modificações são aplicadas novamente aos servidores, atualizando apenas o comportamento alterado.

As afirmativas são, respectivamente,
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

12Q1050740 | Estatística, Principais Distribuições de Probabilidade, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Seja X a variável aleatória que representa o número de ocorrências de um certo evento A em t unidades de tempo. A distribuição de probabilidade de X segue a distribuição de Poisson, isto é, a probabilidade de {X = x} é dada por:

e λt(λt) x/x!

em que λ é a taxa de ocorrência por unidade de tempo.
Considerando o exposto, o valor esperado do tempo entre duas ocorrências consecutivas do evento A, é
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

13Q1047744 | Engenharia Cartográfica, Sistema de Informações Geográficas, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Sistemas de Informações Geográficas (SIG) são recursos valiosos para instituições cujos negócios demandam a tomada de decisões baseadas na geolocalização de objetos e fenômenos. Entre as funcionalidades inerentes aos SIG, algumas destinam-se à manipulação e à análise de dados geográficos, tantos matriciais quanto vetoriais.
Assinale a opção que apresenta funcionalidade de manipulação e de análise de dados matriciais, exclusivamente.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

14Q1047745 | Engenharia Cartográfica, Sistema de Informações Geográficas, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Os Sistemas Globais de Navegação por Satélite permitem a definição das coordenadas de suas antenas, conforme o respectivo sistema de coordenadas de referência.
Assinale a opção que apresenta a relação correta entre sistemas de navegação por satélite e os respectivos sistemas de coordenadas.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

15Q910344 | Programação, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um analista da área de ciência de dados construiu um histograma levando em consideração uma determinada base de dados. Para incluir uma curva nesse histograma foi utilizado a função as.timeSeries.

Essa função pertence à biblioteca
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

16Q1047747 | Matemática, Derivada, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Calcule o valor da derivada de ordem n da expressão a seguir,

ƒ (x) = e −x + xex

considerando n um número natural par.

  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

17Q1047743 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

18Q1047746 | Matemática, Integral, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Analise a expressão a seguir:

∫ x2( 3+2x3)7 dx



O valor da seguinte expressão é

  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

19Q1047742 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

20Q1050742 | Estatística, Inferência Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um fabricante de certo equipamento diz que o tempo médio de sobrevida de seu produto é de 720 dias. Para verificar se a afirmação do fabricante estava correta, foi realizado um teste de hipótese.
Para tanto, foi selecionado uma amostra de 25 equipamentos, em que se observou que o tempo médio e o desvio padrão dessa amostra foi de, aproximadamente, 700 dias e 20 dias respectivamente.
Levando em consideração a potência do teste, assinale a opção que apresenta a hipótese alternativa mais adequada para a realização do teste.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.