Questões de Concursos Ciência de Dados Manhã

Resolva questões de Ciência de Dados Manhã comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática.

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.

1Q1036822 | Matemática, Geometria Analítica, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Considere em R3 a reta r0 passando pelos pontos (0,0,0) e (1,1,1) e a reta r1 passando pelos pontos (1,0,0) e (1,1,0). Seja d a distância entre as retas r0 e r1 , ou seja, d é a distância mínima entre os pontos P0 em r0 e P1 em r1 .

Quanto vale d?
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

2Q1036823 | Matemática, Álgebra, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

A região R no plano xy é definida pelas condições x ≥ 0 e 4x3 - 3x ≤ y ≤ x.

Qual é a área da região R?

  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

3Q1036824 | Estatística, Cálculo de Probabilidades, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

O teorema de Bayes é um mecanismo formal para atualizar probabilidades. Considere o caso de um analista de mercado que, após o encerramento de um pregão, pretende divulgar informações sobre a probabilidade de queda de determinada ação. O analista tinha uma previsão inicial de queda dessa ação de 10% e recebeu novas informações sobre a economia, no que diz respeito a um aumento da taxa de juros. O analista tem registros de que, quando houve queda nessa ação, em 20% das vezes essa queda foi precedida pelo aumento dos juros e de que, nos dias em que a ação esteve em alta, apenas em 5% das vezes elas foram precedidas pela notícia de aumento da taxa de juros.
Levando-se em conta esse cenário, e com base no teorema de Bayes, a nova probabilidade de queda da ação será de
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

4Q1036825 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Quando se analisa a relação entre variáveis em estatística, é crucial entender as diferenças entre causalidade e correlação.
Em uma análise de correlação,
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

5Q1036826 | Estatística, Estatística Descritiva Análise Exploratória de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Considere um grupo de 600 funcionários de uma empresa que registram os seguintes valores com relação ao tempo de permanência em um curso de aperfeiçoamento:

Média = 9 dias
1o Quartil = 5 dias
3o Quartil = 15 dias
Coeficiente de variação = 20%

Considerando-se essas informações, é possível concluir que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

6Q1036827 | Estatística, Estatística Não Paramétrica, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Diferentemente dos modelos de equação única, nos modelos de equações simultâneas há mais do que uma variável dependente ou endógena envolvida.
Quando isso acontece, um método recomendado para contornar esse viés de endogeneidade é o
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

7Q1036828 | Comércio Internacional Exterior, Câmbio, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Quando os agentes econômicos possuem incertezas em relação a variação cambial, isto é, do preço do Real em relação ao Dólar (R$/US$), eles procuram se proteger de suas posições descobertas, realizando uma operação conhecida por swap cambial, ou seja, uma troca de moedas. O swap cambial utilizado pelo Banco Central do Brasil é um contrato padrão que utiliza como taxa de juros a taxa DI (Depósito Interbancário) de um dia e a variação da taxa de câmbio Real/Dólar.
Na operação de swap cambial, a(o)
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

8Q1036829 | Estatística, Análise de Séries Temporais, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Um dos tipos importantes de dados utilizados em análises são os de séries temporais.
Nas análises aplicadas às séries temporais,
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

9Q1036830 | Estatística, Análise de Séries Temporais, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Os modelos de vetores autorregressivos (VAR) são uma classe de modelos estatísticos usados para capturar as interações dinâmicas entre múltiplas séries temporais.
Uma característica dessa categoria de modelos VAR é que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

10Q1036831 | Matemática Financeira, Conceitos Fundamentais de Matemática Financeira, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Considere um investidor que tenha a opção de aplicar seus recursos de R$ 60.000,00 à taxa de juros compostos de 9,9% ao semestre (opção P) ou à taxa de 20,78% ao ano (opção Q).
Ao comparar essas duas opções de investimento, conclui-se que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

11Q906123 | Banco de Dados, Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Data warehouses (DW) e data lakes (DL) são repositórios de dados especializados, com objetivos distintos dos bancos de dados relacionais e NoSQL.
Nesse contexto, ao comparar DW a DL, verifica-se que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

12Q906124 | Banco de Dados, Banco de Dados Relacionais, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

O modelo relacional de dados é amplamente utilizado em bancos de dados. A organização de dados em tabelas (relações), com suas respectivas linhas (tuplas) e colunas (atributos), é de fácil compreensão. Os Sistemas Gerenciadores de Bancos de Dados Relacionais (SGBDR) tornam possível persistir dados em tabelas com qualidade e recuperar esses mesmos dados de forma rápida e eficiente.
Segundo o modelo relacional de dados, uma tabela pode ter
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

13Q906125 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Em um Sistema Gerenciador de Banco de Dados (SGBD), os índices são estruturas de dados que têm por objetivo tornar mais rápido o acesso aos dados. Índices são utilizados tanto em SGBD relacionais quanto em SGBD NoSQL.
Considerando-se uma tabela T1 em um SGBD relacional, quanto a esses índices, verifica-se que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

14Q906126 | Arquitetura de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

O Microsoft Team Data Science Process (TDSP) é uma metodologia que define, entre outros conceitos, um ciclo de vida para projetos de ciência de dados.
A TDSP possui cinco estágios principais, de modo que na etapa de
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

15Q906127 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Um conjunto de dados numéricos com significativa diversidade foi apresentado à equipe de análise de dados de uma empresa. Como parte do processo decisório, os analistas necessitavam transformar um dos atributos numéricos em faixas de valores, a fim de permitir classificá-los em um universo de possibilidades. Para isso, decidiram, na etapa de enriquecimento de dados, criar um atributo, derivado do atributo numérico supracitado, em um processo de transformação de dados conhecido por discretização.
Uma das características das técnicas de discretização é que
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

16Q906128 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma equipe de ciência de dados está trabalhando na construção de um modelo preditivo utilizando um grande conjunto de dados. Durante esse processo, os cientistas de dados estão realizando o feature engineering para criar e selecionar as variáveis mais relevantes, além de aplicar técnicas de divisão de dados para garantir a eficácia e a generalização do modelo.
Considerando-se esse contexto, qual combinação de técnicas maximizará a performance do modelo?
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

17Q906129 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma equipe de cientistas de dados está desenvolvendo um modelo preditivo e deseja otimizar seus hiperparâmetros para maximizar a performance do modelo.
Considerando-se as técnicas de otimização de hiperparâmetros, para encontrar a configuração de hiperparâmetros, essa equipe de cientistas deverá
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

18Q906130 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Como parte do processo de desenvolvimento de uma aplicação para analisar grandes volumes de textos, diversas tarefas de Processamento de Linguagem Natural (NLP, sigla em inglês) estão sendo implementadas para melhorar a eficácia e a precisão dessa aplicação.
Diante disso, para a aplicação dessas tarefas, é necessário
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

19Q906131 | Governança de TI, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma empresa está implementando um programa de governança de dados para melhorar a qualidade e a integridade dos dados que utiliza em suas operações diárias. As seguintes diretrizes foram passadas ao time de implantação:

1. Garantir que os dados sejam precisos, completos e atualizados em tempo real, para apoiar a tomada de decisões estratégicas.
2. Implementar políticas que assegurem a conformidade com regulamentos de privacidade de dados, como a Lei Geral de Proteção de Dados Pessoais (LGPD).
3. Adotar as melhores práticas do Data Management Body of Knowledge (DMBOK) para estruturar seu programa de governança de dados.

Com base nos conceitos de governança de dados do DMBOK, quais ações são necessárias para implementar as diretrizes mencionadas?
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

20Q906132 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Ao avaliar a performance de diversos modelos preditivos para um problema de regressão e outro de classificação, várias métricas podem ser utilizadas para determinar qual modelo oferece o melhor desempenho. Considere as métricas para regressão e classificação, bem como as técnicas de detecção de overfitting e underfitting.
Nesse contexto, quais métricas devem ser utilizadas para determinar qual modelo oferece o melhor desempenho?
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.