Questões de Concursos: Ciência de Dados Manhã

Prepare-se para a prova com questões de Ciência de Dados Manhã de Concursos Públicos! Milhares de questões resolvidas e comentadas com gabarito para praticar online ou baixar o PDF!

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.
Limpar filtros

1 Q906124 | Banco de Dados, Banco de Dados Relacionais, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

O modelo relacional de dados é amplamente utilizado em bancos de dados. A organização de dados em tabelas (relações), com suas respectivas linhas (tuplas) e colunas (atributos), é de fácil compreensão. Os Sistemas Gerenciadores de Bancos de Dados Relacionais (SGBDR) tornam possível persistir dados em tabelas com qualidade e recuperar esses mesmos dados de forma rápida e eficiente.
Segundo o modelo relacional de dados, uma tabela pode ter

2 Q906123 | Banco de Dados, Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Data warehouses (DW) e data lakes (DL) são repositórios de dados especializados, com objetivos distintos dos bancos de dados relacionais e NoSQL.
Nesse contexto, ao comparar DW a DL, verifica-se que

3 Q906125 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Em um Sistema Gerenciador de Banco de Dados (SGBD), os índices são estruturas de dados que têm por objetivo tornar mais rápido o acesso aos dados. Índices são utilizados tanto em SGBD relacionais quanto em SGBD NoSQL.
Considerando-se uma tabela T1 em um SGBD relacional, quanto a esses índices, verifica-se que

4 Q906128 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma equipe de ciência de dados está trabalhando na construção de um modelo preditivo utilizando um grande conjunto de dados. Durante esse processo, os cientistas de dados estão realizando o feature engineering para criar e selecionar as variáveis mais relevantes, além de aplicar técnicas de divisão de dados para garantir a eficácia e a generalização do modelo.
Considerando-se esse contexto, qual combinação de técnicas maximizará a performance do modelo?

5 Q906129 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma equipe de cientistas de dados está desenvolvendo um modelo preditivo e deseja otimizar seus hiperparâmetros para maximizar a performance do modelo.
Considerando-se as técnicas de otimização de hiperparâmetros, para encontrar a configuração de hiperparâmetros, essa equipe de cientistas deverá

6 Q906132 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Ao avaliar a performance de diversos modelos preditivos para um problema de regressão e outro de classificação, várias métricas podem ser utilizadas para determinar qual modelo oferece o melhor desempenho. Considere as métricas para regressão e classificação, bem como as técnicas de detecção de overfitting e underfitting.
Nesse contexto, quais métricas devem ser utilizadas para determinar qual modelo oferece o melhor desempenho?

7 Q906126 | Arquitetura de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

O Microsoft Team Data Science Process (TDSP) é uma metodologia que define, entre outros conceitos, um ciclo de vida para projetos de ciência de dados.
A TDSP possui cinco estágios principais, de modo que na etapa de

8 Q906127 | Banco de Dados, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Um conjunto de dados numéricos com significativa diversidade foi apresentado à equipe de análise de dados de uma empresa. Como parte do processo decisório, os analistas necessitavam transformar um dos atributos numéricos em faixas de valores, a fim de permitir classificá-los em um universo de possibilidades. Para isso, decidiram, na etapa de enriquecimento de dados, criar um atributo, derivado do atributo numérico supracitado, em um processo de transformação de dados conhecido por discretização.
Uma das características das técnicas de discretização é que

9 Q906130 | Engenharia de Software, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Como parte do processo de desenvolvimento de uma aplicação para analisar grandes volumes de textos, diversas tarefas de Processamento de Linguagem Natural (NLP, sigla em inglês) estão sendo implementadas para melhorar a eficácia e a precisão dessa aplicação.
Diante disso, para a aplicação dessas tarefas, é necessário

10 Q906131 | Governança de TI, Ciência de Dados Manhã, BNDES, CESGRANRIO, 2024

Uma empresa está implementando um programa de governança de dados para melhorar a qualidade e a integridade dos dados que utiliza em suas operações diárias. As seguintes diretrizes foram passadas ao time de implantação:

1. Garantir que os dados sejam precisos, completos e atualizados em tempo real, para apoiar a tomada de decisões estratégicas.
2. Implementar políticas que assegurem a conformidade com regulamentos de privacidade de dados, como a Lei Geral de Proteção de Dados Pessoais (LGPD).
3. Adotar as melhores práticas do Data Management Body of Knowledge (DMBOK) para estruturar seu programa de governança de dados.

Com base nos conceitos de governança de dados do DMBOK, quais ações são necessárias para implementar as diretrizes mencionadas?
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.