Questões de Concursos para Sistemas Engenharia de Dados e Ciência de Dados Manhã com Gabarito (Comentado)

Em sistemas de gerenciamento de bancos de dados, o Controle de Concorrência Multiversão (MVCC) é uma técnica utilizada para gerenciar transações concorrentes de maneira eficiente.
A respeito do funcionamento do MVCC, assinale a afirmativa correta.

Elimina a necessidade de mecanismos de controle de concorrência e integridade.

Garante que uma transação possa modificar dados somente se nenhuma outra transação tiver lido esses dados.

Requer que todas as transações sejam executadas sequencialmente para manter a consistência dos dados.

Permite que existam múltiplas versões dos registros, possibilitando leituras consistentes sem bloquear escritas.

Usa bloqueios de leitura em nível de registro, assegurando que apenas uma transação possa acessar um registro por vez.

A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.

I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.

II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.

III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.

Está correto o que se afirma em

Elimina a necessidade de mecanismos de controle de concorrência e integridade.

Garante que uma transação possa modificar dados somente se nenhuma outra transação tiver lido esses dados.

Requer que todas as transações sejam executadas sequencialmente para manter a consistência dos dados.

Permite que existam múltiplas versões dos registros, possibilitando leituras consistentes sem bloquear escritas.

Usa bloqueios de leitura em nível de registro, assegurando que apenas uma transação possa acessar um registro por vez.

Em relação ao alinhamento estratégico entre TI e negócio, analise as afirmativas a seguir.

I. A organização pode se beneficiar em todas as áreas quando esse alinhamento ocorre efetivamente.
II. Instrumentos de gestão podem promover e manter esse alinhamento.
III. É uma boa prática fazer planejamento de longo prazo (acima de 10 anos), com o alinhamento estático para aumentar a previsibilidade.

Está correto o que se afirma em

No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.

I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.

II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.

III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.

Está correto o que se afirma em

Sobre as práticas ITIL, analise as afirmativas a seguir.

I. O Sistema de Valor de Serviço (SVS) representa como os vários componentes e atividades da organização trabalham juntos para facilitar a criação de valor por meio de serviços de TI.

II. A cadeia de valor do serviço e a melhoria contínua não fazem parte do Sistema de Valor do Serviço (SVS).

III. A Cadeia de valor do serviço inclui seis atividades de cadeia de valor que levam à criação de produtos e serviços e, por sua vez, valor.

Está correto o que se afirma em

Considere a biblioteca sklearn (scikit-learn), versão 1.5.2, da linguagem de programação Python.
O atributo da classe sklearn.linear_model.LinearRegression, que retorna o termo independente no modelo linear, quando os parâmetros estão configurados no modo padrão (default), é

Um conceito fundamental na modelagem probabilística de sequências de palavras é o de n-grama. Com relação a esse conceito, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.

( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.

( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.

As afirmativas são, respectivamente,

Considerando os ciclos de vida de projetos e produtos, segundo o PMBOK v.7, analise as afirmativas a seguir.

I. O ciclo de vida do projeto é a série de fases pelas quais um projeto passa desde o início até sua conclusão.

II. Em projetos que utilizam a abordagem de desenvolvimento adaptativa, o ciclo de vida é fracionado em iterações e ao final de cada iteração o cliente recebe uma entrega funcional para avaliar.

III. É mais indicado empregar uma abordagem de desenvolvimento adaptativa para entregas cujo escopo e requisitos são bem compreendidos, que o time de projeto já tenha trabalhado antes e que permitam um certo grau de previsibilidade para planejar.

Está correto o que se afirma em

Um analista de dados recebeu a tarefa de estimar os consumidores de uma rede de lojas de varejo digital que têm maior probabilidade de voltar a adquirir determinado produto. A empresa disponibilizou tabelas contendo, respectivamente, a lista de consumidores com seus dados demográficos, os resultados de vendas de cada loja e os dados básicos como endereço e área ocupada por cada loja. Para alimentar sua ferramenta de mineração de dados é necessário agregar as tabelas repassadas em um único banco de dados.
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de

entender o negócio.

preparação dos dados.

Com relação ao ajuste de dados e a aplicação de modelos preditivos de aprendizado de máquina, analise os itens a seguir.

I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.

Está correto o que se afirma em

Com relação às técnicas de redução de dimensionalidade, no contexto de aprendizado de máquina, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) As técnicas de agregação formam novos atributos, por meio da combinação de grupos dos atributos originais.
( ) As técnicas de seleção de atributos descartam parte dos atributos originais.
( ) Técnicas de seleção de atributos embutidas são aplicadas na etapa de pré-processamento.

As afirmativas são, respectivamente,

Questões de Concursos

Q1030371•
Banco de Dados•
Banco de Dados Multidimensionais•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030364•
Engenharia de Software •
Conceitos Básicos em Engenharia de Software•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030371•
Banco de Dados•
Banco de Dados Multidimensionais•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030364•
Engenharia de Software •
Conceitos Básicos em Engenharia de Software•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030368•
Governança de TI•
Cultura Organizacional na Governança de TI•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030362•
Estatística•
Análise Multivariada•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030370•
Governança de TI•
ITIL•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030367•
Programação •
Linguagens de programação•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030363•
Estatística•
Calculo de probabilidades•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030369•
Gerência de Projetos•
PMBOK e Processos de Gerenciamento de Projetos•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030361•
Banco de Dados•
Banco de Dados•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030365•
Engenharia de Software •
Inteligencia Artificial•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030366•
Engenharia de Software •
Inteligencia Artificial•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030371•Banco de Dados•Banco de Dados Multidimensionais•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030364•Engenharia de Software •Conceitos Básicos em Engenharia de Software•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030371•Banco de Dados•Banco de Dados Multidimensionais•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030364•Engenharia de Software •Conceitos Básicos em Engenharia de Software•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030368•Governança de TI•Cultura Organizacional na Governança de TI•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030362•Estatística•Análise Multivariada•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030370•Governança de TI•ITIL•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030367•Programação •Linguagens de programação•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030363•Estatística•Calculo de probabilidades•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030369•Gerência de Projetos•PMBOK e Processos de Gerenciamento de Projetos•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030361•Banco de Dados•Banco de Dados•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030365•Engenharia de Software •Inteligencia Artificial•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030366•Engenharia de Software •Inteligencia Artificial•FGV•TCE PI•Sistemas Engenharia de Dados e Ciência de Dados Manhã•2025

Q1030371•
Banco de Dados•
Banco de Dados Multidimensionais•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030364•
Engenharia de Software •
Conceitos Básicos em Engenharia de Software•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030371•
Banco de Dados•
Banco de Dados Multidimensionais•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030364•
Engenharia de Software •
Conceitos Básicos em Engenharia de Software•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030368•
Governança de TI•
Cultura Organizacional na Governança de TI•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030362•
Estatística•
Análise Multivariada•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030370•
Governança de TI•
ITIL•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030367•
Programação •
Linguagens de programação•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030363•
Estatística•
Calculo de probabilidades•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030369•
Gerência de Projetos•
PMBOK e Processos de Gerenciamento de Projetos•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030361•
Banco de Dados•
Banco de Dados•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030365•
Engenharia de Software •
Inteligencia Artificial•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025

Q1030366•
Engenharia de Software •
Inteligencia Artificial•
FGV•
TCE PI•
Sistemas Engenharia de Dados e Ciência de Dados Manhã•
2025