Em sistemas de gerenciamento de bancos de dados, o Controle
de Concorrência Multiversão (MVCC) é uma técnica utilizada para
gerenciar transações concorrentes de maneira eficiente.
A respeito do funcionamento do MVCC, assinale a afirmativa
correta.
A popularização da Internet permitiu que grande parcela da
população pudesse expressar suas opiniões na forma de fóruns,
blogs, avaliações de produtos, entre outros. Assim, deixou de ser
necessário que empresas conduzam enquetes ou pesquisas para
que possam saber a opinião dos consumidores sobre seus
produtos ou de concorrentes. O volume de textos opinativos
disponíveis é tal, que a tarefa de ler, sumarizar e organizar de
forma útil essas informações é desafiadora. O campo da análise
de sentimento, no processamento de linguagem natural, trata
justamente dessa necessidade, da automatização da descoberta
e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um
problema de classificação de textos, onde é importante
definir se o texto é objetivo ou subjetivo. Textos subjetivos
são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação
de avaliações falsas em sites de e-commerce. Uma limitação
para essa aplicação é a dificuldade de obtenção de dados
para treinamento de modelos, uma vez que a marcação
manual de avaliações com opiniões falsas ou enganosas é
muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de
sentimentos para avaliações de produtos pode ser resumido
nos seguintes passos: extração de frases com padrões
predeterminados de opinião; cálculo de um indicador de
orientação de cada frase; obtenção da orientação média da
avaliação como um todo; e determinação se é positiva ou
negativa.
Em relação ao alinhamento estratégico entre TI e negócio, analise
as afirmativas a seguir.
I. A organização pode se beneficiar em todas as áreas quando
esse alinhamento ocorre efetivamente.
II. Instrumentos de gestão podem promover e manter esse
alinhamento.
III. É uma boa prática fazer planejamento de longo prazo (acima
de 10 anos), com o alinhamento estático para aumentar a
previsibilidade.
No campo da mineração de dados existem alguns problemas
fundamentais que costumam aparecer com frequência em
variados cenários de aplicação. O estudo desses problemas
fornece ferramentas ao analista de dados que são aplicáveis em
diferentes projetos de mineração de dados. Nesse conjunto se
encontram os problemas de determinação de padrões,
classificação de dados, segmentação de dados (clustering) e
detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a
seguir.
I. Em uma tabela binária esparsa, que representa uma base de
dados de transações de clientes, em que as colunas
representam cada produto e as linhas cada transação,
verifica-se que, frequentemente, três das colunas
apresentam simultaneamente o valor 1 para vários registros.
Este tipo de análise é um problema de detecção de valores
discrepantes.
II. A identificação de consumidores que são similares entre si,
para uso no contexto de aplicação de promoções orientadas,
constitui um problema de segmentação de dados.
III. O problema de classificação de dados pode ser considerado
como supervisionado, pelo fato das relações entre as classes
definidas e os demais atributos dos dados serem
“aprendidas” pelo modelo.
Sobre as práticas ITIL, analise as afirmativas a seguir.
I. O Sistema de Valor de Serviço (SVS) representa como os
vários componentes e atividades da organização trabalham
juntos para facilitar a criação de valor por meio de serviços de
TI.
II. A cadeia de valor do serviço e a melhoria contínua não fazem
parte do Sistema de Valor do Serviço (SVS).
III. A Cadeia de valor do serviço inclui seis atividades de cadeia
de valor que levam à criação de produtos e serviços e, por sua
vez, valor.
Considere a biblioteca sklearn (scikit-learn), versão 1.5.2, da
linguagem de programação Python.
O atributo da classe sklearn.linear_model.LinearRegression, que
retorna o termo independente no modelo linear, quando os
parâmetros estão configurados no modo padrão (default), é
Considerando os ciclos de vida de projetos e produtos, segundo o
PMBOK v.7, analise as afirmativas a seguir.
I. O ciclo de vida do projeto é a série de fases pelas quais um
projeto passa desde o início até sua conclusão.
II. Em projetos que utilizam a abordagem de desenvolvimento
adaptativa, o ciclo de vida é fracionado em iterações e ao
final de cada iteração o cliente recebe uma entrega funcional
para avaliar.
III. É mais indicado empregar uma abordagem de
desenvolvimento adaptativa para entregas cujo escopo e
requisitos são bem compreendidos, que o time de projeto já
tenha trabalhado antes e que permitam um certo grau de
previsibilidade para planejar.
Um analista de dados recebeu a tarefa de estimar os
consumidores de uma rede de lojas de varejo digital que têm
maior probabilidade de voltar a adquirir determinado produto. A
empresa disponibilizou tabelas contendo, respectivamente, a
lista de consumidores com seus dados demográficos, os
resultados de vendas de cada loja e os dados básicos como
endereço e área ocupada por cada loja. Para alimentar sua
ferramenta de mineração de dados é necessário agregar as
tabelas repassadas em um único banco de dados.
Considerando o modelo de referência CRISP-DM, esse analista
encontra-se na etapa de
Um conceito fundamental na modelagem probabilística de
sequências de palavras é o de n-grama. Com relação a esse
conceito, analise as afirmativas a seguir e assinale (V) para a
verdadeira e (F) para a falsa.
( ) Um modelo bigrama assume a aproximação de que a
probabilidade da próxima palavra em uma frase,
considerando todas as palavras anteriores, é dada pela
probabilidade condicional apenas da palavra imediatamente
anterior.
( ) O modelo trigrama é também conhecido como modelo de
Markov de terceira ordem.
( ) O cálculo de probabilidades em modelos n-grama é
geralmente realizado utilizando logaritmos para evitar o
fenômeno do underflow numérico.
Com relação às técnicas de redução de dimensionalidade, no
contexto de aprendizado de máquina, analise as afirmativas a
seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) As técnicas de agregação formam novos atributos, por meio
da combinação de grupos dos atributos originais.
( ) As técnicas de seleção de atributos descartam parte dos
atributos originais.
( ) Técnicas de seleção de atributos embutidas são aplicadas na
etapa de pré-processamento.
Com relação ao ajuste de dados e a aplicação de modelos
preditivos de aprendizado de máquina, analise os itens a seguir.
I. O subajuste (underfitting) indica baixa capacidade preditiva
do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a
capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de
superajuste (overfitting) do modelo.