Considere um conjunto de dados com n = 10 observações, cujas nove primeiras observações são
7,6 4,1 8,8 4,2 5,1 7,4 8,8 5,9 3,1
Sabendo-se que a média amostral do conjunto completo é x_bar = 4,2, a amplitude dos dados é:
Um cientista de dados está ponderando sobre a aplicação de um modelo Paragraph Vector (PV-DM) sobre uma coleção de documentos, no lugar de usar a média de vetores de palavras em cada documento.
Uma razão pela qual ele deveria aplicar PV-DM, e uma contrapartida à sua aplicação, são, respectivamente:
Bia está desenvolvendo um relatório no Power BI para exibir dados estruturados multidimensionalmente. Esse relatório deve:
I. exibir dados entre várias dimensões;
II. agregar automaticamente dados permitindo realizar a operação OLAP Drill Down;
III. permitir a seleção de um ou mais elementos de dados para realizar um realce cruzado com outro visual; e
IV. adicionar ícones condicionais.
O elemento visual do Power BI que Bia deve usar é:
Uma gerente de projetos (GP) está trabalhando na construção do cronograma para um novo projeto, que fornecerá como produto uma solução de Business Intelligence. As atividades já foram definidas e sequenciadas.
Para estimar a duração esperada de cada atividade por meio de faixas de durações prováveis, otimistas e pessimistas, a GP realizou a estimativa:
Durante o processo de treinamento e validação de uma rede neural, foi observado o fenômeno de underfitting do modelo, necessitando de ajustes ao procedimento. A arquitetura utilizada foi a Multilayer Perceptron (MLP) e o conjunto de dados foi separado em regime de holdout (50%, 30% e 20% para treinamento, validação e teste, respectivamente).
Dois fatores que podem ter condicionado o fenômeno observado são:
A Equipe de Gestão de Dados (EGD) de um órgão público optou por aplicar práticas ágeis em seus projetos.
Uma das propostas da EGD é utilizar o sistema de gestão Kanban para observar de forma contínua o fluxo do trabalho, de modo a:
No âmbito de Web services, analise as afirmativas a seguir sobre a abordagem REST e o uso de tecnologias baseadas em SOAP.
I. Uma característica dos serviços Web RESTful é a capacidade de transmitir dados diretamente via HTTP.
II. As mensagens SOAP precisam ser retornadas como documentos XML.
III. Um navegador não pode armazenar em cache uma solicitação concluída por uma API SOAP.
É correto o que se afirma em:

Considere a sentença a seguir.

s: “O acesso ao auditório também pode ser feito através de uma rampa”

Aplicando a função f à sentença, obtém-se o seguinte resultado:

f(s) = “acesso auditório pode ser feito através rampa”

A melhor descrição para a tarefa realizada pela função f é:

A chance de um evento que ocorre com probabilidade p é definida como c = p/(1-p).
Quando queremos entender a associação de um fator com um evento de interesse, em geral computamos a razão de chances, r = c_0/c_1, onde c_0 é a chance sem a exposição e c_1 é a chance com a exposição.
Suponha que um analista dispõe de um conjunto de dados binários Y = (Y_1,..., Y_n), com Y_i tomando valores em {0, 1} contendo o resultado de um teste de Covid-19 em n pacientes e que X = (X_1, ..., X_n) é um conjunto de covariáveis também binárias que indicam se o indivíduo foi (X_i = 1) ou não (X_i = 0) a uma festa nos últimos dez dias.
O analista quer determinar se a variável X está significativamente associada com o resultado do teste, Y.
Para tanto, ajusta um modelo de regressão logística utilizando Y como variável resposta, um termo de intercepto e X como covariável.
Ele obtém uma estimativa b0 para o intercepto, com erro padrão s0 e, para o coeficiente de X, uma estimativa b1 erro padrão s1.
O intervalo de confiança de 90% para a razão de chances é:
Um analista é contratado para analisar dados de volume de suco de laranja produzido em duas fábricas da mesma empresa.
Suponha que sejam medidos 16 lotes na fábrica A e 61 lotes na fábrica B, e que as médias amostrais tenham sido A_bar = 104 e B_bar = 112, com somas de desvios quadráticos em relação à média S^2_A = 40.000 e S^2_B = 100.000, respectivamente.
A chefia quer saber se uma fábrica tem menor variabilidade em relação à outra.
O teste a ser usado e o valor da sua estatística de teste são, respectivamente:
Um analista decidiu aplicar um modelo Naive Bayes a um problema cujo conjunto de dados disponível possui apenas atributos categóricos codificados em one-hot.
O modelo de eventos mais apropriado nesse caso é o:
A tradução automática de texto, embora possua raízes na metade do século passado, vem recebendo melhorias substanciais na última década, alimentadas pelo crescimento do poder computacional, disponibilidade de dados linguísticos e inovações técnicas.
Com relação às inovações, e levando em consideração os recursos mencionados, a alternativa que apresenta apenas vantagens da Tradução Automática Neural (NMT) sobre técnicas de Tradução Automática Estatística (SMT) é:
No contexto do Oracle, considere o comando a seguir e analise as afirmativas a respeito das consequências desse mesmo comando.
create global temporary table temp ( a int not null primary key, b varchar(20) not null ) ON COMMIT DELETE ROWS;
I. Dados inseridos numa sessão (em inglês, session) ficam disponíveis como read only para todas as sessões abertas.
II. Dados inseridos por uma sessão são removidos quando a sessão é encerrada.
III. Ao término de uma transação por meio de um comando commit, os dados são automaticamente removidos da tabela.
Está correto somente o que se afirma em:
No contexto do MySQL 8.x, considere as afirmativas a respeito da utilização de índices do tipo FULLTEXT exibidas a seguir.
I. Índices FULLTEXT podem ser aplicados somente para tabelas MyISAM.
II. Consultas baseadas em índices FULLTEXT devem usar a sintaxe MATCH(col1, col2, ...) AGAINST(expressão [modificador]).
III. O comando ALTER TABLE não pode ser utilizado para a criação de índices FULLTEXT.
Está correto somente o que se afirma em:
Considere o parágrafo a seguir.
“Os beija-flores são aves de pequeno porte, que medem em média de 6 a 12 centímetros de comprimento e pesam de 2 a 6 gramas. Maioria dos bicos são normalmente longos, mas o formato preciso varia bastante com a espécie e está adaptado ao formato da flor que constitui a base da alimentação de cada tipo de beija-flor.
E seu sumário, obtido através de um modelo de sumarização automática:
“Os beija-flores são aves de pequeno porte, com os bicos normalmente longos cujo formato varia com a espécie, dependendo do formato da flor que constitui a base da alimentação de cada tipo de beija-flor.
Com relação à técnica utilizada para essa sumarização, a alternativa que apresenta, respectivamente, o tipo de sumarização realizada e a evidência que nos permite classificá-la é:
Na página web que Maria está desenvolvendo, há um botão que, quando clicado, exibe data e hora correntes.
O código que implementa essa característica corretamente é:
Um analista precisa construir um modelo de tópicos para uma grande base de documentos legais, mas há uma preocupação quanto à interpretabilidade do modelo e à capacidade de inspecionar os resultados.
Considerando essa preocupação, a técnica mais apropriada para a construção do modelo e a razão da escolha são, respectivamente: