Considerando que o horário de ocorrência de certo tipo de crime em determinado local seja representado por uma variável aleatória contínua X, cuja função de densidade é escrita como


ƒ(x) = y(x - 12)2,


em que 0 ≤ x < 24 e y é uma constante de normalização (y > 0), julgue o item subsequente.

P (X =5) > y.

Um cartório da cidade de Cerejeiras verificou que o número de nascimentos na cidade nos últimos 6 meses foi de 12, 16, 17, 24, 11 e 16 nascimentos. Com base nestes valores, é correto afirmar que o valor da média e da mediana de nascimentos é, respectivamente:
A respeito de uma série temporal, conjunto de observações sobre uma variável, ordenado no tempo e registrado em períodos regulares, analise as afirmativas a seguir.
I. A suposição básica que norteia a análise de séries temporais é que há um sistema causal mais ou menos constante, relacionado com o tempo, que exerceu influência sobre os dados no passado e pode continuar a fazê-lo no futuro. Este sistema causal costuma atuar criando padrões aleatórios que podem ser detectados em um gráfico da série temporal, ou mediante algum outro processo estatístico.
II. O objetivo da análise de séries temporais é identificar padrões não aleatórios na série temporal de uma variável de interesse e a observação deste comportamento passado pode permitir fazer previsões sobre o futuro, orientando a tomada de decisões.
III. São exemplos de séries temporais: as temperaturas máximas e mínimas diárias em uma cidade, as vendas mensais de uma empresa, os valores mensais do IPC-A, o resultado de um eletroencefalograma e o gráfico de controle de um processo produtivo.
Está correto o que se afirma em
Uma regressão entre duas variáveis não estacionárias
No estudo do desmatamento de uma região específica verificou-se que em uma década, a média de desmatamento aumentou 60% e a variância quadruplicou.
Assim, é correto afirmar que a variância relativa
Em uma pesquisa realizada sobre o desempenho de candidatos em um concurso público, verificou-se que, além da média, era necessário conhecer o grau de variação dos resultados em torno da média. Essa medida, conhecida como o desviomédio quadrado da média, corresponde a uma importante medida de dispersão denominada:

Num processo de estimação pontual de um parâmetro θ por umestimador T, avalie se as seguintes propriedades de T sãodesejáveis:


I. T deve ser tendencioso para θ.

II. T deve ter variância pequena.

III. T deve ter o maior erro quadrático médio possível.


Está correto apenas o que se afirma em

Considere uma amostra aleatória simples X1, X2, ..., Xn, de tamanho n, e as seguintes afirmativas acerca da estimação por máxima verossimilhança.

I. Se a variável aleatória populacional tem distribuição Bernoulli parâmetro p, o estimador de máxima verossimilhança de p é a média amostral.
II. Se a variável aleatória populacional tem distribuição exponencial parâmetro λ, o estimador de máxima verossimilhança de λ é a média amostral.
III. Se a variável aleatória populacional tem distribuição Poissonparâmetro λ, o estimador de máxima verossimilhança de λ é a média amostral.

Está correto o que se afirma em
Uma teoria muito importante, diz que é uma teoria da probabilidade que afirma que quanto maior for o tamanho da amostra, mais perto a média das amostras chegará do valor esperado. Esse conceito trata-se de qual teoria:
A chance de um evento que ocorre com probabilidade p é definida como c = p/(1-p).
Quando queremos entender a associação de um fator com um evento de interesse, em geral computamos a razão de chances, r = c_0/c_1, onde c_0 é a chance sem a exposição e c_1 é a chance com a exposição.
Suponha que um analista dispõe de um conjunto de dados binários Y = (Y_1,..., Y_n), com Y_i tomando valores em {0, 1} contendo o resultado de um teste de Covid-19 em n pacientes e que X = (X_1, ..., X_n) é um conjunto de covariáveis também binárias que indicam se o indivíduo foi (X_i = 1) ou não (X_i = 0) a uma festa nos últimos dez dias.
O analista quer determinar se a variável X está significativamente associada com o resultado do teste, Y.
Para tanto, ajusta um modelo de regressão logística utilizando Y como variável resposta, um termo de intercepto e X como covariável.
Ele obtém uma estimativa b0 para o intercepto, com erro padrão s0 e, para o coeficiente de X, uma estimativa b1 erro padrão s1.
O intervalo de confiança de 90% para a razão de chances é:
Suponha um modelo de regressão linear p-variado dado por:

Y = Xβ + ε

em que Y é um vetor (n x 1), X é uma matriz (n x p) conhecida, β é um vetor de parâmetros (p x 1) e ε é um vetor de erros tal que E[ ε ] = 0, V[ε ] = Iσ2, de modo que os elementos de ε são não correlacionados, I é a matriz identidade.

Nesse caso, se X’ é a matriz transposta da matriz X, a solução das equações normais é dada por
Uma amostra aleatória simples de tamanho 100 foi obtida para estimar uma proporção p populacional de indivíduos que apresentam uma característica A. Como resultado, 36 indivíduos amostrais apresentaram a característica A.
Lembre-se que de, se Z tem distribuição normal padrão, então P [ Z < 1.96 ] = 0,975. Usando a estimativa de p no lugar do valor desconhecido, um intervalo de 95% de confiança para p será dado aproximadamente por

Considerando a relevância da bioestatística para a saúde animal, julgue o item seguinte.

A regressão estatística não é adequada para a quantificação das associações entre um fator de interesse (variável dependente) e fatores explicativos (variáveis independentes).

No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.

I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.

II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.

III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.


Está correto o que se afirma em
Em relação à distribuição normal N(μ, σ2 ), avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Toda distribuição normal é simétrica em relação à média μ.
( ) A média, a mediana e a moda de uma distribuição normal coincidem.
( ) Aproximadamente 68% dos valores de uma variável normalmente distribuída estão no intervalo (μ−σ, μ+σ).

As afirmativas são, respectivamente,
Diferentemente dos modelos de equação única, nos modelos de equações simultâneas há mais do que uma variável dependente ou endógena envolvida.
Quando isso acontece, um método recomendado para contornar esse viés de endogeneidade é o
Os modelos de vetores autorregressivos (VAR) são uma classe de modelos estatísticos usados para capturar as interações dinâmicas entre múltiplas séries temporais.
Uma característica dessa categoria de modelos VAR é que
Uma empresa que produz parafusos verificou que a espessura dos parafusos que produz segue uma distribuição aproximadamente normal com média de 4,82 cm e variância de 16 cm2 . Após a queda de energia num certo período, deseja-se verificar se houve alteração na espessura dos parafusos produzidos. Se numa amostra de 16 parafusos verificou-se que a espessura média dos parafusos acusou média de 4,5 cm, assinale a alternativa que apresenta o valor da estatística teste padrão.
Na prática, os experimentos realizados permitem somente dois resultados. Ex: cara ou coroa, negativo ou positivo, sim ou não, aprovado ou reprovado, etc. Há na estatística diversas distribuições especiais. As características a seguir, são referentes a qual distribuição especial da estatística?

• O número de tentativas é fixo (n);
• As n tentativas são independentes e repetidas em condições idênticas;
• Para cada tentativa há dois resultados possíveis: s=sucesso ou f=fracasso;
• A probabilidade de sucesso numa tentativa única é p. P(S) = p.
• A probabilidade de fracasso é q. P(F)=q, onde p+q= 1
• O problema central está em determinar a probabilidade de x sucessos e n tentativas, sendo x=0 ou 1ou2...n.
• A variável aleatória x é uma contagem do número de sucessos em n tentativas.
• Repetições independentes de um ensaio de Bernoulli, com a mesma probabilidade de ocorrência de “sucesso”, dão origem a essa distribuição.

Qual é a distribuição a seguir?
Considere que um professor de estatística deseja avaliar se a nota obtida pelos alunos pode ser descrita em função do tempo de estudo deles. Para isso, decidiu realizar o ajuste de um modelo de regressão linear e organizou os dados das notas dos alunos e do tempo de estudo em dois objetos no ambiente R, nomeados como “nota” e “tempo”, ambos na mesma ordem de entrada. A sequência de comandos que realiza o ajuste de um modelo de regressão linear e apresenta o intervalo de confiança (95%) para os coeficientes de regressão é:
Página 11