Para duas variáveis populacionais, X e Y, o desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X é 100. Assim, o coeficiente de correlação entre X e Y é
Questões de Concursos
selecione os filtros para encontrar suas questões de concursos e clique no botão abaixo para filtrar e resolver.
Instruções: Para responder às questões de números 59 e 60,
considere o enunciado a seguir.
Sejam
a previsão de origem T e horizonte 1 e o erro de previsão de origem T e horizonte 1, respectivamente.
Então é verdade que
Julgue os itens que se seguem, acerca de análise exploratória de dados, análise de dados discretos, análise de regressão e inferência estatística.
Considere duas variáveis X e Y com correlação linear de Pearson igual a 0,75. Nesse caso, somente se a variância de Y for superior ao dobro da variância de X, a variável Y tenderá a crescer pelo menos 1,5 unidades para cada unidade que aumentar a variável X.
Um estatístico utilizou uma amostragem aleatória estratificada sobre uma população que se divide nos estratos A e B, de tamanhos NA = 20 mil e NB = 30 mil, respectivamente. Sabe-se que as variâncias da variável de interesse dentro desses estratos são, respectivamente, SA = 9 e SB = 4. O estatístico retirou uma amostra aleatória de tamanho n = 500, de acordo com a alocação ótima de Neyman. Com base nessas informações, assinale a opção correspondente às quantidades observadas pelo estatístico nos estratos A e B, respectivamente.
Quantas vezes, no mínimo, deve-se lançar um dado não viciado para que a probabilidade de se obter algum 2 seja superior a 90% ?
Dados: log10 2= 0,301 e log10 3= 0, 477
Em muitas situações práticas são realizadas observações sobre um número grande de variáveis correlacionadas e, nesse caso, é natural procurar-se maneiras de reduzir a dimensão do problema, isto é, do número de variáveis a serem estudadas, sem sacrificar muito a informação acerca das variáveis contidas na matriz de covariância. Em uma determinada técnica de análise multivariada, desenvolvida por Hotelling, os eixos coordenados representando as variáveis originais são rotacionados para dar origem a um novo sistema de coordenadas representando variáveis com certas propriedades ótimas de suas variâncias, o que equivale a fazer uma transformação ortogonal especial das variáveis originais. Assim, a primeira nova variável é a combinação linear normalizada das variáveis originais com máxima variância. A segunda nova variável é a combinação linear normalizada das variáveis originais com máxima variância entre todas as combinações lineares não correlacionadas com a primeira nova variável e assim por diante. Então a técnica acaba por caracterizar ou explicar a variabilidade de um vetor de variáveis substituindo-o por um novo vetor com um número menor de variáveis com grandes variâncias. Esta técnica é conhecida como:
Um estudo acerca da depressão pós-parto em uma população de trabalhadoras foi realizado por um pesquisador, envolvendo uma amostra de 1.024 mulheres. As variáveis do estudo foram observadas por intermédio de um questionário, sendo ajustado o modelo y = 14 - 0,5 x1 + 0,01 x2 - 6 x3 + 8 x4, em que a variável resposta y é um índice de depressão e as variáveis explanatórias x1 e x2 são, respectivamente, a idade (em anos) e a renda (em reais), enquanto x3 e x4 são variáveis binárias que assumem valores zero ou um. As covariâncias entre as variáveis explanatórias não são nulas. O método utilizado para a seleção de variáveis foi o stepwise. Os quadros acima apresentam um resumo do ajuste.
As variáveis dependentes são multicolineares.
Julgue o item que se segue, referente ao controle estatístico de qualidade.
Em um processo industrial que está sob controle, a probabilidade de erro tipo I deve ser utilizada para se determinar o tempo médio de espera até a observação do primeiro alarme falso.
As estatísticas de anos passados mostram que 80% dos alunos de um curso são aprovados e 20% vão para recuperação. Dos alunos que vão para recuperação, apenas 40% conseguem ser aprovados. Sabendo-se que um aluno foi aprovado, a probabilidade de ele ter ido para recuperação é de
O supermercado de uma pequena cidade do interior vende duas marcas de suco de laranja, uma local e uma de abrangência nacional, que custam, no atacado, respectivamente, R$ 0,30 e R$ 0,40 por garrafa. O dono do supermercado estima que, ao cobrar x centavos pela garrafa da marca local e y centavos pela garrafa da marca de abrangência nacional, venderá, por dia, max {70 ! 5x + 4y, 0} garrafas da marca local e max{80 + 6x ! 7y, 0} garrafas da marca de abrangência nacional. Considerando o lucro primário na venda de cada garrafa como a diferença entre seu valor de venda e seu custo no atacado, julgue os itens subsecutivos.
Se os preços de venda de cada garrafa são determinados de modo que as quantidades de garrafas vendidas das duas marcas sejam positivas, então o lucro primário total desse supermercado em cada dia de venda das duas marcas de suco será dado por -5x2 + 10xy - 20x - 7y2 + 240y - 5.300 em um domínio conveniente.
Com relação aos testes de hipóteses paramétricos, julgue os itens subsecutivos.
No teste qui-quadrado para aderência, a estatística de teste baseia-se na comparação entre o número observado e o número esperado de elementos em cada categoria. Nesse caso, sob a hipótese nula, a estatística desse teste segue aproximadamente uma distribuição qui-quadrado, desde que o número esperado de elementos em cada categoria seja suficientemente grande.
No contexto das propriedades dos estimadores de mínimos quadrados, e considerando os seguintes pressupostos:
i) yt = ?1 + ?2xt + et
ii) E[ et ] = 0
iii) var ( et ) = ?2
iv)cov ( ei , e j ) = 0
v) xt ? c , para toda observação
é verdadeiro afirmar que:
Atenção: O enunciado abaixo refere-se às questões de números 37 e 38.
A porcentagem do orçamento gasto com educação nos municípios de certo estado é uma variável aleatória X com distribuição normal com média ?(%) e variância 4(%)2.
Uma amostra aleatória, com reposição, de tamanho n, X1,X2,...,Xn , é selecionada da distribuição de X. Sendo X, a média amostral dessa amostra, o valor de n para que X não se distancie de sua média por mais do que 0,41% com probabilidade de 96% é igual aNo contexto da estatística, julgue os itens seguintes.
Apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é superior à freqüência dos outros elementos da série, a mediana é indicada como medida de tendência central.
A vacina Z tem sido usada há anos para controlar determinada doença. Um experimento é conduzido para avaliar se uma nova vacina, a vacina X, é mais efetiva que a vacina Z. A vacina Z continuará sendo usada, se não houver evidências suficientes sobre a maior eficiência da vacina X.
Com relação à situação apresentada acima, julgue os itens subseqüentes.
A hipótese, nesse caso, é que a vacina X é mais efetiva que a vacina Z.
Entre os grupos de dados a seguir, o que apresenta maior desvio-padrão é: