Considere o caso mais simples de uma variável independente e de uma variável dependente, em que a forma de relação entre
ambas é linear: Y = α + βX + ε. Nesse caso, Xé usado para representar a variável independente e Y é usado para representar a variável
dependente. Salienta-se que as letras maiúsculas X e Y representam a designação das variáveis aleatórias, já as minúsculas, valores
específicos das variáveis aleatórias. Por sua vez, “ε” é um termo de distúrbio ou erro estocástico com média zero. Considerando
essas informações e conhecimentos adicionais sobre análise de regressão linear simples, analise as afirmativas a seguir.
I. O valor da variável dependente Y é considerado como o de uma variável aleatória, que depende de valores fixos (não
aleatórios) da variável independente X.
II. Uma relação teórica em linha reta existe entre Y e o valor esperado de X para cada um dos valores possíveis de X. Essa linha
de regressão teórica: E (Y ̸X) = α + βX possui uma inclinação α e uma interseção β. Os coeficientes de regressão α e β
constituem parâmetros de população, cujos valores são desconhecidos e se deseja estimá-los.
III. Associada a cada valor de X, existe uma distribuição de probabilidade p(y ̸x) dos valores possíveis da variável aleatória Y.
Quando X for igual a um valor xi, o valor de Y observado será obtido da distribuição de probabilidade p(y ̸xi) e não estará
necessariamente na linha de regressão teórica.
Quanto às premissas subjacentes ao modelo de regressão linear simples, está correto o que se afirma apenas em
Considere que a função de densidade da variável aleatória contínua uniforme, X, no intervalo [13, 25] modela
razoavelmente um fenômeno de interesse. Dessa forma,
o valor esperado e a variância dessa variável aleatória
serão respectivamente:
O coeficiente alfa de Cronbach foi apresentado por Lee J.
Cronbach, em 1951, como uma forma de estimar a confiabilidade de um questionário aplicado em uma pesquisa. Sobre
esse coeficiente, analise as afirmativas a seguir.
I. O coeficiente α é um índice utilizado para medir a confiabilidade do tipo consistência interna de uma escala, ou seja,
para avaliar a magnitude em que os itens de um instrumento estão correlacionados.
II. O cálculo do coeficiente α é feito a partir da mediana dos
itens individuais e da variância da soma dos itens de cada
avaliador.
III. A consistência interna de um questionário é tanto maior
quanto mais perto de 0 estiver o valor do coeficiente α.
Para se avaliar se duas amostras independentes, obtidas de
diferentes fontes, podem ser supostas como oriundas de uma
mesma variável aleatória populacional, os seguintes dados foram
observados:
• Amostra 1: 35 40 45 46 56 60 100
• Amostra 2: 22 44 61 66 70 75 82 90 92 98
Se o pesquisador usar o teste U de Wilcoxon – Mann – Whitney,
então o valor da estatística U para esse problema é igual a
Uma pesquisa científica foi realizada para investigar a
relação entre o tempo médio, por dia, que um indivíduo gasta
navegando nas redes sociais (em minutos) e sua idade (em anos).
Os dados foram obtidos em uma entrevista com os usuários, que
responderam sua idade e seu tempo de navegação diário nas
redes. A partir dos dados observados experimentalmente, um
pesquisador elaborou o seguinte modelo de regressão linear
simples ajustado, em que I corresponde à idade e T, ao tempo.
T = 163,12 − 0,9532 × I
Considerando a situação hipotética precedente, julgue os itens a
seguir.
I A correlação entre as variáveis T e I é linear positiva.
II T é uma variável dependente de I.
III Se uma pessoa de 20 anos de idade responder que gasta
diariamente 152 minutos nas redes sociais, então o erro, ou
seja, a diferença entre o valor efetivo e o valor previsto, será
superior a 7 minutos.
Na estimação de parâmetros de modelos econométricos, o
estimador de mínimos quadrados ordinários (MQO) é largamente
utilizado. A principal propriedade que esse estimador deve ter é
ser consistente, ou seja, o estimador deve convergir para o
verdadeiro parâmetro conforme o tamanho da amostra aumenta.
Avalie se as seguintes condições são necessárias para a
consistência do estimador de MQO.
I. A distribuição de probabilidade dos erros do modelo deve ser
uma distribuição Normal.
II. A correlação entre as variáveis explicativas do modelo e o
termo de erro deve convergir para zero.
III. Os erros do modelo devem ter média igual a zero.
A população formada pelos salários dos empregados de um determinado setor é considerada de tamanho infinito, apresentando
uma distribuição normal com média μ e desvio padrão populacional igual a R$ 256,00. Uma amostra aleatória de tamanho 225 é
extraída desta população obtendo-se um intervalo de confiança de (1 − α) para μ, em R$, igual a [3.271,84 ; 3.328,16]. O valor
do escore r da curva normal padrão (Z) tal que a probabilidade P(Z > r) = α/2 é
Para responder a próxima questão, pode ser útil saber que, se Z é uma variável aleatória que segue distribuição Normal com média zero e desvio padrão 1, então: P(Z>0,5) = 0,31, P(Z>1) = 0,16 e P(Z>2) = 0,02.
Um analista avalia um orçamento para a reforma de um edifício
do TRF. O orçamento apresenta custo de 100 mil reais, caso o
tempo de execução seja igual ou inferior a um ano, e de 200 mil
reais, caso a execução ultrapasse um ano. O tempo de execução,
em meses, segue distribuição Normal com média 10 e desvio
padrão 4. O valor esperado do custo de execução do projeto, em
mil reais, é:
Um juiz costuma absolver 30% dos réus nos processos que são aleatoriamente distribuídos à sua vara. Ele é considerado severo, pois seus outros 19 colegas, integrantes do mesmo tribunal, costumam inocentar 40% dos acusados. Supondo que certo indivíduo foi absolvido, a probabilidade de que ele tenha sido julgado pelo juiz rigoroso é de:
Assinale a opção que apresenta corretamente a tarefa de
mineração de dados adequada a ser utilizada caso um banco
deseje prever, a partir de variáveis como renda, idade e histórico
de pagamentos, o valor do limite de crédito que deve conceder a
um cliente.
Uma variável aleatória contínua, X, com distribuição uniforme no intervalo [a,b], a < b, tem média igual à variância de uma variável com distribuição qui-quadrado com 4 graus de liberdade. Se P (X < 1 ) = 1/9 então P (1 < X < 5) é:
Referente a todos os métodos estatísticos que simultaneamente analisam múltiplas medidas sobre cada indivíduo ou objeto sob investigação. Qualquer
análise simultânea de mais de duas variáveis, é o conceito de:
O diâmetro X de rolamentos esféricos
produzidos por uma fábrica segue uma
distribuição normal com µ=0,614 e σ=0,0025. O
lucro L de cada peça depende do seu diâmetro. L = R$0,10, se o rolamento for bom (0,61 < X < 0,618)
L = R$0,05, se o rolamento for recuperável, (0,608
< X < 0,61) ou (0,618 < X < 0,62)
L = - R$0,10, se o rolamento for defeituoso, (X <
0,608) ou (X > 0,62)
Assinale a alternativa que apresenta o lucro.
Um analista financeiro tenta prever a rentabilidade anual futura
de um ativo, em termos reais. Ele considera que a rentabilidade
real (em %) siga, ao longo dos anos, um modelo
AR(1): yt =Φ0
+Φ1
yt-1 +εt, em que t é o ano, E(εt) = 0 e
corr(εt,εt-s) = 0, para s = 1, 2, ... . Sabe-se que a rentabilidade real
prevista pelo modelo para o longuíssimo prazo foi de 4% ao ano.
Se a estimativa obtida para o parâmetroΦ1
foi 0,8, a estimativa
do parâmetroΦ0
foi:
A ocorrência de ajuizamento de ação de guarda pela Defensoria
Pública de uma comarca é modelada como um processo de
Poisson de taxa 0,4 por dia. A Defensoria Pública funciona 7 dias
por semana.
Em uma semana, o número médio de dias em que ocorre a
propositura de ação de guarda por esse órgão da Defensoria é,
aproximadamente:
Um estatístico deseja selecionar uma amostra aleatória simples,
com reposição, de uma população em que a variância é
conhecida e igual a 40.000.
A amostra precisa atender ao seguinte critério:
A amplitude máxima do intervalo bilateral de 95% de confiança
para a média populacional deve ser de 200.
O menor tamanho de amostra que atende à condição descrita
acima é: