Os testes de significância se apóiam em dados passados. Em testes de regressão, a questão da significância está baseada no nível de confiabilidade de tais dados. Entre os métodos utilizados estão a estatística F, a análise da variância constante (homocedasticidade) e a variância múltipla (heterocedasticidade).
No modelo de Regressão Múltipla
onde o termo aleatório é heterocedástico, é correto afirmar:
Julgue os itens subsecutivos, referentes ao método de componentes principais.
O primeiro componente principal associa-se à combinação linear com variância mínima.
A evolução de uma série mensal de receitas, após a remoção da tendência e de efeitos sazonais, define um processo fracamente estacionário que obedece à lei de formação de um processo auto-regressivo de médias móveis ARMA(p,q). O natural p é a ordem da parte auto-regressiva e o natural q a ordem do processo de médias móveis. Sabe-se que a função de autocorrelação da série tem queda exponencial e que a função de autocorrelação parcial não se anula na defasagem ("lag") de ordem 2, mas se anula a partir da defasagem ("lag") de ordem 3, inclusive.
Assinale a opção que dá os valores de p e q.O modelo de regressão múltipla é mais adequado para se obter o relacionamento entre os variáveis, peso, altura e sexo é:
Um estudo mostra que a capacidade de produção Y (mil metros cúbicos) de um tipo de refinaria está linearmente associada com a sua área construída X (1.000 metros quadrados). A relação é dada por: E(Y|X=x) = 8 + 0,8 (x – 10), e Var(Y) = 2Var(X).
Considerando essa situação hipotética, julgue os seguintes itens.
A variância de Y em torno da reta de regressão E(Y|X=x) é igual a Var(Y).
Atenção: Para resolver às questões de números 38 e 39 considere o texto abaixo. Uma amostra com 80 pares de observações (Xi, Yi), i = 1, 2, 3, . . . , 80; sendo as somas das observações de Xi e Yi iguais a 560 e 2.400, respectivamente. Um estudo tinha como objetivo analisar a relação entre X e Y e adotou-se o modelo Yi = ? + ?Xi + ?i, em que i corresponde a i-ésima observação, ? e ? são parâmetros desconhecidos e ?i o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples. Utilizou-se o método dos mínimos quadrados, com base na amostra, para o ajustamento do modelo obtendo-se para a estimativa de ? o valor de 2.
Considerando a função linear obtida pelo método dos mínimos quadrados, tem-se que quando X varia de 1 unidade Y varia de
A respeito dos modelos de análise de variância, julgue os itens subsequentes.
Considere que, em um modelo de análise de variância (ANOVA) com um fator fixo em quatro níveis, ajustado em uma amostra de tamanho 25, tenha sido observada uma estatística F igual a 3,5. Nesse caso, se a soma de quadrados totais (SQT) for igual a 31,5, então a soma de quadrados associada ao fator é igual a quatro vezes o valor da soma de quadrados do resíduo.
ANS•
A análise atuarial de um plano de saúde é subsidiada por dados históricos que representam os perfis etário, de utilização, de renda e de morbidez da população de usuários vinculados ao plano. Diante da importância da base de dados, o atuário faz uso de várias técnicas de análise da consistência dos dados, bem como de estimativa do comportamento futuro das variáveis aleatórias que influenciam na situação de solvência do plano de saúde. Algumas técnicas de análise exploratória e de inferência podem ser usadas nessa situação. Nesse contexto, julgue os itens que se seguem.
A regressão linear múltipla é recomendada nos casos em que a associação entre as variáveis dependentes é do tipo linear.
No que concerne a diagnóstico em análises de regressão, julgue o item a seguir.
Uma observação pode ser discrepante e não influente.
ANS•
A análise atuarial de um plano de saúde é subsidiada por dados históricos que representam os perfis etário, de utilização, de renda e de morbidez da população de usuários vinculados ao plano. Diante da importância da base de dados, o atuário faz uso de várias técnicas de análise da consistência dos dados, bem como de estimativa do comportamento futuro das variáveis aleatórias que influenciam na situação de solvência do plano de saúde. Algumas técnicas de análise exploratória e de inferência podem ser usadas nessa situação. Nesse contexto, julgue os itens que se seguem.
O modelo de regressão linear simples é recomendado quando se observa uma associação linear entre as variáveis aleatórias analisadas. Esse modelo pode ser utilizado para o estudo da associação entre diversas variáveis simultaneamente.
Julgue o item abaixo acerca dos parâmetros dos modelos de regressão.
Considere que, para um modelo de regressão linear, um vetor x* de variáveis independentes tenha sido observado com o objetivo de se predizer a resposta. Considere, ainda, que um leverage seja igual a 0,45, que o quadrado médio do resíduo seja 120 e que o percentil de ordem 97,5% da distribuição t-Student correspondente seja 2,04. Nesse caso, a amplitude do intervalo de predição é superior a 360.
Em um estudo clínico utilizou-se um modelo de regressão logística em que y é a variável resposta, como preditor linear, a expressão a + bx + cz, em que x = 0 para o grupo placebo e x = 1 para o grupo de tratamento; z é uma medida de colesterol (em escala de 0 a 5) antes do início do tratamento. Com base nessas informações, julgue os itens subsequentes.
Considerando-se exp(c) = 0,7, se x se mantiver constante, então o aumento em uma unidade na medida de colesterol implicará em redução de 30% na chance de sucesso (y = 1).
Julgue os itens subsecutivos, referentes ao método de componentes principais.
A técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade em problemas de regressão linear.
Para ajustar uma curva a um conjunto de dados é usual utilizar o Método dos Mínimos Quadrados (MMQ). Sabe-se que:
I. O MMQ é uma técnica matemática de otimização que busca o melhor ajuste para um conjunto de dados.
II. O MMQ busca minimizar a soma dos erros quadráticos.
Considerando as assertivas acima, pode-se afirmar que:
A respeito dos modelos de análise de variância, julgue os itens subsequentes.
Em um modelo de análise de variância (ANOVA) para um fator fixo com três níveis, o valor absoluto do efeito de um dos níveis é igual ao valor absoluto da soma dos efeitos dos demais níveis.