Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria

Considerando que o horário de ocorrência de certo tipo de crime em determinado local seja representado por uma variável aleatória contínuaX, cuja função de densidade é escrita como


ƒ(x) =y(x- 12)2,


em que 0 ≤ x < 24 eyé uma constante de normalização (y > 0), julgue o item subsequente.

O valor esperado de X é igual a 12.

Um fabricante vende vinho em caixas de 30 garrafas. Assinale a alternativa que apresenta a probabilidade da média do volume de vinho das garrafas em uma caixa ser inferior a 735 ml, se o fabricante informa que a medida do volume médio de vinho em cada garrafa é de 750 ml, e desvio padrão 25 ml. Arredonde sua resposta para duas casas decimais.
No lançamento de um dado viciado, a chance de ocorrência do número da face voltada para cima equivale ao seu valor numérico, ou seja, a chance de o número da face voltada para cima ser 1 é igual a 1, a chance de o número da face voltada para cima ser 2 é igual a 2, etc. Nessas condições, ao lançar esse dado, a probabilidade de que a face voltada para cima seja um número menor que 4 é _____. Assinale a alternativa que preencha corretamente a lacuna.
Texto 1


Um analista judiciário possui um grande número de processos para examinar e avaliar, os quais se enquadram em apenas duas categorias: A e B. Sabe-se que 25% desses processos se enquadram na categoria A. Sabe-se ainda que a probabilidade de o analista aprovar um processo da categoria A é de 0,8, enquanto a probabilidade de que um processo da categoria B seja aprovado pelo analista é de 0,4.
Com respeito à situação apresentada no texto 1, se 5 processos são examinados, de forma independente, por esse analista, a probabilidade aproximada de que exatamente 2 deles sejam aprovados é:
A quantidade de novos processos (P) em Tribunais de Justiça dos 27 estados do Brasil é uma variável com média 16 mil e moda igual a 7 mil. Com base apenas em tais informações é possível afirmar que:
Analise as afirmativas abaixo, referentes à geração de números aleatórios:

I. Os números gerados por um computador como aleatórios são considerados pseudoaleatórios, uma vez que existe um algoritmo que origina esses números.
II. Caso o algoritmo gere em algum momento o número usado como semente, a sequência de números pseudoaleatórios deverá se repetir.
III. O número que inicia o algoritmo de geração de números pseudoaleatórios é conhecido como semente.

Quais afirmativas estão corretas:
Definida (o) por um vetor de médias e a matriz de variância-covariância. É uma extensão da distribuição normal univariada para aplicações com um grupo de variáveis que podem ser correlacionadas. Refere-se a:
Uma urna contém 20 bolas de mesmo tamanho, das quais 5 são premiadas. O experimento consiste em selecionar aleatoriamente 2 bolas da urna, sem reposição.

Seja X a variável aleatória discreta que representa o número de bolas premiadas retiradas no experimento, a variância de X é igual a quanto?
Um instituto de pesquisa resolveu utilizar um modelo de vetores autorregressivos (VAR) no monitoramento do preço do gás natural.
Sobre o referido modelo, analise as afirmativas a seguir.

I. O modelo VAR é um modelo de séries temporais usado para prever valores de duas ou mais variáveis, sendo uma extensão do caso univariado autorregressivo (AR), que considera apenas uma variável de cada vez.

II. Um vetor autorregressivo é um sistema de equações lineares dinâmicas, em que cada variável exógena é escrita como uma combinação linear de suas defasagens e também defasagens das variáveis endógenas de outras equações.

III. O sistema multivariado de Vetores Autorregressivo deve apresentar um processo ruído branco, de forma que os erros sejam independentes, porém não são identicamente distribuídos.

Está correto o que se afirma em
Um gestor avalia a expectativa de rentabilidade mensal de um fundo de ações utilizando o modelo de regressão linear clássico y = β0 + β1x + ϵ, em que y é a rentabilidade, x é um indicador econômico, β0 e β1 são parâmetros a serem estimados por mínimos quadrados e ϵ é o termo de erro. O modelo satisfaz aos pressupostos para estimação por mínimos quadrados. Com base em uma amostra de 3 meses, na qual os valores observados da variável explicativa x foram x1 = 1, x2 = 2 e x3 = 2, o modelo estimado conduziu aos resíduos e1 = 2, e2 = 1 e e3 = 1.

A estimativa, baseada no estimador não viciado, para a covariância entre os estimadores de β0 e β1, é:
Uma equipe de pesquisadores em políticas públicas de saúde laboral deseja estimar a proporção de indivíduos de determinada população que estão sofrendo de problemas relacionados a burnout. A estimação será feita utilizando técnicas de Inferência Estatística.
A equipe tem acesso a qualquer indivíduo dessa população, mas tem capacidade para coletar os dados de apenas uma parcela irrisória da população como um todo. A composição e as características gerais dessa população são totalmente desconhecidas.
Diante desse cenário, a equipe de pesquisa deve fazer sua coleta de dados mediante um processo de amostragem
Um supervisor deve escolher somente um agente para realizar um trabalho de pesquisa. Na região Sul há 23 agentes, na região Norte há 18 agentes, na região Leste há 17 agentes e na região Oeste há 31 agentes. A probabilidade de que o agente escolhido não seja da região Norte é mais próximo de:
A variável y segue um processo representado por yt = φ1 yt–1 + φ2 yt–2 + εt + θεt –1 , sendo εt um ruído branco.
Esse processo é denominado

Considerando um levantamento de dados realizado pelo departamento de Recursos Humanos do Município de Capanema/PR, sobre a idade dos servidores públicos, observada a idade que mais se repete no conjunto de dados, tem-se o conceito estatístico de:
Se consideramos que a região centro-oeste do Brasil com área aproximada de 1.600.000 km2 é composta por 14,4 milhões de habitantes e que a região norte do Brasil com área de 3.900.000 km2 é composta por 15,6 milhões de habitantes, então podemos dizer que a diferença entre as densidades demográficas dessas duas regiões é _____.
Assinale a alternativa que preencha corretamente a lacuna
Entre as medidas características de uma distribuição de probabilidade tem-se:
Considere dois conjuntos de dados distintos, denotados por C1 e C2, ambos do mesmo tamanho, isto é, com a mesma quantidade de valores. A cada conjunto foi aplicado o mesmo método de regressão linear. O erro médio quadrático obtido para C1 foi menor do que para C2. Com base no exposto, analise as afirmativas a seguir, e assinale V para a afirmativa verdadeira e F para a falsa.

( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.

( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.

( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.


As afirmativas são, respectivamente,
A modelagem de Box-Jenkins envolve basicamente três estágios: identificação dos modelos a serem testados, estimação dos parâmetros dos modelos e teste de adequação. No estágio de identificação, as especificações funcionais dos modelos podem ser escolhidas com base na avaliação de correlogramas obtidos a partir da série temporal que se deseja modelar. Com relação aos correlogramas são apresentadas as seguintes afirmativas:

I - Quando correlograma e correlograma parcial apresentam padrões de decaimento exponencial com ou sem oscilações ou decaimento em onda senoidal, o modelo indicado é o ARMA.

II - Para correlogramas que apresentam truncamento abrupto o modelo mais apropriado é o AR.

III - Para correlogramas parciais que apresentam truncamento abrupto, o modelo mais apropriado é o MA.

É correto apenas o que se afirma em
Usando a distribuição normal (contínua) para aproximar uma binomial (discreta) é necessária associar um intervalo (na distribuição contínua) ao valor discreto. Essa associação é:
Página 9