Questões de Concursos de Estatística sobre Modelos lineares

ID: 1036643•
Estatística•
Instituto Access•
Banestes•
Gestão Estatística•
2024

Qual dos testes abaixo não é considerado não paramétrico?

ID: 944813•
Estatística•
INEP•
MEC•
Tecnologia em Gestão Pública•
2022

Uma Organização não Governamental (ONG) desenvolve trabalho social em um município, visando o combate à desnutrição de crianças carentes até a idade escolar. Quando completa 4 anos, a criança sai do programa e é direcionada a uma escola do governo municipal, juntamente com uma ficha que contém dados relacionados ao seu desenvolvimento. Em 2022, o governo municipal decidiu implantar um programa similar que acompanhará a nutrição de crianças até que elas concluam os primeiros anos do ensino fundamental. Para efeitos de monitoramento e avaliação, foram geradas estatísticas sobre as variáveis peso (P) e altura (A) das primeiras crianças que participamdo programa. A distribuição das alturas apresentou média de 91 cm e variância de 56,25 cm², enquanto a distribuição dos pesos apresentou média de 39 kg e variância de 16 kg².

Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. A distribuição da variável P apresentou um coeficiente de variação maior do que a da distribuição da variável A.
PORQUE
II. O desvio padrão de A é maior do que o desvio padrão de P.
A respeito dessas asserções, assinale a opção correta.

ID: 1038572•
Estatística•
CESGRANRIO•
BANESE•
Desenvolvimento•
2025

O setor de Recursos Humanos de um banco está utilizando People Analytics para identificar padrões no desempenho dos funcionários e melhorar a alocação de talentos. Durante uma análise recente, a equipe utilizou dados de avaliações de desempenho (pontuações de 0 a 100) e correlacionou esses dados à quantidade de horas dedicadas a treinamentos no último semestre. J, membro da equipe, construiu um modelo de regressão linear para prever a pontuação de um funcionário na avaliação de desempenho (Y), em função do número de horas dedicadas a treinamentos no último semestre (X), obtendo o modelo a seguir.

Ŷ = 50 + 0,5 X
Ele verificou que o modelo atende a todas as premissas do modelo de regressão linear.
A pontuação esperada de um funcionário que dedicou 60 horas a treinamento no último semestre é

ID: 1044151•
Estatística•
FGV•
TJ RR•
Estatística•
2024

No estudo de um modelo de regressão linear simples, avalie se os principais problemas que podem ser detectados por intermédio da análise dos resíduos incluem, entre outros:
I. Não-linearidade da relação entre as variáveis. II. Não normalidade dos erros. III. Variância não-constante dos erros (heterocedasticidade). IV. Correlação entre os erros. V. Presença de outliers ou observações atípicas.

Estão corretos os problemas

ID: 1061844•
Estatística•
CESPE CEBRASPE•
Polícia Federal•
Área 1 Contábil Financeira•
2025

Em um modelo de regressão linear simples, foi observado que y = 2+ 2x + ∈, em que y representa a variável dependente, cujo desvio padrão amostral é igual a 6, e x denota a variável regressora, cuja média e desvio padrão amostrais são, respectivamente, iguais a 5 e 2,4. O termo ∈ representa o erro aleatório com média zero e variância 4.
A partir das informações apresentadas na situação hipotética precedente, considerando que esse modelo foi obtido pelo método de mínimos quadrados ordinários, julgue o seguinte item.

A correlação linear de Pearson entre as variáveis x e y é igual a 0,8.

ID: 1044595•
Estatística•
FGV•
EPE•
Analista de Pesquisa Energética Recursos Energéticos•
2024

Um estudo foi desenvolvido com o objetivo de estimar o consumo de energia elétrica em função do número de consumidores. Para realizar o estudo, foi usado um Modelo de Regressão Linear Simples.
Sobre o modelo usado, analise as afirmativas a seguir.

I. Considerando a equação y=α+βx, onde "α" e "β" são parâmetros da reta teórica, os quais são estimados por meio dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta estimada.
II. A aplicação do Princípio de Máxima Verossimilhança leva ao chamado procedimento de Mínimos Quadrados.

III. Deve-se procurar a reta para a qual se consiga minimizar a soma dos resíduos da regressão ao quadrado.

Está correto o que se afirma em

ID: 1036644•
Estatística•
Instituto Access•
Banestes•
Gestão Estatística•
2024

Sobre a regressão linear analise as afirmativas:

I. A variável independente também pode ser chamada de regressora e/ou explicativa, sendo considerada a variável principal.
II. A regressão Linear tem a finalidade de avaliar o comportamento de uma variável em função da outra.
III. A variável dependente é aquela cujo valor é observado em função da variável principal (a variável independente).

De acordo com as afirmativas acima, quais estão corretas:

ID: 1050676•
Estatística•
FGV•
TCE PA•
Analista de Sistemas•
2024

Modelos de aprendizagem de máquina são, em geral, avaliados com métricas que indicam os quão poderosos e relevantes eles são.
Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, é correto citar

• a taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos);
• a taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e
• o escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade.

Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.

O escore F1 referente a esse modelo é

ID: 1068659•
Estatística•
VUNESP•
EsFCEx•
Especialidade Estatística•
2025

Um experimento foi planejado segundo um delineamento inteiramente casualizado, em esquema fatorial fracionário do tipo 2^k-p, com k = 5 fatores, p = 2, e sendo 3 repetições por ensaio.

Se o planejamento do experimento for modificado para p = 1 e o número de repetições para 4 por ensaio, qual será o incremento no número de graus de liberdade do resíduo da análise de variância?

ID: 1054092•
Estatística•
CONSULPLAN•
HEMOBRÁS•
Controle da Qualidade 3 Tarde•
2021

Uma pesquisadora está interessada em investigar se há associação entre a proporção X da população com esgotamento sanitário (%) e a taxa de mortalidade infantil Y (por 1.000 nascidos vivos). Após coletar uma amostra de cidades, ela estimou a seguinte reta de regressão linear simples: y = a – bx, com a > 0 e b > 0. Considerando que o coeficiente de determinação do modelo ajustado é R² = 0,81, a correlação linear estimada entre as duas variáveis é:

ID: 1048630•
Estatística•
FGV•
Prefeitura de Cuiabá MT•
Tecnologia da Informação Tarde•
2024

Considere dois conjuntos de dados distintos, denotados por C1 e C2, ambos do mesmo tamanho, isto é, com a mesma quantidade de valores. A cada conjunto foi aplicado o mesmo método de regressão linear. O erro médio quadrático obtido para C1 foi menor do que para C2. Com base no exposto, analise as afirmativas a seguir, e assinale V para a afirmativa verdadeira e F para a falsa.

( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.

( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.

( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.

As afirmativas são, respectivamente,

ID: 981755•
Estatística•
CESPE CEBRASPE•
CAESBDF•
Estatístico•
2025

Uma pesquisa científica foi realizada para investigar a relação entre o tempo médio, por dia, que um indivíduo gasta navegando nas redes sociais (em minutos) e sua idade (em anos). Os dados foram obtidos em uma entrevista com os usuários, que responderam sua idade e seu tempo de navegação diário nas redes. A partir dos dados observados experimentalmente, um pesquisador elaborou o seguinte modelo de regressão linear simples ajustado, em que I corresponde à idade e T, ao tempo.

T = 163,12 − 0,9532 × I

Considerando a situação hipotética precedente, julgue os itens a seguir.

I A correlação entre as variáveis T e I é linear positiva.
II T é uma variável dependente de I.
III Se uma pessoa de 20 anos de idade responder que gasta diariamente 152 minutos nas redes sociais, então o erro, ou seja, a diferença entre o valor efetivo e o valor previsto, será superior a 7 minutos.

Assinale a opção correta.

ID: 1062718•
Estatística•
CESPE CEBRASPE•
SEFAZ SE•
Tecnologia da Informação•
2025

Assinale a opção que apresenta corretamente a tarefa de mineração de dados adequada a ser utilizada caso um banco deseje prever, a partir de variáveis como renda, idade e histórico de pagamentos, o valor do limite de crédito que deve conceder a um cliente.

ID: 1059916•
Estatística•
FGV•
TCE GO•
Controle Externo•
2024

Em relação à Análise da Variância (ANOVA), as afirmativas a seguir estão corretas, à exceção de uma.
Assinale-a.

ID: 1064069•
Estatística•
FGV•
CVM•
Tarde•
2024

Um analista financeiro tenta prever a rentabilidade anual futura de um ativo, em termos reais. Ele considera que a rentabilidade real (em %) siga, ao longo dos anos, um modelo AR(1): yt =Φ₀ +Φ₁ y_t-1 +ε_t, em que t é o ano, E(ε_t) = 0 e corr(ε_t,ε_t-s) = 0, para s = 1, 2, ... . Sabe-se que a rentabilidade real prevista pelo modelo para o longuíssimo prazo foi de 4% ao ano.
Se a estimativa obtida para o parâmetroΦ₁ foi 0,8, a estimativa do parâmetroΦ₀ foi:

ID: 1016756•
Estatística•
CESPE CEBRASPE•
EMBRAPA•
Pesquisador Ciências Agrárias•
2025

Considerando a relevância da bioestatística para a saúde animal, julgue o item seguinte.

A regressão estatística não é adequada para a quantificação das associações entre um fator de interesse (variável dependente) e fatores explicativos (variáveis independentes).

ID: 1068392•
Estatística•
VUNESP•
EsFCEx•
Estatística•
2024

Considere que um professor de estatística deseja avaliar se a nota obtida pelos alunos pode ser descrita em função do tempo de estudo deles. Para isso, decidiu realizar o ajuste de um modelo de regressão linear e organizou os dados das notas dos alunos e do tempo de estudo em dois objetos no ambiente R, nomeados como “nota” e “tempo”, ambos na mesma ordem de entrada. A sequência de comandos que realiza o ajuste de um modelo de regressão linear e apresenta o intervalo de confiança (95%) para os coeficientes de regressão é:

ID: 981754•
Estatística•
CESPE CEBRASPE•
CAESBDF•
Estatístico•
2025

Texto 17A3

Conforme a literatura básica de estatística, o coeficiente de correlação linear r é adimensional e pode variar de −1 a 1, ou seja −1 ≤ r≤ 1.

Considerando as informações do texto 17A3, julgue os itens a seguir.

I Se o valor de r estiver próximo de +1, a reta será crescente e representará a correlação entre os valores das variáveis, com uma mínima dispersão entre os pontos obtidos pelas variáveis e os pontos da reta.
II Para duas variáveis, X e Y, se o coeficiente de correlação for, aproximadamente, r = 0,9813, então 96,29% das variações totais serão explicadas pela reta de regressão Y = a + bX.
III Caso o coeficiente de correlação seja r = −1, a reta ajustada explicará toda a variação de Y e, por consequência, o ajuste linear será excelente.

Assinale a opção correta.

ID: 1068399•
Estatística•
VUNESP•
EsFCEx•
Estatística•
2024

Um modelo de regressão linear simples (Y_i = a + b X_i + e_i, sendo i = 1, 2, ...,33) foi ajustado a uma amostra aleatória de uma determinada população, onde se obteve as seguintes informações referentes à análise de variância desse modelo: (i) a soma de quadrados referente a regressão foi igual a 3390; e (ii) a soma de quadrados totais foi igual a 3713. A estimativa não viciada para a variância populacional e a interpretação do coeficiente de determinação desse modelo são, respectivamente:

ID: 1068660•
Estatística•
VUNESP•
EsFCEx•
Especialidade Estatística•
2025

Em um experimento agrícola, um pesquisador deseja comparar 6 tratamentos para avaliar sua influência na produtividade de milho. Devido à limitação da área, não foi possível alocar todos os tratamentos em todos os blocos. Assim, adotou-se um delineamento em blocos incompletos balanceados, com 6 tratamentos, 10 blocos, 3 tratamentos por blocos e 5 repetições por tratamento.

Com base nas propriedades e na análise de variância associada a esse delineamento, assinale a alternativa correta.

ID: 1036643•Estatística•Instituto Access•Banestes•Gestão Estatística•2024

ID: 944813•Estatística•INEP•MEC•Tecnologia em Gestão Pública•2022

ID: 1038572•Estatística•CESGRANRIO•BANESE•Desenvolvimento•2025

ID: 1044151•Estatística•FGV•TJ RR•Estatística•2024

ID: 1061844•Estatística•CESPE CEBRASPE•Polícia Federal•Área 1 Contábil Financeira•2025

ID: 1044595•Estatística•FGV•EPE•Analista de Pesquisa Energética Recursos Energéticos•2024

ID: 1036644•Estatística•Instituto Access•Banestes•Gestão Estatística•2024

ID: 1050676•Estatística•FGV•TCE PA•Analista de Sistemas•2024

ID: 1068659•Estatística•VUNESP•EsFCEx•Especialidade Estatística•2025

ID: 1054092•Estatística•CONSULPLAN•HEMOBRÁS•Controle da Qualidade 3 Tarde•2021

ID: 1048630•Estatística•FGV•Prefeitura de Cuiabá MT•Tecnologia da Informação Tarde•2024

ID: 981755•Estatística•CESPE CEBRASPE•CAESBDF•Estatístico•2025

ID: 1062718•Estatística•CESPE CEBRASPE•SEFAZ SE•Tecnologia da Informação•2025

ID: 1059916•Estatística•FGV•TCE GO•Controle Externo•2024

ID: 1064069•Estatística•FGV•CVM•Tarde•2024

ID: 1016756•Estatística•CESPE CEBRASPE•EMBRAPA•Pesquisador Ciências Agrárias•2025

ID: 1068392•Estatística•VUNESP•EsFCEx•Estatística•2024

ID: 981754•Estatística•CESPE CEBRASPE•CAESBDF•Estatístico•2025

ID: 1068399•Estatística•VUNESP•EsFCEx•Estatística•2024

ID: 1068660•Estatística•VUNESP•EsFCEx•Especialidade Estatística•2025