Qual dos testes abaixo não é considerado não paramétrico?
Questões de Concursos
Filtre e encontre questões para seus estudos.
Uma Organização não Governamental (ONG) desenvolve trabalho social em um município, visando o
combate à desnutrição de crianças carentes até a idade escolar. Quando completa 4 anos, a criança
sai do programa e é direcionada a uma escola do governo municipal, juntamente com uma ficha que
contém dados relacionados ao seu desenvolvimento. Em 2022, o governo municipal decidiu implantar
um programa similar que acompanhará a nutrição de crianças até que elas concluam os primeiros anos
do ensino fundamental. Para efeitos de monitoramento e avaliação, foram geradas estatísticas sobre as
variáveis peso (P) e altura (A) das primeiras crianças que participamdo programa. A distribuição das alturas
apresentou média de 91 cm e variância de 56,25 cm2, enquanto a distribuição dos pesos apresentou
média de 39 kg e variância de 16 kg2.
Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. A distribuição da variável P apresentou um coeficiente de variação maior do que a da distribuição da variável A.
PORQUE
II. O desvio padrão de A é maior do que o desvio padrão de P.
A respeito dessas asserções, assinale a opção correta.
Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. A distribuição da variável P apresentou um coeficiente de variação maior do que a da distribuição da variável A.
PORQUE
II. O desvio padrão de A é maior do que o desvio padrão de P.
A respeito dessas asserções, assinale a opção correta.
O setor de Recursos Humanos de um banco está utilizando People Analytics para identificar padrões no desempenho dos funcionários e melhorar a alocação de
talentos. Durante uma análise recente, a equipe utilizou
dados de avaliações de desempenho (pontuações de 0 a
100) e correlacionou esses dados à quantidade de horas
dedicadas a treinamentos no último semestre. J, membro
da equipe, construiu um modelo de regressão linear para
prever a pontuação de um funcionário na avaliação de desempenho (Y), em função do número de horas dedicadas
a treinamentos no último semestre (X), obtendo o modelo
a seguir.
Ŷ = 50 + 0,5 X
Ele verificou que o modelo atende a todas as premissas do modelo de regressão linear.
A pontuação esperada de um funcionário que dedicou 60 horas a treinamento no último semestre é
Ŷ = 50 + 0,5 X
Ele verificou que o modelo atende a todas as premissas do modelo de regressão linear.
A pontuação esperada de um funcionário que dedicou 60 horas a treinamento no último semestre é
No estudo de um modelo de regressão linear simples, avalie se os
principais problemas que podem ser detectados por intermédio da
análise dos resíduos incluem, entre outros:
I. Não-linearidade da relação entre as variáveis. II. Não normalidade dos erros. III. Variância não-constante dos erros (heterocedasticidade). IV. Correlação entre os erros. V. Presença de outliers ou observações atípicas.
Estão corretos os problemas
I. Não-linearidade da relação entre as variáveis. II. Não normalidade dos erros. III. Variância não-constante dos erros (heterocedasticidade). IV. Correlação entre os erros. V. Presença de outliers ou observações atípicas.
Estão corretos os problemas
Em um modelo de regressão linear simples, foi observado que y = 2+ 2x + ∈, em que y representa a variável dependente, cujo desvio padrão amostral é igual a 6, e x denota a variável regressora, cuja média e desvio padrão amostrais são, respectivamente, iguais a 5 e 2,4. O termo ∈ representa o erro aleatório com média zero e variância 4.
A partir das informações apresentadas na situação hipotética precedente, considerando que esse modelo foi obtido pelo método de mínimos quadrados ordinários, julgue o seguinte item.
A correlação linear de Pearson entre as variáveis x e y é igual a 0,8.
A partir das informações apresentadas na situação hipotética precedente, considerando que esse modelo foi obtido pelo método de mínimos quadrados ordinários, julgue o seguinte item.
A correlação linear de Pearson entre as variáveis x e y é igual a 0,8.
Um estudo foi desenvolvido com o objetivo de estimar o consumo
de energia elétrica em função do número de consumidores. Para
realizar o estudo, foi usado um Modelo de Regressão Linear
Simples.
Sobre o modelo usado, analise as afirmativas a seguir.
I. Considerando a equação y=α+βx, onde "α" e "β" são parâmetros da reta teórica, os quais são estimados por meio dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta estimada.
II. A aplicação do Princípio de Máxima Verossimilhança leva ao chamado procedimento de Mínimos Quadrados.
III. Deve-se procurar a reta para a qual se consiga minimizar a soma dos resíduos da regressão ao quadrado.
Está correto o que se afirma em
Sobre o modelo usado, analise as afirmativas a seguir.
I. Considerando a equação y=α+βx, onde "α" e "β" são parâmetros da reta teórica, os quais são estimados por meio dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta estimada.
II. A aplicação do Princípio de Máxima Verossimilhança leva ao chamado procedimento de Mínimos Quadrados.
III. Deve-se procurar a reta para a qual se consiga minimizar a soma dos resíduos da regressão ao quadrado.
Está correto o que se afirma em
Sobre a regressão linear analise as afirmativas:
I. A variável independente também pode ser chamada de regressora e/ou explicativa, sendo considerada a variável principal.
II. A regressão Linear tem a finalidade de avaliar o comportamento de uma variável em função da outra.
III. A variável dependente é aquela cujo valor é observado em função da variável principal (a variável independente).
De acordo com as afirmativas acima, quais estão corretas:
I. A variável independente também pode ser chamada de regressora e/ou explicativa, sendo considerada a variável principal.
II. A regressão Linear tem a finalidade de avaliar o comportamento de uma variável em função da outra.
III. A variável dependente é aquela cujo valor é observado em função da variável principal (a variável independente).
De acordo com as afirmativas acima, quais estão corretas:
Modelos de aprendizagem de máquina são, em geral, avaliados
com métricas que indicam os quão poderosos e relevantes eles
são.
Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, é correto citar
• a taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos);
• a taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e
• o escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade.
Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.
O escore F1 referente a esse modelo é
Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, é correto citar
• a taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos);
• a taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e
• o escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade.
Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.
O escore F1 referente a esse modelo é
Um experimento foi planejado segundo um delineamento
inteiramente casualizado, em esquema fatorial fracionário do tipo 2k-p, com k = 5 fatores, p = 2, e sendo 3 repetições por ensaio.
Se o planejamento do experimento for modificado para p = 1 e o número de repetições para 4 por ensaio, qual será o incremento no número de graus de liberdade do resíduo da análise de variância?
Se o planejamento do experimento for modificado para p = 1 e o número de repetições para 4 por ensaio, qual será o incremento no número de graus de liberdade do resíduo da análise de variância?
Uma pesquisadora está interessada em investigar se há associação entre a proporção X da população com esgotamento
sanitário (%) e a taxa de mortalidade infantil Y (por 1.000
nascidos vivos). Após coletar uma amostra de cidades, ela
estimou a seguinte reta de regressão linear simples: y = a – bx,
com a > 0 e b > 0. Considerando que o coeficiente de determinação do modelo ajustado é R2 = 0,81, a correlação linear
estimada entre as duas variáveis é:
Considere dois conjuntos de dados distintos, denotados por C1 e
C2, ambos do mesmo tamanho, isto é, com a mesma quantidade
de valores. A cada conjunto foi aplicado o mesmo método de
regressão linear. O erro médio quadrático obtido para C1 foi
menor do que para C2. Com base no exposto, analise as
afirmativas a seguir, e assinale V para a afirmativa verdadeira e F
para a falsa.
( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.
( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.
( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.
As afirmativas são, respectivamente,
( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.
( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.
( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.
As afirmativas são, respectivamente,
Uma pesquisa científica foi realizada para investigar a
relação entre o tempo médio, por dia, que um indivíduo gasta
navegando nas redes sociais (em minutos) e sua idade (em anos).
Os dados foram obtidos em uma entrevista com os usuários, que
responderam sua idade e seu tempo de navegação diário nas
redes. A partir dos dados observados experimentalmente, um
pesquisador elaborou o seguinte modelo de regressão linear
simples ajustado, em que I corresponde à idade e T, ao tempo.
T = 163,12 − 0,9532 × I
Considerando a situação hipotética precedente, julgue os itens a seguir.
I A correlação entre as variáveis T e I é linear positiva.
II T é uma variável dependente de I.
III Se uma pessoa de 20 anos de idade responder que gasta diariamente 152 minutos nas redes sociais, então o erro, ou seja, a diferença entre o valor efetivo e o valor previsto, será superior a 7 minutos.
Assinale a opção correta.
T = 163,12 − 0,9532 × I
Considerando a situação hipotética precedente, julgue os itens a seguir.
I A correlação entre as variáveis T e I é linear positiva.
II T é uma variável dependente de I.
III Se uma pessoa de 20 anos de idade responder que gasta diariamente 152 minutos nas redes sociais, então o erro, ou seja, a diferença entre o valor efetivo e o valor previsto, será superior a 7 minutos.
Assinale a opção correta.
Assinale a opção que apresenta corretamente a tarefa de
mineração de dados adequada a ser utilizada caso um banco
deseje prever, a partir de variáveis como renda, idade e histórico
de pagamentos, o valor do limite de crédito que deve conceder a
um cliente.
Em relação à Análise da Variância (ANOVA), as afirmativas a seguir
estão corretas, à exceção de uma.
Assinale-a.
Assinale-a.
Um analista financeiro tenta prever a rentabilidade anual futura
de um ativo, em termos reais. Ele considera que a rentabilidade
real (em %) siga, ao longo dos anos, um modelo
AR(1): yt =Φ0
+Φ1
yt-1 +εt, em que t é o ano, E(εt) = 0 e
corr(εt,εt-s) = 0, para s = 1, 2, ... . Sabe-se que a rentabilidade real
prevista pelo modelo para o longuíssimo prazo foi de 4% ao ano.
Se a estimativa obtida para o parâmetroΦ1 foi 0,8, a estimativa do parâmetroΦ0 foi:
Se a estimativa obtida para o parâmetroΦ1 foi 0,8, a estimativa do parâmetroΦ0 foi:
Considerando a relevância da bioestatística para a saúde animal, julgue o item seguinte.
A regressão estatística não é adequada para a quantificação das associações entre um fator de interesse (variável dependente) e fatores explicativos (variáveis independentes).
Considere que um professor de estatística deseja avaliar se a nota obtida pelos alunos pode ser descrita em função do
tempo de estudo deles. Para isso, decidiu realizar o ajuste de um modelo de regressão linear e organizou os dados das
notas dos alunos e do tempo de estudo em dois objetos no ambiente R, nomeados como “nota” e “tempo”, ambos na
mesma ordem de entrada. A sequência de comandos que realiza o ajuste de um modelo de regressão linear e apresenta
o intervalo de confiança (95%) para os coeficientes de regressão é:
Texto 17A3
Conforme a literatura básica de estatística, o coeficiente de correlação linear r é adimensional e pode variar de −1 a 1, ou seja −1 ≤ r≤ 1.
Considerando as informações do texto 17A3, julgue os itens a
seguir.
I Se o valor de r estiver próximo de +1, a reta será crescente e representará a correlação entre os valores das variáveis, com uma mínima dispersão entre os pontos obtidos pelas variáveis e os pontos da reta.
II Para duas variáveis, X e Y, se o coeficiente de correlação for, aproximadamente, r = 0,9813, então 96,29% das variações totais serão explicadas pela reta de regressão Y = a + bX.
III Caso o coeficiente de correlação seja r = −1, a reta ajustada explicará toda a variação de Y e, por consequência, o ajuste linear será excelente.
Assinale a opção correta.
I Se o valor de r estiver próximo de +1, a reta será crescente e representará a correlação entre os valores das variáveis, com uma mínima dispersão entre os pontos obtidos pelas variáveis e os pontos da reta.
II Para duas variáveis, X e Y, se o coeficiente de correlação for, aproximadamente, r = 0,9813, então 96,29% das variações totais serão explicadas pela reta de regressão Y = a + bX.
III Caso o coeficiente de correlação seja r = −1, a reta ajustada explicará toda a variação de Y e, por consequência, o ajuste linear será excelente.
Assinale a opção correta.
Um modelo de regressão linear simples (Yi = a + b Xi + ei,
sendo i = 1, 2, ...,33) foi ajustado a uma amostra aleatória de uma determinada população, onde se obteve as
seguintes informações referentes à análise de variância desse modelo: (i) a soma de quadrados referente a
regressão foi igual a 3390; e (ii) a soma de quadrados
totais foi igual a 3713. A estimativa não viciada para a
variância populacional e a interpretação do coeficiente de
determinação desse modelo são, respectivamente:
Em um experimento agrícola, um pesquisador deseja comparar 6 tratamentos para avaliar sua influência
na produtividade de milho. Devido à limitação da área,
não foi possível alocar todos os tratamentos em todos
os blocos. Assim, adotou-se um delineamento em blocos
incompletos balanceados, com 6 tratamentos, 10 blocos,
3 tratamentos por blocos e 5 repetições por tratamento.
Com base nas propriedades e na análise de variância associada a esse delineamento, assinale a alternativa correta.
Com base nas propriedades e na análise de variância associada a esse delineamento, assinale a alternativa correta.