Questões de Concursos

Filtre e encontre questões para seus estudos.

Uma Organização não Governamental (ONG) desenvolve trabalho social em um município, visando o combate à desnutrição de crianças carentes até a idade escolar. Quando completa 4 anos, a criança sai do programa e é direcionada a uma escola do governo municipal, juntamente com uma ficha que contém dados relacionados ao seu desenvolvimento. Em 2022, o governo municipal decidiu implantar um programa similar que acompanhará a nutrição de crianças até que elas concluam os primeiros anos do ensino fundamental. Para efeitos de monitoramento e avaliação, foram geradas estatísticas sobre as variáveis peso (P) e altura (A) das primeiras crianças que participamdo programa. A distribuição das alturas apresentou média de 91 cm e variância de 56,25 cm2, enquanto a distribuição dos pesos apresentou média de 39 kg e variância de 16 kg2.

Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. A distribuição da variável P apresentou um coeficiente de variação maior do que a da distribuição da variável A.
PORQUE
II. O desvio padrão de A é maior do que o desvio padrão de P.
A respeito dessas asserções, assinale a opção correta.
O setor de Recursos Humanos de um banco está utilizando People Analytics para identificar padrões no desempenho dos funcionários e melhorar a alocação de talentos. Durante uma análise recente, a equipe utilizou dados de avaliações de desempenho (pontuações de 0 a 100) e correlacionou esses dados à quantidade de horas dedicadas a treinamentos no último semestre. J, membro da equipe, construiu um modelo de regressão linear para prever a pontuação de um funcionário na avaliação de desempenho (Y), em função do número de horas dedicadas a treinamentos no último semestre (X), obtendo o modelo a seguir.

Ŷ = 50 + 0,5 X
Ele verificou que o modelo atende a todas as premissas do modelo de regressão linear.
A pontuação esperada de um funcionário que dedicou 60 horas a treinamento no último semestre é
No estudo de um modelo de regressão linear simples, avalie se os principais problemas que podem ser detectados por intermédio da análise dos resíduos incluem, entre outros:
I. Não-linearidade da relação entre as variáveis. II. Não normalidade dos erros. III. Variância não-constante dos erros (heterocedasticidade). IV. Correlação entre os erros. V. Presença de outliers ou observações atípicas.

Estão corretos os problemas
Em um modelo de regressão linear simples, foi observado que y = 2+ 2x + ∈, em que y representa a variável dependente, cujo desvio padrão amostral é igual a 6, e x denota a variável regressora, cuja média e desvio padrão amostrais são, respectivamente, iguais a 5 e 2,4. O termo ∈ representa o erro aleatório com média zero e variância 4.
A partir das informações apresentadas na situação hipotética precedente, considerando que esse modelo foi obtido pelo método de mínimos quadrados ordinários, julgue o seguinte item.


A correlação linear de Pearson entre as variáveis x e y é igual a 0,8.
Um estudo foi desenvolvido com o objetivo de estimar o consumo de energia elétrica em função do número de consumidores. Para realizar o estudo, foi usado um Modelo de Regressão Linear Simples.
Sobre o modelo usado, analise as afirmativas a seguir.

I. Considerando a equação y=α+βx, onde "α" e "β" são parâmetros da reta teórica, os quais são estimados por meio dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta estimada.
II. A aplicação do Princípio de Máxima Verossimilhança leva ao chamado procedimento de Mínimos Quadrados.

III. Deve-se procurar a reta para a qual se consiga minimizar a soma dos resíduos da regressão ao quadrado.


Está correto o que se afirma em
Sobre a regressão linear analise as afirmativas:

I. A variável independente também pode ser chamada de regressora e/ou explicativa, sendo considerada a variável principal.
II. A regressão Linear tem a finalidade de avaliar o comportamento de uma variável em função da outra.
III. A variável dependente é aquela cujo valor é observado em função da variável principal (a variável independente).

De acordo com as afirmativas acima, quais estão corretas:
Modelos de aprendizagem de máquina são, em geral, avaliados com métricas que indicam os quão poderosos e relevantes eles são.
Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, é correto citar

• a taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos);
• a taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e
• o escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade.

Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.

O escore F1 referente a esse modelo é
Um experimento foi planejado segundo um delineamento inteiramente casualizado, em esquema fatorial fracionário do tipo 2k-p, com k = 5 fatores, p = 2, e sendo 3 repetições por ensaio.

Se o planejamento do experimento for modificado para p = 1 e o número de repetições para 4 por ensaio, qual será o incremento no número de graus de liberdade do resíduo da análise de variância?
Uma pesquisadora está interessada em investigar se há associação entre a proporção X da população com esgotamento sanitário (%) e a taxa de mortalidade infantil Y (por 1.000 nascidos vivos). Após coletar uma amostra de cidades, ela estimou a seguinte reta de regressão linear simples: y = a – bx, com a > 0 e b > 0. Considerando que o coeficiente de determinação do modelo ajustado é R2 = 0,81, a correlação linear estimada entre as duas variáveis é:
Considere dois conjuntos de dados distintos, denotados por C1 e C2, ambos do mesmo tamanho, isto é, com a mesma quantidade de valores. A cada conjunto foi aplicado o mesmo método de regressão linear. O erro médio quadrático obtido para C1 foi menor do que para C2. Com base no exposto, analise as afirmativas a seguir, e assinale V para a afirmativa verdadeira e F para a falsa.

( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.

( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.

( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.


As afirmativas são, respectivamente,
Uma pesquisa científica foi realizada para investigar a relação entre o tempo médio, por dia, que um indivíduo gasta navegando nas redes sociais (em minutos) e sua idade (em anos). Os dados foram obtidos em uma entrevista com os usuários, que responderam sua idade e seu tempo de navegação diário nas redes. A partir dos dados observados experimentalmente, um pesquisador elaborou o seguinte modelo de regressão linear simples ajustado, em que I corresponde à idade e T, ao tempo.

T = 163,12 − 0,9532 × I

Considerando a situação hipotética precedente, julgue os itens a seguir.

I A correlação entre as variáveis T e I é linear positiva.
II T é uma variável dependente de I.
III Se uma pessoa de 20 anos de idade responder que gasta diariamente 152 minutos nas redes sociais, então o erro, ou seja, a diferença entre o valor efetivo e o valor previsto, será superior a 7 minutos.

Assinale a opção correta.
Assinale a opção que apresenta corretamente a tarefa de mineração de dados adequada a ser utilizada caso um banco deseje prever, a partir de variáveis como renda, idade e histórico de pagamentos, o valor do limite de crédito que deve conceder a um cliente.
Em relação à Análise da Variância (ANOVA), as afirmativas a seguir estão corretas, à exceção de uma.
Assinale-a.
Um analista financeiro tenta prever a rentabilidade anual futura de um ativo, em termos reais. Ele considera que a rentabilidade real (em %) siga, ao longo dos anos, um modelo AR(1): yt =Φ0 +Φ1 yt-1 +εt, em que t é o ano, E(εt) = 0 e corr(εt,εt-s) = 0, para s = 1, 2, ... . Sabe-se que a rentabilidade real prevista pelo modelo para o longuíssimo prazo foi de 4% ao ano.
Se a estimativa obtida para o parâmetroΦ1 foi 0,8, a estimativa do parâmetroΦ0 foi:

Considerando a relevância da bioestatística para a saúde animal, julgue o item seguinte.

A regressão estatística não é adequada para a quantificação das associações entre um fator de interesse (variável dependente) e fatores explicativos (variáveis independentes).

Considere que um professor de estatística deseja avaliar se a nota obtida pelos alunos pode ser descrita em função do tempo de estudo deles. Para isso, decidiu realizar o ajuste de um modelo de regressão linear e organizou os dados das notas dos alunos e do tempo de estudo em dois objetos no ambiente R, nomeados como “nota” e “tempo”, ambos na mesma ordem de entrada. A sequência de comandos que realiza o ajuste de um modelo de regressão linear e apresenta o intervalo de confiança (95%) para os coeficientes de regressão é:
Texto 17A3


Conforme a literatura básica de estatística, o coeficiente de correlação linear r é adimensional e pode variar de −1 a 1, ou seja −1 ≤ r≤ 1.
Considerando as informações do texto 17A3, julgue os itens a seguir.

I Se o valor de r estiver próximo de +1, a reta será crescente e representará a correlação entre os valores das variáveis, com uma mínima dispersão entre os pontos obtidos pelas variáveis e os pontos da reta.
II Para duas variáveis, X e Y, se o coeficiente de correlação for, aproximadamente, r = 0,9813, então 96,29% das variações totais serão explicadas pela reta de regressão Y = a + bX.
III Caso o coeficiente de correlação seja r = −1, a reta ajustada explicará toda a variação de Y e, por consequência, o ajuste linear será excelente.

Assinale a opção correta.
Um modelo de regressão linear simples (Yi = a + b Xi + ei, sendo i = 1, 2, ...,33) foi ajustado a uma amostra aleatória de uma determinada população, onde se obteve as seguintes informações referentes à análise de variância desse modelo: (i) a soma de quadrados referente a regressão foi igual a 3390; e (ii) a soma de quadrados totais foi igual a 3713. A estimativa não viciada para a variância populacional e a interpretação do coeficiente de determinação desse modelo são, respectivamente:
Em um experimento agrícola, um pesquisador deseja comparar 6 tratamentos para avaliar sua influência na produtividade de milho. Devido à limitação da área, não foi possível alocar todos os tratamentos em todos os blocos. Assim, adotou-se um delineamento em blocos incompletos balanceados, com 6 tratamentos, 10 blocos, 3 tratamentos por blocos e 5 repetições por tratamento.

Com base nas propriedades e na análise de variância associada a esse delineamento, assinale a alternativa correta.
Página 1