Questões de Concursos Conhecimentos de Estatística

Resolva questões de Conhecimentos de Estatística comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática.

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.

1Q1053709 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Controle da Qualidade 3, HEMOBRÁS, Consulplan, 2025

Na análise do impacto da temperatura, no tempo de estabilidade de um hemoderivado, foi ajustado um modelo de regressão linear simples. O coeficiente de determinação obtido foi R² = 0,87. É correto afirmar que esse valor representa:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

2Q1052233 | Estatística, Conhecimentos de Estatística, Analista Administrativo de Assuntos Corporativos Planejamento Estratégico, HEMOBRÁS, Consulplan, 2025

Considere o caso mais simples de uma variável independente e de uma variável dependente, em que a forma de relação entre ambas é linear: Y = α + βX + ε. Nesse caso, Xé usado para representar a variável independente e Y é usado para representar a variável dependente. Salienta-se que as letras maiúsculas X e Y representam a designação das variáveis aleatórias, já as minúsculas, valores específicos das variáveis aleatórias. Por sua vez, “ε” é um termo de distúrbio ou erro estocástico com média zero. Considerando essas informações e conhecimentos adicionais sobre análise de regressão linear simples, analise as afirmativas a seguir.

I. O valor da variável dependente Y é considerado como o de uma variável aleatória, que depende de valores fixos (não aleatórios) da variável independente X.
II. Uma relação teórica em linha reta existe entre Y e o valor esperado de X para cada um dos valores possíveis de X. Essa linha de regressão teórica: E (Y ̸X) = α + βX possui uma inclinação α e uma interseção β. Os coeficientes de regressão α e β constituem parâmetros de população, cujos valores são desconhecidos e se deseja estimá-los.
III. Associada a cada valor de X, existe uma distribuição de probabilidade p(y ̸x) dos valores possíveis da variável aleatória Y. Quando X for igual a um valor xi, o valor de Y observado será obtido da distribuição de probabilidade p(y ̸xi) e não estará necessariamente na linha de regressão teórica.

Quanto às premissas subjacentes ao modelo de regressão linear simples, está correto o que se afirma apenas em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

3Q1017057 | Estatística, Conhecimentos de Estatística, Pesquisador Área Gestão da Informação Subárea Engenharia de Dados, EMBRAPA, CESPE CEBRASPE, 2025

Texto associado.

Um pesquisador está desenvolvendo um modelo estatístico para descrever a ocorrência de falhas em sensores em uma rede de equipamentos agrícolas. Com base em dados históricos, que incluem registros de falhas e fatores associados, tais como temperatura, umidade e frequência de transmissão dos sensores, o pesquisador obteve as seguintes informações:


• a probabilidade de um sensor falhar (F) em condições de alta umidade (U) é P(F | U) = 0,4;

• a incidência de eventos de alta umidade é dada pela probabilidade P(U) = 0,3;

• a probabilidade de um sensor falhar em condições de alta temperatura (T) é P(F | T) = 0,2;

• a incidência de falhas é P(F) = 0,2.

Com respeito a essa situação hipotética, e tendo em conta ainda que 0 <P(T) < 1, julgue o item subsequente.

Os eventosFeTsão independentes.

  1. ✂️
  2. ✂️

4Q1052135 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Controle da Qualidade 3, HEMOBRÁS, Consulplan, 2025

Durante uma capacitação interna de uma empresa da área farmacêutica, foi proposto um exercício para avaliar o desempenho de dois grupos de colaboradores em um certo treinamento. Os dados de desempenho foram os seguintes:

Grupo A: Média das notas = 7,5; Desvio-padrão das notas = 1,2; Número de participantes = 20;
Grupo B: Média das notas = 8,0; Desvio-padrão das notas = 1,0; Número de participantes = 30.

Com base nesses dados, analise as afirmativas a seguir.

I. O Grupo B apresenta maior coeficiente de variação das notas em relação ao Grupo A.
II. A média ponderada, com relação ao número de participantes das notas dos dois grupos, é maior que 7,75.
III. A variância das notas do Grupo A é igual a 1,44.
IV. O Grupo A possui maior concentração de notas em torno da média do que o Grupo B.

Está correto o que se afirma apenas em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

5Q1052136 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Controle da Qualidade 3, HEMOBRÁS, Consulplan, 2025

Um pesquisador de uma empresa de hemoderivados e biotecnologia está monitorando a produção semanal de frascos de um hemoderivado durante 8 semanas consecutivas. Sabe-se que ele registrou as seguintes produções (em unidades): 120, 135, 128, 140, 132, 150, 145 e 130. Com base nesses dados, pode-se afirmar que a mediana da produção semanal é:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

6Q1035752 | Estatística, Conhecimentos de Estatística, Contas Públicas, TCE PE, FGV, 2025

Em um estudo técnico baseado em um grande conjunto de dados, foram empregadas técnicas de aprendizado de máquina e análise estatística para identificar padrões e outras informações. Entretanto, os resultados foram questionados, pois, embora tenha sido demonstrada existência de correlação, não foi estabelecida relação de causalidade.
Considerando as melhores práticas e os desafios da mineração de dados, analise as afirmativas a seguir.

I. Foram gerados insights a partir de dados válidos e confiáveis.
II. A equipe executora contava com especialistas com experiência em programação Python, R e SQL.
III. A metodologia empregada atendeu a literatura e outros estudos técnicos semelhantes, descrevendo que foi selecionada apenas uma base de informações de dados não estruturados atualizada para realizar o processamento, em virtude de limitações de capacidade computacional, dos custos envolvidos e dos testes que demonstraram a introdução de incerteza ao se realizar uma coleta ampla e profunda de conjuntos de dados.

Está correto o que se afirma em:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

7Q1052138 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Controle da Qualidade 3, HEMOBRÁS, Consulplan, 2025

Uma indústria farmacêutica realiza o controle de qualidade em lotes de medicamentos recém-produzidos. Para verificar se um determinado lote atende aos padrões estabelecidos, é necessário selecionar uma amostra de comprimidos para análise. O responsável pelo controle de qualidade decide adotar um plano amostral baseado nos procedimentos descritos a seguir.

• O lote é dividido em 20 caixas de medicamento, cada uma contendo 100 comprimidos;
• São sorteadas aleatoriamente 5 caixas, e todos os comprimidos dessas caixas são analisados.

Com base nesses procedimentos, o método utilizado é o de amostragem:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

8Q1052139 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Controle da Qualidade 3, HEMOBRÁS, Consulplan, 2025

Uma auditoria foi realizada pela Hemobrás para verificar a qualidade do plasma sanguíneo armazenado em diferentes regiões do Brasil. O estoque contém um total de 12.000 bolsas de plasma distribuídas em três centros regionais conforme os percentuais a seguir:

• Norte: 35% das bolsas;
• Nordeste: 50% das bolsas;
• Centro-Oeste: 15% das bolsas.

Para garantir representatividade quanto aos centros regionais, decidiu-se realizar uma amostragem estratificada proporcional. O tamanho da amostra será correspondente a 2% do total de bolsas de plasma. Com bases nessas informações, quantas bolsas de plasma deverão ser selecionadas de cada centro regional?
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

9Q1052157 | Estatística, Conhecimentos de Estatística, Analista Industrial de Hemoderivados e Biotecnologia Planejamento e Controle de Produção, HEMOBRÁS, Consulplan, 2025

As ferramentas estatísticas são essenciais para o controle da produção, permitindo monitorar e melhorar processos industriais por meio da coleta, análise e interpretação de dados. Técnicas como gráficos de controle, análise de variabilidade e métodos de amostragem ajudam a identificar desvios, prevenir defeitos e garantir a qualidade do produto final, além de contribuir para a redução de custos e aumento da eficiência. Acerca das ferramentas estatísticas, relacione adequadamente as colunas a seguir.

1.Gráfico de controle.
2.Histograma.
3.Diagrama de causa e efeito.
4. Amostragem estatística.
5. Capacidade do processo (Índice Cp).

( ) Ferramenta utilizada para identificar causas potenciais de problemas em um processo.
( ) Método que mede a capacidade de um processo em produzir dentro de limites especificados.
( ) Representação gráfica que ilustra a distribuição de frequências de um conjunto de dados.
( ) Técnica que permite monitorar a estabilidade de um processo ao longo do tempo.
( ) Método para coletar dados representativos de um processo ou lote, reduzindo custos de inspeção.

A sequência está correta em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

10Q1044548 | Estatística, Conhecimentos de Estatística, Bioenergia, EPE, FGV, 2024

Osoutlierssão dados que se diferenciam drasticamente de todos os outros. Em outras palavras, umoutliersé um valor que foge da normalidade e que pode causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise Sobre o tema, analise as afirmativas a seguir.

I. Uma das melhores formas de identificar dadosoutliersé utilizando gráficos, porque, ao plotar um gráfico, o analista consegue claramente perceber que existe algo diferente.

II. A maneira mais complexa, mas bastante precisa, de encontraroutliersem uma análise de dados, é encontrar a distribuição estatística que mais se aproxima à distribuição dos dados e utilizar métodos estatísticos para detectar os pontos discrepantes.

III. Os outliers podem ser excluídos do gráfico, uma vez que as estratégias de tratamento deoutliersnão têm impacto direto em negócios e aumentam o tempo e os custos do trabalho ou projeto.


Está correto o que se afirma em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

11Q1066380 | Estatística, Conhecimentos de Estatística, tarde, CNU, CESGRANRIO, 2024

Uma equipe de pesquisadores em políticas públicas de saúde laboral deseja estimar a proporção de indivíduos de determinada população que estão sofrendo de problemas relacionados a burnout. A estimação será feita utilizando técnicas de Inferência Estatística.
A equipe tem acesso a qualquer indivíduo dessa população, mas tem capacidade para coletar os dados de apenas uma parcela irrisória da população como um todo. A composição e as características gerais dessa população são totalmente desconhecidas.
Diante desse cenário, a equipe de pesquisa deve fazer sua coleta de dados mediante um processo de amostragem
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

12Q1047742 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

13Q1047743 | Estatística, Conhecimentos de Estatística, Tecnologia da Informação Ciência de Dados, EPE, FGV, 2024

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

14Q1063892 | Estatística, Conhecimentos de Estatística, Análise e Desenvolvimento de Produtos de Sensoriamento Remoto para o Monitoramento das Mudanças da Cobertura e Uso da Terra, INPE, FGV, 2024

Sobre avaliação de resultados de classificação, relacione os termos elencados a seguir, às respectivas definições.
1. Acurácia Global 2. Matriz de confusão 3. Acurácia do produtor 4. Acurácia do usuário
( ) Relacionada aos erros de comissão, indica a proporção de amostras classificadas corretamente para uma determinada classe em relação ao número total de amostras classificadas como sendo dessa classe. ( ) Índice que representa uma avaliação geral do desempenho de um modelo de classificação. ( ) Tabela específica que tem como intuito permitir a visualização do desempenho do modelo de classificação. ( ) Relacionada aos erros de omissão, representa a proporção de amostras classificadas corretamente para uma determinada classe em relação ao número total de amostras de referência pertencentes a essa classe.
Assinale a opção que apresenta a relação correta, na ordem apresentada.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

15Q1063893 | Estatística, Conhecimentos de Estatística, Análise e Desenvolvimento de Produtos de Sensoriamento Remoto para o Monitoramento das Mudanças da Cobertura e Uso da Terra, INPE, FGV, 2024

A respeito das métricas que podem ser calculadas a partir da Matriz de Confusão, considere a seguinte expressão:
“Indica a proporção de verdadeiros positivos em relação ao total de amostras positivas da referência.”
Assinale a opção que indica o termo corretamente definido pela expressão.
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

16Q1063894 | Estatística, Conhecimentos de Estatística, Análise e Desenvolvimento de Produtos de Sensoriamento Remoto para o Monitoramento das Mudanças da Cobertura e Uso da Terra, INPE, FGV, 2024

Durante muitos anos o coeficiente kappa que, originalmente, foi desenvolvido para comparação entre classificações feitas por dois especialistas diferentes, vem sendo utilizado na avaliação de resultados de mapeamentos temáticos resultantes de classificações digitais.
Sobre aspectos envolvendo o coeficiente kappa, analise as afirmativas a seguir.
I. O kappa tem características similares ao cálculo da acurácia global, sobretudo por ignorar os valores que estão dispostos fora da diagonal principal da matriz de confusão. II. O kappa faz uma comparação entre a concordância da classificação observada e a concordância esperada ao acaso. Se a concordância esperada ao acaso for alta, mesmo um modelo de classificação mediano pode ter um valor de kappa alto, causando conclusão enganosa sobre seu real desempenho. III. O kappa não leva em conta se algumas classes são muito mais comuns do que outras. Isso significa que ele pode não refletir com precisão o quão bem a classificação se saiu nas classes menos frequentes.
Está correto o que se afirma em
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

17Q832042 | Probabilidade e Estatística, Conhecimentos de estatística, Estatístico, CRM MG, Gestão de Concursos, 2021

Considere que um estudo foi realizado com o objetivo de avaliar se a variável dependente (Y) está relacionada linearmente com a variável independente (X).A partir dos dados de uma amostra de 10 pares de medidas (xi, yi) com i = 1, 2, ..., 10, foi obtido o coeficiente de correlação de Pearson r = 0,9.
Levando em consideração o texto anterior e sabendo que V = 3X + 5 e W = cY + d, onde c e d são números reais positivos, analise as afirmativas a seguir.
I. O modelo de regressão ajustado Y = a.bX explica aproximadamente 90% da variação total em Y. II. O coeficiente de correlação de Pearson entre X e V é 1. III. O coeficiente de correlação de Pearson entre X e W é 0,9c + d. IV. O coeficiente de correlação de Pearson entre V e W é 0,9.
Está(ão) correta(s) a(s) afirmativa(s)
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

18Q832304 | Probabilidade e Estatística, Conhecimentos de estatística, Estatístico, CRM MG, Gestão de Concursos, 2021

Considere que um investigador está interessado na relação entre o consumo de peixe e a incidência de doenças coronarianas. Na linha de base do estudo, foram obtidos dois grupos de pacientes com características similares, com um grupo tendo alto consumo de peixe e o outro grupo baixo consumo de peixe. Esses grupos foram acompanhados durante um período para avaliar se aqueles que consomem mais peixe têm menor número de doenças coronarianas.
O delineamento usado nesse estudo foi
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

19Q832314 | Probabilidade e Estatística, Conhecimentos de estatística, Estatístico, CRM MG, Gestão de Concursos, 2021

A testagem em pool é uma técnica em que amostras de diferentes pessoas são misturadas e testadas como se fossem uma só para detectar determinada doença. Se o teste der negativo, significa que nenhuma das pessoas está doente, sendo desnecessário testar todas elas. Se o resultado der positivo, significa que uma ou mais pessoas estão infectadas, então, neste caso, o teste deve ser repetido em cada uma das pessoas individualmente, para identificar quem está infectado.
Supondo que a testagem pool foi realizada com um grupo de quatro pessoas para identificar certa doença, que tem uma prevalência de 10% na população, a probabilidade de que seja necessário testar cada uma das pessoas é
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️

20Q834885 | Probabilidade e Estatística, Conhecimentos de estatística, Estatístico, CRM MG, Gestão de Concursos, 2021

Considere que um estudo foi conduzido para investigar a associação de quedas entre idosos e uso do medicamento X. Foi selecionado um grupo com pessoas com mais de 60 anos de idade, internadas por fratura decorrente de queda em seis hospitais de um determinado município e, para efeito de comparação, foi selecionado um outro grupo de pacientes dos mesmos hospitais internados por outras causas. Os dados obtidos com o levantamento da história clínica de todos os pacientes selecionados sugerem um maior risco de quedas e fraturas entre os idosos que fazem uso do medicamento.
O delineamento usado nesse estudo foi
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.