A metrologia abrange todos os aspectos teóricos e práticos relativos às medições, qualquer que seja a incerteza em qualquer campo da ciência ou da tecnologia. Analisando a estatística como instrumento de uso da metrologia, é INCORRETO afirmar que:
Em uma escola que atende alunos de primeira a quinta série, existem duas turmas de cada série. A diretora dessa escola pretende fazer um estudo quanto à aprendizagem comparando as turmas dentro de cada série. Quais medidas estatísticas descritivas ela pode utilizar para avaliar a homogeneidade das turmas e a diferença de aprendizagem entre as turmas?
Sobre avaliação de resultados de classificação, relacione os termos elencados a seguir, às respectivas definições.
1. Acurácia Global 2. Matriz de confusão 3. Acurácia do produtor 4. Acurácia do usuário
( ) Relacionada aos erros de comissão, indica a proporção de amostras classificadas corretamente para uma determinada classe em relação ao número total de amostras classificadas como sendo dessa classe. ( ) Índice que representa uma avaliação geral do desempenho de um modelo de classificação. ( ) Tabela específica que tem como intuito permitir a visualização do desempenho do modelo de classificação. ( ) Relacionada aos erros de omissão, representa a proporção de amostras classificadas corretamente para uma determinada classe em relação ao número total de amostras de referência pertencentes a essa classe.
Assinale a opção que apresenta a relação correta, na ordem apresentada.
A respeito das métricas que podem ser calculadas a partir da Matriz de Confusão, considere a seguinte expressão:
“Indica a proporção de verdadeiros positivos em relação ao total de amostras positivas da referência.”
Assinale a opção que indica o termo corretamente definido pela expressão.
A respeito das regras de associação e da análise de agrupamentos na exploração de dados, julgue o item subsequente.

O algoritmo k-means é um método de clusterização do tipo particional que requer a definição prévia do número de clusters e utiliza a média dos elementos como critério para a atualização dos centroides.

A lógica fuzzy é uma extensão da lógica booleana. Embora as técnicas de controle possam ser implementadas por modelos matemáticos, as implementações baseadas na lógica fuzzy apresentam um melhor desempenho.

Qual é o aspecto fundamental da lógica fuzzy?

Marcos pretende determinar a mediana referente aos dados brutos coletados e relacionados abaixo:

23 - 22 - 21 - 22 - 32 - 33

41 - 21 - 20 - 32 - 42 - 38

De acordo com os dados, o resultado encontrado por Marcos é igual a:

Texto 17A3


Conforme a literatura básica de estatística, o coeficiente de correlação linear r é adimensional e pode variar de −1 a 1, ou seja −1 ≤ r≤ 1.
Considerando as informações do texto 17A3, julgue os itens a seguir.

I Se o valor de r estiver próximo de +1, a reta será crescente e representará a correlação entre os valores das variáveis, com uma mínima dispersão entre os pontos obtidos pelas variáveis e os pontos da reta.
II Para duas variáveis, X e Y, se o coeficiente de correlação for, aproximadamente, r = 0,9813, então 96,29% das variações totais serão explicadas pela reta de regressão Y = a + bX.
III Caso o coeficiente de correlação seja r = −1, a reta ajustada explicará toda a variação de Y e, por consequência, o ajuste linear será excelente.

Assinale a opção correta.
Um modelo de regressão linear simples (Yi = a + b Xi + ei, sendo i = 1, 2, ...,33) foi ajustado a uma amostra aleatória de uma determinada população, onde se obteve as seguintes informações referentes à análise de variância desse modelo: (i) a soma de quadrados referente a regressão foi igual a 3390; e (ii) a soma de quadrados totais foi igual a 3713. A estimativa não viciada para a variância populacional e a interpretação do coeficiente de determinação desse modelo são, respectivamente:
Suponha que uma amostra aleatória simples de tamanho n de uma distribuição normal com média μ e variânciaσ2 será obtida. Sejame s a média amostral e o desvio padrão amostral usuais. Se z denota o 97,5% percentil da distribuição normal padrão, então o intervalo de 95% de confiança usual para μ será dado por
Uma das etapas essenciais do tratamento e processamento de dados, em especial para estatística e para o aprendizado de máquina, consiste em sua organização e identificação. Uma maneira de organizar os dados de um conjunto consiste em classificá-los.
Relacione cada uma das variáveis a seguir, constantes de um conjunto de dados sobre um grupo de pessoas, com a classificação a ela mais adequada.

1. Grau de instrução (ex.: superior)
2. Número de filhos
3. Estado de Procedência (ex.: Minas Gerais)
4. Massa corporal


( ) Quantitativa Contínua ( ) Quantitativa Discreta ( ) Qualitativa Nominal ( ) Qualitativa Ordinal


A relação correta, na ordem apresentada, é
Durante muitos anos o coeficiente kappa que, originalmente, foi desenvolvido para comparação entre classificações feitas por dois especialistas diferentes, vem sendo utilizado na avaliação de resultados de mapeamentos temáticos resultantes de classificações digitais.
Sobre aspectos envolvendo o coeficiente kappa, analise as afirmativas a seguir.
I. O kappa tem características similares ao cálculo da acurácia global, sobretudo por ignorar os valores que estão dispostos fora da diagonal principal da matriz de confusão. II. O kappa faz uma comparação entre a concordância da classificação observada e a concordância esperada ao acaso. Se a concordância esperada ao acaso for alta, mesmo um modelo de classificação mediano pode ter um valor de kappa alto, causando conclusão enganosa sobre seu real desempenho. III. O kappa não leva em conta se algumas classes são muito mais comuns do que outras. Isso significa que ele pode não refletir com precisão o quão bem a classificação se saiu nas classes menos frequentes.
Está correto o que se afirma em
Realizado um estudo com 64 pesquisadores, verificou-se que o tempo médio para preencher um formulário é de 70 horas. Sabe-se que o desvio padrão é igual a σ = 4 h, então o intervalo de confiança com 90% de confiança desse estudo é: Utilize Zα/2

Texto CG1A8

Em concorrência a uma vaga de emprego, foi realizada uma avaliação com dez candidatos, cujas notas variaram entre 0 e 10, tendo dois ficado com nota 4, sete obtido nota 6 e um conquistado nota 9.

Com base no texto CG1A8, é correto afirmar, quanto às medidas de posição obtidas a partir do conjunto de dados decorrente da referida avaliação, que
Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores
xA = [2, −2, 0, 1,] e xB = [−4, 0, 2, −4].
Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente:
Com relação ao Modelo Linear Generalizado (MLG) afirma-se:

I - Uma variável aleatória com distribuição uniforme pode ser variável resposta do MLG.
II - A função de verossimilhança é um critério muito utilizado para verificar o ajuste do MLG.
III - A componente sistêmica do MLG é caracterizada pelas variáveis explanatórias.

É correto apenas o que se afirma em
Sejam X e Y variáveis aleatórias com distribuição binomial com parâmetros dados, respectivamente, por (n = 2, p) e (n = 4, p). Se P ( X = 1) = 4/9, então P (1 ≤ Y ≤ 3) é igual a:
Existem dois métodos básicos para simulação de variáveis aleatórias discretas e contínuas, são eles:
Sejam dois eventos quaisquer A e B, os quais não são mutuamente excludentes. Sabe-se que a probabilidade do evento A ocorrer é 0,20 e que a probabilidade do evento B ocorrer é 0,30.

Dessa forma, é correto afirmar que, se a probabilidade de A
Página 13