Dentre os critérios que podem auxiliar na escolha do número de fatores do modelo fatorial, analise os seguintes:

I - Raiz latente ou critério de Kaiser

II - Gráfico scree

III - Percentagem da variância

IV - Rotação de fatores

Auxilia(m) na escolha do número de fatores do modelo fatorial o(s) critério(s)

Considere as seguintes afirmações:

I. Na análise de componentes principais a informação contida em um vetor aleatório p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.

II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.

III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.

Dentre as afirmações acima são verdadeiras APENAS

Com relação ao software R, julgue os itens que se seguem.

A instrução paste(c(“X”, “Y”), 1:9, sep=””) permite gerar a sequência [“X1”, “X2”, “X3”, “X4”, “X5”, “X6”, “X7”, “X8”, “X9”, “Y1”, “Y2”, “Y3”, “Y4”, “Y5”, “Y6”, “Y7”, “Y8”, “Y9”].

As entrevistas com os habitantes para o censo demográfico de certo país duraram 5 dias e mostraram a existência de 144.427.331 habitantes. Pode-se afirmar com certeza que este número:

Um fabricante deseja fazer um estudo, com uma confiança de 95%, a respeito da aceitação de um dos seus produtos com a finalidade de lançá-lo em um novo mercado. Esse novo lançamento somente será comercialmente viável se o índice de aceitação do produto for, pelo menos, de 90%. Para tal, realizou uma pesquisa de mercado em uma das cidades onde seu produto já é comercializado. Foi perguntado aos consumidores se gostaram (aceitaram) do produto. O resultado foi o seguinte: 850 consumidores responderam que gostaram do produto e 150 consumidores responderam que não gostaram do produto. Qual será a estatística de teste a ser utilizada nesse teste?

Julgue os itens a seguir, acerca de noções e conceitos de estatística e de tratamento de dados estatísticos.

Verificou-se que, depois de tabular os dados de um experimento, houve necessidade de estabilizar a variância, porque a variância do tratamento na escala original variou diretamente com a média. Nesse caso, deve-se considerar uma transformação logarítmica dos dados.

Ensaios em laboratório, tendo probabilidade ? (desconhecida) de sucesso em cada tentativa, são realizados sucessiva e independentemente até a ocorrência do primeiro sucesso. Para cada realização experimental, seja X a variável aleatória que representa o número de ensaios realizados até a ocorrência do primeiro sucesso.

Se quatro realizações são feitas em laboratório, obtendo-se a amostra {3, 3, 4, 5}, o estimador de máxima verossimilhança para ?, à luz dessa amostra, é dado por

Os estimadores não viesados E1, E2 e E3, dados abaixo, são utilizados para obtenção da média ? diferente de zero de uma população normal com variância unitária. Considere que (X, Y, Z) é uma amostra aleatória, com reposição, de tamanho 3 desta população, com m, n e p sendo parâmetros reais.

E1 = mX + nY + pZ

E2 = 2mX + 2nY + pZ

E3 = mX + 2nY + 2pZ

A soma das variâncias de E1, E2 e E3 é igual a

Com relação a data mining (mineração de dados), julgue os próximos itens.

Em modelos de classificação, ocorre overfitting quando o número de erros cometidos no grupo de dados usado para treinar (ajustar) o modelo é muito pequeno e o número de erros de generalização é grande.

      Uma população de plantas contém 3 diferentes genótipos: A, B e C, com as respectivas proporções: 21 , 22 e 23 . Em um estudo em que 100 plantas dessa população foram registradas no cerrado, observou-se o número de plantas associadas a cada genótipo: 32, 57 e 11. De acordo com a literatura científica da área, as proporções esperadas são iguais a 30%, 50% e 20%.

Considerando essas informações, julgue os itens que se seguem.

A estatística do teste de aderência apresenta valor inferior a 10.

Considere uma amostra aleatória (X, Y, Z), com reposição, extraída de uma população normal com média ? e variância 1. Considere também os 3 estimadores não viesados de ? , com m, n e p sendo parâmetros reais:

E1 = mX - 2nY - pZ

E2 = 2mX + nY - 4pZ

E3 = mX - 8nY + pZ

Entre os 3 estimadores, o mais eficiente apresenta uma variância igual a

Com relação a acurácia e precisão, é correto afirmar que o estimador ENVUMV (estimador não viciado uniformemente de mínima variância)

Considerando os níveis de mensuração das variáveis e o tratamento estatístico adequado para comparação, assinale a alternativa correta.

Um analista de comercialização e logística, ao se deparar com um problema de estatística descritiva, sabe de antemão que o(s) valor (es)

A ideia de risco, especificamente, está diretamente associada às probabilidades de ocorrência de determinados resultados em relação a um valor médio esperado. É um conceito voltado para o futuro, revelando uma possibilidade de perda.

A medida estatística que representa o risco, utilizada na maioria das vezes no mercado financeiro, é o(a)

Julgue os itens que se seguem, acerca de análise exploratória de dados, análise de dados discretos, análise de regressão e inferência estatística.

Considere duas variáveis X e Y com correlação linear de Pearson igual a 0,75. Nesse caso, somente se a variância de Y for superior ao dobro da variância de X, a variável Y tenderá a crescer pelo menos 1,5 unidades para cada unidade que aumentar a variável X.

Página 2