Com relação a data mining (mineração de dados), julgue os próximos itens.
Na análise de cluster, K-médias é uma técnica de clusterização hierárquica (aninhada), que visa encontrar o número de clusters (K) especificados pelo usuário, representados por seus centróides.
Com relação a data mining (mineração de dados), julgue os próximos itens.
Em modelos de classificação, ocorre overfitting quando o número de erros cometidos no grupo de dados usado para treinar (ajustar) o modelo é muito pequeno e o número de erros de generalização é grande.
Julgue os itens a seguir, acerca de noções e conceitos de estatística e de tratamento de dados estatísticos.
Verificou-se que, depois de tabular os dados de um experimento, houve necessidade de estabilizar a variância, porque a variância do tratamento na escala original variou diretamente com a média. Nesse caso, deve-se considerar uma transformação logarítmica dos dados.
Julgue os itens a seguir, acerca de noções e conceitos de estatística e de tratamento de dados estatísticos.
Considere que, na pesagem de 30 peixes, obteve-se a média de 30 g e desvio-padrão igual a 2 g. Depois de completar a pesagem, verificou-se que a balança estava descalibrada e que os pesos obtidos estavam 2 g abaixo do peso real. Nessa situação, é correto afirmar que o erro relativo dos dados deve diminuir após a correção dos dados.