Acerca dos algoritmos de mineração de dados, analise as
afirmativas a seguir, e assinale (V) para a verdadeira e (F) para a
falsa.
( ) Uma árvore de decisão é um grafo cíclico direcionado em que
cada nó é um nó de divisão.
( ) Em uma rede neural artificial multicamadas os neurônios estão
conectados a todos os neurônios da camada anterior.
( ) As máquinas de vetores de suporte (SVM - Support Vector
Machine) são aplicadas em problemas de classificação nos
quais busca-se dividir os dados por meio de um hiperplano.
Sobre algoritmos de mineração de dados, avalie as afirmativas a
seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) K-means, também conhecido como K-NN, é um algoritmo
baseado na ideia de que objetos semelhantes estão próximos
uns dos outros.
( )Árvore de decisão é uma estrutura hierárquica constituída por
nós. Nela, o coeficiente de Gini de um nó é sempre maior do
que o do seu nó pai.
( ) O algoritmo SVM, utilizado apenas para a tarefa de
classificação, emprega classificadores lineares que separam o
conjunto de dados por meio de hiperplanos, não sendo
possível seu uso com problemas não linearmente separáveis.
Acerca de deep learning, de Big Data e de redes neurais, julgue o item subsequente.
O overfitting, em modelos de deep learning, ocorre quando o
modelo tem alta precisão tanto nos dados de treinamento
quanto nos dados de teste, indicativo de que o modelo
generaliza bem.
A Mineração de Dados é a etapa do processo de KDD (Knowledge
Discovery in Databases) responsável por extrair modelos de
conhecimento a partir dos dados disponíveis. Após a construção
desses modelos, é fundamental avaliar sua qualidade, o que exige
compará-los com dados específicos para mensurar métricas que
reflitam seu desempenho. Para garantir uma avaliação imparcial,
os dados utilizados na criação do modelo não devem ser os
mesmos empregados em sua validação. Assim, o processo de KDD
deve utilizar, no mínimo, dois conjuntos distintos de dados: um
conjunto de treinamento, para gerar o modelo, e um conjunto de
testes, para avaliá-lo.
Selecione a opção que identifica o método de particionamento de
dados em que o “conjunto de treinamento” é gerado por N
sorteios aleatórios com reposição a partir do conjunto de dados
original (que contém N registros). Já o “conjunto de testes” é
composto pelos registros não selecionados para o “conjunto de
treinamento”.
Acerca de deep learning, de Big Data e de redes neurais, julgue o item subsequente.
No contexto do deep learning, a função das camadas ocultas
(hidden layers) em uma rede neural profunda é extrair e
processar os dados de forma que a rede aprenda
características progressivamente mais complexas nas
camadas mais profundas.