Um conjunto de dados numéricos com significativa diversidade foi apresentado à equipe de análise de dados de uma empresa. Como parte do processo decisório, os analistas necessitavam transformar um dos atributos numéricos em faixas
de valores, a fim de permitir classificá-los em um universo de possibilidades. Para isso, decidiram, na etapa de enriquecimento de dados, criar um atributo, derivado do atributo numérico supracitado, em um processo de transformação de dados
conhecido por discretização.
Uma das características das técnicas de discretização é que
a) a discretização por binning é uma técnica de divisão bottom-up que considera um número específico de categorias
(bins).
b) a discretização por entropia minimiza a descrição total dos dados, balanceando entre o número de bins e a qualidade
da discretização.
c) a discretização por histogramas é uma técnica não supervisionada, pois a formação dos bins não considera informações de classes ou rótulos.
d) cada bin, no método de binning de largura igual, contém aproximadamente o mesmo número de amostras de dados.
e) uma limitação da discretização por histogramas multidimensionais é a inviabilidade de captura de dependência entre
atributos.