Uma organização de notícias online quer melhorar sua capacidade de categorizar automaticamente artigos em tópicos relevantes, utilizando uma vasta quantidade de conteúdo textual não estruturado. Qual abordagem seria mais eficaz para organizar automaticamente esses dados e facilitar a busca e recuperação de informações específicas?