Uma empresa multinacional está desenvolvendo uma plataforma
avançada de Business Intelligence (BI) para integrar e analisar
dados provenientes de diversas unidades de negócio ao redor do
mundo. As fontes de dados incluem:
Sistemas transacionais estruturados: bancos de dados relacionais
de ERP e CRM que armazenam informações sobre vendas, clientes
e operações internas.
Dados semiestruturados: arquivos XML e JSON contendo registros
de transações online e interações de usuários em aplicativos
móveis.
Dados não estruturados: logs de servidores web, postagens em
redes sociais, emails de suporte ao cliente dados de sensores IoT.
A empresa planeja implementar um Data Warehouse com um
modelo multidimensional otimizado para permitir análises
complexas e operações de OLAP que suportem a tomada de
decisões estratégicas.
Durante o projeto, a equipe enfrenta os seguintes desafios:
Integração de dados heterogêneos: unificar dados estruturados,
semiestruturados e não estruturados em um ambiente coeso.
Modelagem e otimização: desenvolver um modelo
multidimensional que atenda às necessidades analíticas
complexas, mantendo o desempenho.
Definição de hierarquias e granularidades: estabelecer níveis
adequados de detalhe para suportar operações de OLAP como
drill-down e roll-up.
Com base nesse cenário, avalie as afirmativas a seguir:
I. Para mapear as fontes de dados heterogêneas, é essencial
utilizar metadados padronizados que descrevam a estrutura, o
significado e a qualidade dos dados, facilitando sua integração
no Data Warehouse.
II. Na modelagem multidimensional, a adoção de um esquema
em floco de neve (snowflake schema), com tabelas de
dimensões normalizadas, melhora o desempenho das
consultas OLAP em comparação com o esquema estrela (star
schema).
III. As operações de OLAP permitem análises em múltiplas
dimensões; por exemplo, o slice fixa um valor em uma
dimensão, enquanto o dice cria um subcubo selecionando
valores específicos em múltiplas dimensões.
IV. A implementação de uma política de governança de dados
clara e abrangente é fundamental para garantir a qualidade,
consistência, segurança e privacidade dos dados ao longo de
todo o ciclo de vida do projeto de BI.
Está correto o que se afirma em
✂️ a) I, II, apenas. ✂️ b) I, III, apenas. ✂️ c) II e III, apenas. ✂️ d) II, III e IV, apenas. ✂️ e) III e IV, apenas.