No contexto de DW, é uma categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados. Trata-se de
Os dados transacionais de uma grande empresa estão dispostos em bases heterogêneas. Para que dados carregados no data warehouse sejam considerados adequados à formação de tabelas fato e dimensionais, a etapa de transformação pode realizar procedimentos de limpeza nesses dados.
Que problema NÃO é resolvido por esse tipo de procedimento?
Processo de extrair informação válida, a partir de grandes bases de dados, usando-as para efetuar decisões cruciais, explorando grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. O termo correspondente à definição acima, referente a banco de dados, é:
Uma funcionalidade típica em um sistema de Data Warehouse permite a visualização dos dados em várias dimensões diferentes.
Assinale a alternativa que apresenta a funcionalidade pré-programada que permite níveis diferentes de detalhe dos dados não revelados.
Data Warehouse e Data Mart podem ser definidos como bancos de dados
I. destinados a sistemas de apoio à decisão e cujos dados são armazenados em estruturas lógicas dimensionais.
II. de mesmo tipo, cuja diferença está no escopo e nos limites de suas abrangências.
III. de conteúdo exclusivo que não dependem dos dados operacionais e/ou transacionais.
Está correto o que consta em
Sejam as seguintes assertivas sobre esquemas multidimensionais para a modelagem de dados para Data Warehouses:
I. O esquema snowflake é uma variação do esquema estrela no qual as tabelas dimensionais de um esquema estrela são organizadas em uma lista de tabelas não normalizadas.
II. O esquema estrela consiste em uma tabela de fato com uma única tabela para cada dimensão.
III. O esquema onde um conjunto de tabelas de fatos compartilha algumas tabelas de dimensão é conhecido por hipercubo .
Marque a alternativa corretaemrelação às assertivas acima.
Um datawarehouse permite a geração de dados integrados e históricos, auxiliando a alta gerência a decidir com base em fatos, o que reduz a probabilidade de erros. Acerca desse tema, julgue os itens a seguir.
O datawarehouse não apenas deve ser temático, é preciso que os temas sejam tratados sob um número razoável de perspectivas (dimensões), gerando menos flexibilidade de análise, porém mais objetividade.
Considerando as terminologias, os conceitos, o projeto e os objetivos de um Data Warehouse é correto afirmar que um fato é tudo aquilo que pode ser representado por
A seguir são feitas algumas afirmações a respeito de data warehouses e ferramentas OLAP.
I - Os usuários finais do data warehouse, em geral, não possuem acesso à Data Staging Area.
II - Drill in, drill out, roll over e roll on são típicas operações disponibilizadas pelas ferramentas de consultas OLAP para navegar pela hierarquia de uma dimensão.
III - As rotinas de ETL muitas vezes originam solicitações de mudanças e melhorias nos sistemas OLTP e outras fontes de dados que alimentam o data warehouse, pois têm o potencial de revelar inconsistências entre os diversos sistemas corporativos.
IV- Um data warehouse, em geral, deve ser projetado para fazer junções entre fatos e dimensões através de chaves naturais, evitando chaves substitutas (surrogate keys), pois estas apenas contribuiriam para aumentar o tamanho e a complexidade do esquema sem nenhum benefício para o usuário final.
Estão corretas APENAS as afirmações
Ao construir um modelo de dados para um data warehouse de sua empresa, um desenvolvedor viu-se às voltas com três tabelas relacionais: venda, cliente e vendedor.
Ao fazer uma transformação para o modelo estrela, ele deve organizar:
No que concerne a tópicos avançados, julgue os itens subseqüentes.
Software de inteligência empresarial, como mineração de dados, CRM e datawharehouse, por exemplo, aplicam métodos de inteligência artificial e robótica avançados para a representação e extração da informação em grandes bases de dados.
Com relação à modelagem dimensional, julgue os itens que se seguem.
Snowflaking, uma técnica de modelagem dimensional utilizada para salvar espaço em disco, não é recomendada para ambientes de data warehouse, pois torna a sua apresentação mais complexa ao aumentar o número de tabelas no banco de dados.
No tocante aos datawarehouses, a característica desses armazéns de dados que está relacionada ao fato de que "uma vez inseridos, os dados não podem ser alterados, embora possam ser eliminados", é:
Técnicas de modelagem de Data Warehouses diferem das tradicionalmente utilizadas em sistemas transacionais. Analisando uma dessas abordagens, o modelo multidimensional estrela, verifica-se que
Analise as seguintes afirmações sobre conceitos de data warehouse.
I. Um data warehouse é um repositório com dados históricos de uma organização. De dados sobre transações financeiras até dados sobre funcionários; suas licenças e aumentos encontram-se neste grande repositório.
II. O principal objetivo de um data warehouse é prover dados para sistemas de apoio a decisão.
III. Um dos grandes problemas de data wharehouses é a necessidade de executar consultas altamente complexas, sem degradar o desempenho. Por isso, as informações armazenadas nos data warehouses são fortemente normalizadas.
Assinale a alternativa que contém a(s) afirmação(ões) CORRETA(S).
O agrupamento de diversas dimensões correspondentes a indicadores com baixa cardinalidade, gerando uma dimensão abstrata, de forma a retirar os indicadores da tabela fato, mas preservando a possibilidade de seu uso em consultas, constitui a
Nos sistemas de suporte a decisão (SSD), os dados são coletados em data warehouses e a análise de dados pode ser realizada por meio de processamento analítico online (OLAP) e datamining. Julgue os itens seguintes, sobre SSD, OLAP e datamining.
Quanto ao nível de granularidade dos dados do data warehouse, é correto afirmar que quanto maior for o nível de detalhe, mais alto será o nível de granularidade dos dados e maior será a possibilidade de o sistema responder a qualquer consulta.