Em uma cidade inteligente, diversos dispositivos conectados,
como sensores de trânsito, câmeras de segurança e medidores de
energia, trocam informações entre si para otimizar o uso de
recursos e melhorar a qualidade de vida dos cidadãos.
Esse conceito é conhecido como
Inicialmente, o conceito de Big Data era amplamente descrito
pelos chamados ‘3 Vs’. Com o avanço da área, novos ‘Vs’ foram
incorporados para ampliar essa definição. Um desses novos ‘Vs’ é
a veracidade.
Assinale a opção que melhor define o conceito de veracidade.
No contexto de análise de dados numéricos em aplicações de Big
Data, há casos em que é necessário lidar com a
identificação/isolamento de outliers. Uma das técnicas utilizadas
nesses casos é baseada na fórmula a seguir.
Z = (x – µ) / σ
Na fórmula, “Z” é um fator (ou escore) que permite estabelecer se
o valor numérico “x” deve ser considerado um outlier ou não.
Os símbolos “µ” e “σ” empregados na fórmula significam
respectivamente:
Maria, analista de mercado da CVM, precisa analisar milhares de
negociações financeiras para obter insights e tomar decisões ao
longo do dia. Maria apresentou a demanda para Tiago, o
arquiteto de big data da CVM.
Para processar as negociações financeiras como uma sequência
de eventos no tempo, agrupando e filtrando os dados à medida
que são capturados, o componente da arquitetura de big data
que Tiago deve desenvolver é o:
Big data é uma colação de dados oriundas de várias fontes e em grande quantidade. Geralmente big data é descrito através de cinco características conhecidas como 5 Vs, sendo elas:
Considerando os conceitos da Indústria 4.0, julgue as afirmações abaixo:
I. Sistemas de simulação é o uso de um sistema integrado, baseado em computador, que
consiste em simulação, visualização 3D, análises e ferramentas de colaboração para criar definições de
processos de manufatura e produto simultaneamente.
II. A interconexão entre objetos por meio de infraestrutura habilitadora (eletrônica, software, sensores e/ou
atuadores), com capacidade de computação distribuída e organizados em redes, que passam a se
comunicar e interagir, podendo ser remotamente monitorados e/ou controlados, resultando em ganhos de
eficiência, caracteriza o conceito de Cloud Computing.
III. Big Data consiste no uso de tecnologias digitais para transformar processos de produção, de
desenvolvimento de produtos e/ou modelos de negócios, visando à otimização e à eficiência nos processos.
A transformação digital abrange: projeto e implementação de plano de digitalização, sensoriamento,
aquisição e tratamento de dados.
A eficiência no armazenamento de dados é crucial para muitas
organizações. Tecnologias como Amazon S3, CEPH e HDFS
apresentam soluções adequadas a diferentes necessidades.
Sobre esses modelos de armazenamento, avalie as afirmativas a
seguir.
I. O Amazon Simple Storage Service utiliza um sistema de
arquivos distribuídos, o que proporciona uma escalabilidade
praticamente ilimitada.
II. O modelo CEPH é indicado para organizações que lidam com
dados altamente sensíveis, como informações financeiras,
jurídicas ou dados governamentais.
III. Dividir arquivos grandes em blocos de tamanho fixo aumenta
a eficiência do HDFS no processamento de grandes volumes
de dados, ou Big Data.
Está correto o que se afirma em
Um Tribunal está implementando uma solução para gerenciar seu
vasto acervo digital, que inclui milhões de documentos
digitalizados, gravações de áudio de sessões, vídeos de audiências
e dados estruturados extraídos do sistema processual eletrônico.
Para viabilizar análises futuras complexas (como mineração de
dados, inteligência artificial e cruzamento de informações) e
consultas avançadas, optou por armazenar inicialmente todos
esses dados em um data lake.
A principal vantagem da escolha inicial pelo data lake reside no
fato de que ele permite:
Em um big data, alimentado com os dados de um sítio de
comércio eletrônico, são armazenadas informações diversificadas,
que consideram a navegação dos usuários, os produtos comprados
e outras preferências que o usuário demonstre nos seus acessos.
Tendo como referência as informações apresentadas, julgue o item
seguinte. O big data consiste de um grande depósito de dados
estruturados, ao passo que os dados não estruturados são
considerados data files.
Em relação a banco de dados em memória, soluções paraBig Datae dados estruturados e não estruturados, julgue o item que se segue.
O Hadoop é uma solução para Big Data e foi desenvolvido
para armazenar e processar dados em diferentes máquinas
com alta velocidade e baixo custo, permitindo a integração
de dados por meio da orquestração deles.
Julgue o item a seguir, a respeito de técnicas de ingestão de dados, análise de dados eBig Data.
Na ingestão de dados, a arquitetura lambda utiliza o
processamento em lote para fornecer visualizações das
informações e utiliza a atualização em tempo real para ajudar
os gestores a visualizarem dados críticos e urgentes.
Julgue o item a seguir, a respeito de técnicas de ingestão de
dados, análise de dados e Big Data. No armazenamento de dados em Big Data, valor é o critério
que observa a integração de informações coletadas em
diferentes fontes, com vistas a enriquecer as análises.