Julgue o item a seguir, a respeito da teoria da informação e de metadados de arquivos.


Na gestão de documentos digitalizados, os arquivos são criados em formato de imagens, e seus atributos são armazenados em metadados para facilitar a pesquisa e a localização desses arquivos.

O conceito de Big Data engloba não apenas o volume de dados, mas também a variedade e a velocidade com que são produzidos os chamados 3Vs, os principais desafios ou dimensões do Big Data.
Posteriormente, de acordo com o DAMA-DBOK, aos 3Vs iniciais foram adicionados outros 3Vs aos principais desafios ou dimensões do Big Data. São eles:
O Big Data é implementado por equipes multidisciplinares, especializadas em suas respectivas áreas. O nome do perfil profissional que trabalha na definição de padrões, frameworks e protocolos e indica as disposições necessárias para os projetos, desde CPU, storages, licenças de software, se chama
Com relação a noções de big data, julgue os itens que se seguem.


I Como qualquer tecnologia, soluções de big data também apresentam algumas restrições. Por exemplo, elas não podem ser utilizadas na área da saúde para determinar a causa de uma doença, porque esse é um procedimento complexo que somente pode ser executado por pessoas devidamente capacitadas — nesse caso, os médicos.

II Big data é qualquer tipo de fonte de dados que possui, no mínimo, as seguintes três características: volume de dados extremamente grande; velocidade de dados extremamente alta; e variedade de dados extremamente ampla.

III Para que as organizações obtenham os conhecimentos corretos, a tecnologia big data não permite que elas executem as operações de armazenar e administrar as grandes quantidades de dados de si próprias.

IV Big data é uma combinação de tecnologias de gestão de dados que evoluíram ao longo dos anos, razão por que não é considerado um mercado único.

Estão certos apenas os itens
Acerca da definição de dados e informação e sua representação em sistemas de informação, julgue o item que segue.
Informação é constituída por um conjunto de dados com características específicas. O ponto de análise é que os dados devem ser irrelevantes para o sistema a que se destinam.
Uma loja online que está crescendo e coletando muitas informações sobre seus clientes: o que eles clicam, o que compram, as avaliações que deixam nos produtos e até as mensagens que enviam. Para dar dicas de produtos cada vez melhores e deixar a experiência de cada cliente mais personalizada, a loja decidiu criar um "grande depósito de dados" (Data Lake) para guardar tudo isso. E a equipe de especialistas em dados planeja usar Inteligência Artificial e Machine Learning para desvendar os segredos contidos nesse depósito.
Nesse caso, a grande vantagem de usar IA e ML junto com um Data Lake é
A era digital trouxe uma quantidade enorme de dados para o mundo, o que tornou o Big Data uma preocupação cada vez mais importante para empresas e organizações em diversos países. Para entender e aproveitar ao máximo as informações disponíveis, é fundamental conhecer os chamados “5 V's” desse complexo conjunto de dados, que são: Volume, Velocidade,
Em uma cidade inteligente, diversos dispositivos conectados, como sensores de trânsito, câmeras de segurança e medidores de energia, trocam informações entre si para otimizar o uso de recursos e melhorar a qualidade de vida dos cidadãos.
Esse conceito é conhecido como
Inicialmente, o conceito de Big Data era amplamente descrito pelos chamados ‘3 Vs’. Com o avanço da área, novos ‘Vs’ foram incorporados para ampliar essa definição. Um desses novos ‘Vs’ é a veracidade.
Assinale a opção que melhor define o conceito de veracidade.
No contexto de análise de dados numéricos em aplicações de Big Data, há casos em que é necessário lidar com a identificação/isolamento de outliers. Uma das técnicas utilizadas nesses casos é baseada na fórmula a seguir.
Z = (x – µ) / σ
Na fórmula, “Z” é um fator (ou escore) que permite estabelecer se o valor numérico “x” deve ser considerado um outlier ou não.
Os símbolos “µ” e “σ” empregados na fórmula significam respectivamente:
Em relação a banco de dados em memória, soluções para Big Data e dados estruturados e não estruturados, julgue o item que se segue.

Documentos de uma empresa e postagens nas redes sociais são exemplos de dados estruturados.
Maria, analista de mercado da CVM, precisa analisar milhares de negociações financeiras para obter insights e tomar decisões ao longo do dia. Maria apresentou a demanda para Tiago, o arquiteto de big data da CVM.
Para processar as negociações financeiras como uma sequência de eventos no tempo, agrupando e filtrando os dados à medida que são capturados, o componente da arquitetura de big data que Tiago deve desenvolver é o:
Big data é uma colação de dados oriundas de várias fontes e em grande quantidade. Geralmente big data é descrito através de cinco características conhecidas como 5 Vs, sendo elas:
Considerando os conceitos da Indústria 4.0, julgue as afirmações abaixo:

I. Sistemas de simulação é o uso de um sistema integrado, baseado em computador, que consiste em simulação, visualização 3D, análises e ferramentas de colaboração para criar definições de processos de manufatura e produto simultaneamente.
II. A interconexão entre objetos por meio de infraestrutura habilitadora (eletrônica, software, sensores e/ou atuadores), com capacidade de computação distribuída e organizados em redes, que passam a se comunicar e interagir, podendo ser remotamente monitorados e/ou controlados, resultando em ganhos de eficiência, caracteriza o conceito de Cloud Computing.
III. Big Data consiste no uso de tecnologias digitais para transformar processos de produção, de desenvolvimento de produtos e/ou modelos de negócios, visando à otimização e à eficiência nos processos. A transformação digital abrange: projeto e implementação de plano de digitalização, sensoriamento, aquisição e tratamento de dados.
A eficiência no armazenamento de dados é crucial para muitas organizações. Tecnologias como Amazon S3, CEPH e HDFS apresentam soluções adequadas a diferentes necessidades.
Sobre esses modelos de armazenamento, avalie as afirmativas a seguir.
I. O Amazon Simple Storage Service utiliza um sistema de arquivos distribuídos, o que proporciona uma escalabilidade praticamente ilimitada. II. O modelo CEPH é indicado para organizações que lidam com dados altamente sensíveis, como informações financeiras, jurídicas ou dados governamentais. III. Dividir arquivos grandes em blocos de tamanho fixo aumenta a eficiência do HDFS no processamento de grandes volumes de dados, ou Big Data.
Está correto o que se afirma em
Um Tribunal está implementando uma solução para gerenciar seu vasto acervo digital, que inclui milhões de documentos digitalizados, gravações de áudio de sessões, vídeos de audiências e dados estruturados extraídos do sistema processual eletrônico. Para viabilizar análises futuras complexas (como mineração de dados, inteligência artificial e cruzamento de informações) e consultas avançadas, optou por armazenar inicialmente todos esses dados em um data lake.
A principal vantagem da escolha inicial pelo data lake reside no fato de que ele permite:
Em um big data, alimentado com os dados de um sítio de comércio eletrônico, são armazenadas informações diversificadas, que consideram a navegação dos usuários, os produtos comprados e outras preferências que o usuário demonstre nos seus acessos.
Tendo como referência as informações apresentadas, julgue o item seguinte.
O big data consiste de um grande depósito de dados estruturados, ao passo que os dados não estruturados são considerados data files.
Em relação a banco de dados em memória, soluções paraBig Datae dados estruturados e não estruturados, julgue o item que se segue.

O Hadoop é uma solução para Big Data e foi desenvolvido para armazenar e processar dados em diferentes máquinas com alta velocidade e baixo custo, permitindo a integração de dados por meio da orquestração deles.
Página 1