Início Questões de Concursos Inteligência da Informação Resolva questões de Inteligência da Informação comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática. Inteligência da Informação Ordenar por: Mais populares Mais recentes Mais comentadas Filtrar questões: Exibir todas as questões Exibir questões resolvidas Excluir questões resolvidas Exibir questões que errei Filtrar 1Q1037261 | Banco de Dados, Etl Extract Transform Load, Inteligência da Informação, DATAPREV, FGV, 2024Os modelos de dados desempenham um papel fundamental no processo de ETL (Extração, Transformação e Carga), pois são responsáveis por estruturar e organizar as informações de maneira eficiente e consistente. Eles garantem que os dados extraídos de diferentes fontes sejam integrados corretamente, facilitando a transformação e preparação para a análise posterior. No contexto de modelos de dados em ETL, existe o conceito de tabela de fatos sem fato (factless fact), que se caracteriza por ✂️ a) anotar falhas em transações intermediárias. ✂️ b) apresentar ausência de medidas. ✂️ c) registrar somente medidas que anulam os registros originais de dados. ✂️ d) representar um intervalo de tempo regularmente repetido. ✂️ e) revelar medições instantâneas em um ponto específico no tempo e espaço. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 2Q1044102 | Banco de Dados, Sql, Inteligência da Informação, DATAPREV, FGV, 2024Um dos conceitos associados a coleções de objetos de dados e/ou arquivos de sistemas de bancos de dados NoSQL é o de sharding. Nesse contexto, uma das características de sharding refere-se ✂️ a) ao armazenamento de múltiplos itens com timestamps. ✂️ b) à conciliação de gravação em operações conflitantes. ✂️ c) a não exigência de um esquema prévio de dados. ✂️ d) a oferta de uma linguagem de consulta menos poderosa. ✂️ e) ao particionamento horizontal dos dados entre nós do sistema. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 3Q1037263 | Sistemas Operacionais, Apache, Inteligência da Informação, DATAPREV, FGV, 2024O Apache Spark é uma ferramenta amplamente utilizada para processamento de grandes volumes de dados. Assinale a opção que o descreve corretamente, assim como suas capacidades e suas funcionalidades. ✂️ a) O Apache Spark é um sistema de armazenamento distribuído de arquivos que gerencia grandes volumes de dados por meio de replicação e fragmentação, com foco na segurança e no versionamento dos arquivos. ✂️ b) O Apache Spark é um framework de computação distribuída que permite o processamento rápido de grandes volumes de dados, suportando operações em tempo real e por lote, além de fornecer bibliotecas para machine learning e gráficos. ✂️ c) O Apache Spark é uma plataforma de análise de dados especializada em bancos de dados relacionais, permitindo consultas SQL em tempo real e fornecendo ferramentas de visualização integradas. ✂️ d) O Apache Spark é um sistema de gerenciamento de filas que prioriza a execução de tarefas paralelas em ambientes distribuídos, garantindo que as tarefas sejam executadas de acordo com a capacidade da infraestrutura. ✂️ e) O Apache Spark é um sistema de controle de versões distribuído que facilita o gerenciamento colaborativo de projetos de dados e código, permitindo a reversão de alterações e o controle detalhado de permissões. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 4Q1044101 | Matemática, Probabilidade, Inteligência da Informação, DATAPREV, FGV, 2024Uma comissão é composta por analistas de diferentes áreas, sendo cinco em inteligência da informação, cinco em contabilidade, cinco em gestão econômico-financeira e cinco em engenharia. Dois analistas serão sorteados nessa comissão para ocupar as posições de presidente e vice-presidente. A probabilidade de os analistas sorteados pertencerem à mesma área é ✂️ a) 1/20 ✂️ b) 4/19 ✂️ c) 1/5 ✂️ d) 1/4 ✂️ e) 3/4 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 5Q1037256 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024O algoritmo de redução de dimensionalidade conhecido como Análise de Componentes Principais (PCA – Principal Component Analysis) possui características importantes. Dada a escolha de um número k de componentes principais e um conjunto de dados X com cinco variáveis A, B, C, D e E, o PCA ✂️ a) adiciona a média de cada observação para cada dimensão de X, normalizando-a depois pelo desvio-padrão. ✂️ b) constrói a matriz de confusão a partir de X, multiplicando-a pelos autovalores de seus vetores originais. ✂️ c) escolhe k autovetores aleatórios do conjunto original de dados. ✂️ d) preserva as distâncias geodésicas entre os pontos do espaço original dos dados por redução não linear. ✂️ e) retorna k combinações lineares dos atributos do conjunto {A,B,C,D,E}. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 6Q1037260 | Comunicação Social, Tecnologias Na Comunicação e Atualidades, Inteligência da Informação, DATAPREV, FGV, 2024Support Vector Machines (SVMs) é um método de aprendizado de máquina que pode ser aplicado em áreas como reconhecimento de padrões, bioinformática e detecção de fraudes, devido à sua capacidade de lidar com dados complexos. Nesse contexto, identificamos que o método SVM ✂️ a) adequa-se a problemas de agrupamento de dados multidimensionais. ✂️ b) apoia-se no princípio do “kernel trick”, que mapeia explicitamente dados não lineares em outros dados lineares. ✂️ c) define margem como sendo a maior saturação de erro (bias) suportada pelo algoritmo na geração de hiperplanos concorrentes. ✂️ d) inviabiliza o uso de abordagens para SVMs lineares com margens rígida e suave para utilização em SVMs não lineares em dados linearmente inseparáveis. ✂️ e) usa um mapeamento não linear para transformar os dados de treino originais em um espaço de dimensão superior. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 7Q1037257 | Banco de Dados, Data Mining, Inteligência da Informação, DATAPREV, FGV, 2024Considere o seguinte cenário: Uma empresa de telecomunicações está analisando os dados de uso de seus clientes, como frequência de chamadas, uso de dados móveis e envio de mensagens. Ela quer identificar grupos de clientes com comportamentos semelhantes para oferecer promoções personalizadas. Em uma escolha por uma solução de aprendizado de máquina, o cientista de dados deve observar que, se o aprendizado for ✂️ a) híbrido, congregará as características dos modelos supervisionado e não supervisionado, em um modelo ensemble. ✂️ b) não supervisionado oferecerá opções como os algoritmos back propagation, K-means e C4.5. ✂️ c) não supervisionado demandará uma fase de pósprocessamento que envolve visualização e análise do modelo. ✂️ d) supervisionado considerará a abstração de um modelo de conhecimento da forma (entrada, saída desejada). ✂️ e) supervisionado, os algoritmos partirão dos dados, buscando relacionamento entre eles. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 8Q1044100 | Física, Física Térmica, Inteligência da Informação, DATAPREV, FGV, 2024Uma chapa de alumínio de formato circular é exposta a uma fonte de calor e sofre dilatação, de modo que seu raio cresce com velocidade constante de 0,01cm/s. No instante em que o raio do disco atinge 2cm, a velocidade com que sua área cresce, em cm2/s, é ✂️ a) 0,01π ✂️ b) 0,02π ✂️ c) 0,04π ✂️ d) 0,08π ✂️ e) 0,1π Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 9Q1044103 | Banco de Dados, Banco de Dados Relacionais, Inteligência da Informação, DATAPREV, FGV, 2024No âmbito de normalização de bancos de dados relacionais, há o conceito de dependência com a seguinte especificação: “para o esquema de uma relação R, uma restrição que demanda que cada estado r de R apresente uma decomposição de junção não aditiva e não trivial para cada decomposição Ri de R, em que o valor de i varie entre 1 e n, sendo n o número de decomposições de R”. Esse conceito de dependência, considerando um valor de n maior que dois (n>2), integra a definição da ✂️ a) 2ª forma normal (2FN). ✂️ b) 3ª forma normal (3FN). ✂️ c) 4ª forma normal (4FN). ✂️ d) 5ª forma normal (5FN). ✂️ e) forma normal Boyce-Codd (FNBC). Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 10Q1037262 | Sistemas Operacionais, Apache, Inteligência da Informação, DATAPREV, FGV, 2024O Apache Hadoop é uma plataforma amplamente utilizada no processamento de grandes volumes de dados. Ele se destaca por sua arquitetura distribuída e capacidade de lidar com grandes conjuntos de dados de forma eficiente. Com base nas capacidades e funcionalidades do Hadoop, assinale a opção que = descreve corretamente seu funcionamento e aplicação prática. ✂️ a) O Hadoop é uma plataforma de banco de dados relacional, que utiliza o SQL para gerenciar grandes volumes de dados de maneira centralizada. ✂️ b) O Hadoop possui uma arquitetura distribuída, composta principalmente pelo HDFS (Hadoop Distributed File System) e o MapReduce, permitindo o processamento de grandes volumes de dados de maneira escalável e paralela. ✂️ c) O principal componente do Hadoop é o NoSQL, que possibilita o armazenamento de dados não estruturados em um único servidor, sem a necessidade de distribuição. ✂️ d) O Hadoop foi projetado para pequenas empresas que possuem volumes reduzidos de dados e não requerem processamento paralelo, destacando-se por sua simplicidade de uso. ✂️ e) O Hadoop se limita ao armazenamento de dados em clusters locais, não sendo compatível com ambientes de computação em nuvem ou distribuídos globalmente. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 11Q1037254 | Matemática, Geometria Espacial, Inteligência da Informação, DATAPREV, FGV, 2024Considere os pontos A(1; 2; 3), B(4; 5; 6), C(7; 2; 1) e D(2; 4; 8), vértices de um tetraedro. O volume deste tetraedro é igual a ✂️ a) 24. ✂️ b) 16. ✂️ c) 12. ✂️ d) 8. ✂️ e) 4. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 12Q1037255 | Algoritmos e Estrutura de Dados, Algoritmos, Inteligência da Informação, DATAPREV, FGV, 2024Algoritmos de agrupamento podem ser classificados em diferentes categorias. Um algoritmo de agrupamento amplamente utilizado em aprendizado de máquina e mineração de dados é conhecido como K-Means. O K-Means, em sua versão original, é classificado como um tipo de algoritmo ✂️ a) baseado em grade. ✂️ b) baseado em grafo. ✂️ c) hierárquico. ✂️ d) partitivo. ✂️ e) por densidade. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 13Q1037259 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024A validação cruzada é uma importante técnica em aprendizado de máquina, usada para obter uma estimativa mais robusta do erro de generalização. Dessa forma, ela contribui para a construção de modelos mais confiáveis, permitindo uma avaliação mais precisa de sua capacidade preditiva em diferentes cenários. Uma das características da validação cruzada com k conjuntos é que esse método ✂️ a) considera, na sua versão estratificada, a proporção de exemplos de cada classe quando da geração de subconjuntos mutuamente exclusivos. ✂️ b) divide aleatoriamente registros em treinamento e teste em proporções p e (1-p), respectivamente. ✂️ c) gera conjuntos cuja interseção é não vazia, utilizados a cada iteração como conjunto de treino e teste. ✂️ d) penaliza os conjuntos de treino com k sorteios aleatórios, de modo a torná-lo equilibrado frente ao conjunto de teste. ✂️ e) produz o conjunto de treinamento a partir de N sorteios aleatórios com reposição a partir dos dados originais. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 14Q1037253 | Estatística, Cálculo de Probabilidades, Inteligência da Informação, DATAPREV, FGV, 2024Uma urna contém 3 bolas vermelhas e 4 bolas azuis indistinguíveis, exceto pela cor. Três bolas serão retiradas dessa urna, sucessivamente e sem reposição. Seja X a variável aleatória que representa a quantidade de bolas azuis retiradas da urna. O valor esperado de X é ✂️ a) 2,7 ✂️ b) 2,1 ✂️ c) 1,7 ✂️ d) 1,3 ✂️ e) 0,9 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 15Q1037258 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024Um conjunto de dados foi particionado em dois subconjuntos, sendo um de treinamento e outro de testagem, ambos utilizados exclusivamente para serem usados em seus objetivos originais (dados de treino para treinamento, e de teste para testagem). Em relação ao ajuste e validação de modelos em aprendizado de máquina, um modelo sofre overfitting quando ✂️ a) apresenta bom desempenho nos dados de treinamento, mas tem baixo desempenho nos dados de teste. ✂️ b) é simples demais para capturar os padrões subjacentes nos dados. ✂️ c) minimiza o erro nos dados de treinamento e os de teste, aumentando a correlação entre esses dois conjuntos. ✂️ d) oferece uma matriz de confusão para um classificador detalhando seu desempenho. ✂️ e) relaciona-se aos altos viés e variância do conjunto de dados. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro 🖨️ Baixar PDF
1Q1037261 | Banco de Dados, Etl Extract Transform Load, Inteligência da Informação, DATAPREV, FGV, 2024Os modelos de dados desempenham um papel fundamental no processo de ETL (Extração, Transformação e Carga), pois são responsáveis por estruturar e organizar as informações de maneira eficiente e consistente. Eles garantem que os dados extraídos de diferentes fontes sejam integrados corretamente, facilitando a transformação e preparação para a análise posterior. No contexto de modelos de dados em ETL, existe o conceito de tabela de fatos sem fato (factless fact), que se caracteriza por ✂️ a) anotar falhas em transações intermediárias. ✂️ b) apresentar ausência de medidas. ✂️ c) registrar somente medidas que anulam os registros originais de dados. ✂️ d) representar um intervalo de tempo regularmente repetido. ✂️ e) revelar medições instantâneas em um ponto específico no tempo e espaço. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
2Q1044102 | Banco de Dados, Sql, Inteligência da Informação, DATAPREV, FGV, 2024Um dos conceitos associados a coleções de objetos de dados e/ou arquivos de sistemas de bancos de dados NoSQL é o de sharding. Nesse contexto, uma das características de sharding refere-se ✂️ a) ao armazenamento de múltiplos itens com timestamps. ✂️ b) à conciliação de gravação em operações conflitantes. ✂️ c) a não exigência de um esquema prévio de dados. ✂️ d) a oferta de uma linguagem de consulta menos poderosa. ✂️ e) ao particionamento horizontal dos dados entre nós do sistema. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
3Q1037263 | Sistemas Operacionais, Apache, Inteligência da Informação, DATAPREV, FGV, 2024O Apache Spark é uma ferramenta amplamente utilizada para processamento de grandes volumes de dados. Assinale a opção que o descreve corretamente, assim como suas capacidades e suas funcionalidades. ✂️ a) O Apache Spark é um sistema de armazenamento distribuído de arquivos que gerencia grandes volumes de dados por meio de replicação e fragmentação, com foco na segurança e no versionamento dos arquivos. ✂️ b) O Apache Spark é um framework de computação distribuída que permite o processamento rápido de grandes volumes de dados, suportando operações em tempo real e por lote, além de fornecer bibliotecas para machine learning e gráficos. ✂️ c) O Apache Spark é uma plataforma de análise de dados especializada em bancos de dados relacionais, permitindo consultas SQL em tempo real e fornecendo ferramentas de visualização integradas. ✂️ d) O Apache Spark é um sistema de gerenciamento de filas que prioriza a execução de tarefas paralelas em ambientes distribuídos, garantindo que as tarefas sejam executadas de acordo com a capacidade da infraestrutura. ✂️ e) O Apache Spark é um sistema de controle de versões distribuído que facilita o gerenciamento colaborativo de projetos de dados e código, permitindo a reversão de alterações e o controle detalhado de permissões. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
4Q1044101 | Matemática, Probabilidade, Inteligência da Informação, DATAPREV, FGV, 2024Uma comissão é composta por analistas de diferentes áreas, sendo cinco em inteligência da informação, cinco em contabilidade, cinco em gestão econômico-financeira e cinco em engenharia. Dois analistas serão sorteados nessa comissão para ocupar as posições de presidente e vice-presidente. A probabilidade de os analistas sorteados pertencerem à mesma área é ✂️ a) 1/20 ✂️ b) 4/19 ✂️ c) 1/5 ✂️ d) 1/4 ✂️ e) 3/4 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
5Q1037256 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024O algoritmo de redução de dimensionalidade conhecido como Análise de Componentes Principais (PCA – Principal Component Analysis) possui características importantes. Dada a escolha de um número k de componentes principais e um conjunto de dados X com cinco variáveis A, B, C, D e E, o PCA ✂️ a) adiciona a média de cada observação para cada dimensão de X, normalizando-a depois pelo desvio-padrão. ✂️ b) constrói a matriz de confusão a partir de X, multiplicando-a pelos autovalores de seus vetores originais. ✂️ c) escolhe k autovetores aleatórios do conjunto original de dados. ✂️ d) preserva as distâncias geodésicas entre os pontos do espaço original dos dados por redução não linear. ✂️ e) retorna k combinações lineares dos atributos do conjunto {A,B,C,D,E}. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
6Q1037260 | Comunicação Social, Tecnologias Na Comunicação e Atualidades, Inteligência da Informação, DATAPREV, FGV, 2024Support Vector Machines (SVMs) é um método de aprendizado de máquina que pode ser aplicado em áreas como reconhecimento de padrões, bioinformática e detecção de fraudes, devido à sua capacidade de lidar com dados complexos. Nesse contexto, identificamos que o método SVM ✂️ a) adequa-se a problemas de agrupamento de dados multidimensionais. ✂️ b) apoia-se no princípio do “kernel trick”, que mapeia explicitamente dados não lineares em outros dados lineares. ✂️ c) define margem como sendo a maior saturação de erro (bias) suportada pelo algoritmo na geração de hiperplanos concorrentes. ✂️ d) inviabiliza o uso de abordagens para SVMs lineares com margens rígida e suave para utilização em SVMs não lineares em dados linearmente inseparáveis. ✂️ e) usa um mapeamento não linear para transformar os dados de treino originais em um espaço de dimensão superior. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
7Q1037257 | Banco de Dados, Data Mining, Inteligência da Informação, DATAPREV, FGV, 2024Considere o seguinte cenário: Uma empresa de telecomunicações está analisando os dados de uso de seus clientes, como frequência de chamadas, uso de dados móveis e envio de mensagens. Ela quer identificar grupos de clientes com comportamentos semelhantes para oferecer promoções personalizadas. Em uma escolha por uma solução de aprendizado de máquina, o cientista de dados deve observar que, se o aprendizado for ✂️ a) híbrido, congregará as características dos modelos supervisionado e não supervisionado, em um modelo ensemble. ✂️ b) não supervisionado oferecerá opções como os algoritmos back propagation, K-means e C4.5. ✂️ c) não supervisionado demandará uma fase de pósprocessamento que envolve visualização e análise do modelo. ✂️ d) supervisionado considerará a abstração de um modelo de conhecimento da forma (entrada, saída desejada). ✂️ e) supervisionado, os algoritmos partirão dos dados, buscando relacionamento entre eles. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
8Q1044100 | Física, Física Térmica, Inteligência da Informação, DATAPREV, FGV, 2024Uma chapa de alumínio de formato circular é exposta a uma fonte de calor e sofre dilatação, de modo que seu raio cresce com velocidade constante de 0,01cm/s. No instante em que o raio do disco atinge 2cm, a velocidade com que sua área cresce, em cm2/s, é ✂️ a) 0,01π ✂️ b) 0,02π ✂️ c) 0,04π ✂️ d) 0,08π ✂️ e) 0,1π Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
9Q1044103 | Banco de Dados, Banco de Dados Relacionais, Inteligência da Informação, DATAPREV, FGV, 2024No âmbito de normalização de bancos de dados relacionais, há o conceito de dependência com a seguinte especificação: “para o esquema de uma relação R, uma restrição que demanda que cada estado r de R apresente uma decomposição de junção não aditiva e não trivial para cada decomposição Ri de R, em que o valor de i varie entre 1 e n, sendo n o número de decomposições de R”. Esse conceito de dependência, considerando um valor de n maior que dois (n>2), integra a definição da ✂️ a) 2ª forma normal (2FN). ✂️ b) 3ª forma normal (3FN). ✂️ c) 4ª forma normal (4FN). ✂️ d) 5ª forma normal (5FN). ✂️ e) forma normal Boyce-Codd (FNBC). Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
10Q1037262 | Sistemas Operacionais, Apache, Inteligência da Informação, DATAPREV, FGV, 2024O Apache Hadoop é uma plataforma amplamente utilizada no processamento de grandes volumes de dados. Ele se destaca por sua arquitetura distribuída e capacidade de lidar com grandes conjuntos de dados de forma eficiente. Com base nas capacidades e funcionalidades do Hadoop, assinale a opção que = descreve corretamente seu funcionamento e aplicação prática. ✂️ a) O Hadoop é uma plataforma de banco de dados relacional, que utiliza o SQL para gerenciar grandes volumes de dados de maneira centralizada. ✂️ b) O Hadoop possui uma arquitetura distribuída, composta principalmente pelo HDFS (Hadoop Distributed File System) e o MapReduce, permitindo o processamento de grandes volumes de dados de maneira escalável e paralela. ✂️ c) O principal componente do Hadoop é o NoSQL, que possibilita o armazenamento de dados não estruturados em um único servidor, sem a necessidade de distribuição. ✂️ d) O Hadoop foi projetado para pequenas empresas que possuem volumes reduzidos de dados e não requerem processamento paralelo, destacando-se por sua simplicidade de uso. ✂️ e) O Hadoop se limita ao armazenamento de dados em clusters locais, não sendo compatível com ambientes de computação em nuvem ou distribuídos globalmente. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
11Q1037254 | Matemática, Geometria Espacial, Inteligência da Informação, DATAPREV, FGV, 2024Considere os pontos A(1; 2; 3), B(4; 5; 6), C(7; 2; 1) e D(2; 4; 8), vértices de um tetraedro. O volume deste tetraedro é igual a ✂️ a) 24. ✂️ b) 16. ✂️ c) 12. ✂️ d) 8. ✂️ e) 4. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
12Q1037255 | Algoritmos e Estrutura de Dados, Algoritmos, Inteligência da Informação, DATAPREV, FGV, 2024Algoritmos de agrupamento podem ser classificados em diferentes categorias. Um algoritmo de agrupamento amplamente utilizado em aprendizado de máquina e mineração de dados é conhecido como K-Means. O K-Means, em sua versão original, é classificado como um tipo de algoritmo ✂️ a) baseado em grade. ✂️ b) baseado em grafo. ✂️ c) hierárquico. ✂️ d) partitivo. ✂️ e) por densidade. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
13Q1037259 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024A validação cruzada é uma importante técnica em aprendizado de máquina, usada para obter uma estimativa mais robusta do erro de generalização. Dessa forma, ela contribui para a construção de modelos mais confiáveis, permitindo uma avaliação mais precisa de sua capacidade preditiva em diferentes cenários. Uma das características da validação cruzada com k conjuntos é que esse método ✂️ a) considera, na sua versão estratificada, a proporção de exemplos de cada classe quando da geração de subconjuntos mutuamente exclusivos. ✂️ b) divide aleatoriamente registros em treinamento e teste em proporções p e (1-p), respectivamente. ✂️ c) gera conjuntos cuja interseção é não vazia, utilizados a cada iteração como conjunto de treino e teste. ✂️ d) penaliza os conjuntos de treino com k sorteios aleatórios, de modo a torná-lo equilibrado frente ao conjunto de teste. ✂️ e) produz o conjunto de treinamento a partir de N sorteios aleatórios com reposição a partir dos dados originais. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
14Q1037253 | Estatística, Cálculo de Probabilidades, Inteligência da Informação, DATAPREV, FGV, 2024Uma urna contém 3 bolas vermelhas e 4 bolas azuis indistinguíveis, exceto pela cor. Três bolas serão retiradas dessa urna, sucessivamente e sem reposição. Seja X a variável aleatória que representa a quantidade de bolas azuis retiradas da urna. O valor esperado de X é ✂️ a) 2,7 ✂️ b) 2,1 ✂️ c) 1,7 ✂️ d) 1,3 ✂️ e) 0,9 Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro
15Q1037258 | Engenharia de Software, Inteligencia Artificial, Inteligência da Informação, DATAPREV, FGV, 2024Um conjunto de dados foi particionado em dois subconjuntos, sendo um de treinamento e outro de testagem, ambos utilizados exclusivamente para serem usados em seus objetivos originais (dados de treino para treinamento, e de teste para testagem). Em relação ao ajuste e validação de modelos em aprendizado de máquina, um modelo sofre overfitting quando ✂️ a) apresenta bom desempenho nos dados de treinamento, mas tem baixo desempenho nos dados de teste. ✂️ b) é simples demais para capturar os padrões subjacentes nos dados. ✂️ c) minimiza o erro nos dados de treinamento e os de teste, aumentando a correlação entre esses dois conjuntos. ✂️ d) oferece uma matriz de confusão para um classificador detalhando seu desempenho. ✂️ e) relaciona-se aos altos viés e variância do conjunto de dados. Resolver questão 🗨️ Comentários 📊 Estatísticas 📁 Salvar 🧠 Mapa Mental 🏳️ Reportar erro