Questões de Concursos Ciência de Dados

Resolva questões de Ciência de Dados comentadas com gabarito, online ou em PDF, revisando rapidamente e fixando o conteúdo de forma prática.

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.
Limpar filtros

21Q970246 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

As máquinas de vetores de suporte (SVMs) são originalmente utilizadas para a classificação de dados em duas classes, ou seja, na geração de dicotomias. Nas SVMs com margens rígidas, conjuntos de treinamento linearmente separáveis podem ser classificados. Acerca das características das SVMs com margens rígidas, julgue o item a seguir.

Um conjunto linearmente separável é composto por exemplos que podem ser separados por pelo menos um hiperplano. As SVMs lineares buscam o hiperplano ótimo segundo a teoria do aprendizado estatístico, definido como aquele em que a margem de separação entre as classes presentes nos dados é minimizada.

  1. ✂️
  2. ✂️

22Q970256 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Com respeito amachine learningaplicado, julgue o próximo item.

Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase.

  1. ✂️
  2. ✂️

23Q970259 | Banco de Dados, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Com respeito a métodos para imputação de dados, julgue o seguinte item.

O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.

  1. ✂️
  2. ✂️

24Q970243 | Banco de Dados, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Em um processo em que se utiliza a ciência de dados, o número de variáveis necessárias para a realização da investigação de um fenômeno é direta e simplesmente igual ao número de variáveis utilizadas para mensurar as respectivas características desejadas; entretanto, é diferente o procedimento para determinar o número de variáveis explicativas, cujos dados estejam em escalas qualitativas.

Considerando esse aspecto dos modelos de regressão, julgue o item a seguir.

Para evitar um erro de ponderação arbitrária, deve-se recorrer ao artifício de uso de variáveis dummy, o que permitirá a estratificação da amostra da maneira que for definido um determinado critério, evento ou atributo, para então serem inseridas no modelo em análise; isso permitirá o estudo da relação entre o comportamento de determinada variável explicativa qualitativa e o fenômeno em questão, representado pela variável dependente.

  1. ✂️
  2. ✂️

25Q970254 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Julgue o próximo item, relativos a redes neurais artificiais (RNA).

Uma rede neural convolucional é composta por camadas convolucionais, unidades de processamento não linear e camadas de subamostragem (pooling); ela possui como característica a habilidade em explorar correlações temporais e espaciais nos dados.

  1. ✂️
  2. ✂️

26Q970249 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Julgue o próximo item, relativos a redes neurais artificiais (RNA).

Em RNA formada unicamente de perceptron, uma pequena alteração nos pesos de um único perceptron na rede pode ocasionar grandes mudanças na saída desse perceptron; mesmo com a inserção das funções de ativação, não é possível controlar o nível da mudança, por isso, essas redes são voltadas para a resolução de problemas específicos, tais como regressão e previsão de séries temporais.

  1. ✂️
  2. ✂️

27Q970251 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Julgue o próximo item, relativos a redes neurais artificiais (RNA).

O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.

  1. ✂️
  2. ✂️

28Q970252 | Engenharia de Software, Ciência de Dados, Petrobras, CESPE CEBRASPE, 2022

Julgue o próximo item, relativos a redes neurais artificiais (RNA).

Rede neural recorrente é uma arquitetura similar à feedforward; a diferença é que a cada nova camada oculta (hidden layer) é acrescentada outra camada recorrente à arquitetura conectada à camada anterior, duplicando assim a quantidade de camadas.

  1. ✂️
  2. ✂️

29Q1050604 | Banco de Dados, Big Data, Ciência de Dados, TCE PA, FGV, 2024

O conceito de Big Data engloba não apenas o volume de dados, mas também a variedade e a velocidade com que são produzidos os chamados 3Vs, os principais desafios ou dimensões do Big Data.
Posteriormente, de acordo com o DAMA-DBOK, aos 3Vs iniciais foram adicionados outros 3Vs aos principais desafios ou dimensões do Big Data. São eles:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️

30Q1050605 | Banco de Dados, Datamart, Ciência de Dados, TCE PA, FGV, 2024

Associe os conceitos a seguir às respectivas características.
1. Data Lake 2. Data Mart
( ) Surgiu como uma alternativa aos armazéns de dados tradicionais, permitindo o armazenamento de grandes volumes de dados de qualquer tipo e tamanho. ( ) São criados para tornar os dados mais facilmente acessíveis para geração de relatórios, além de fornecer um estágio adicional de transformação além das tubulações ETL iniciais. ( ) Tipo de armazenamento de dados frequentemente usado para suportar camadas de apresentação do ambiente de data warehouse. ( ) Fornece um local central de armazenamento para dados brutos, com o mínimo de transformação, se houver.
A associação correta, na ordem dada, é:
  1. ✂️
  2. ✂️
  3. ✂️
  4. ✂️
  5. ✂️
Utilizamos cookies e tecnologias semelhantes para aprimorar sua experiência de navegação. Política de Privacidade.