Questões de Concursos Públicos: Tecnologia da Informação Ciência de Dados

Encontre aqui questões Tecnologia da Informação Ciência de Dados de Concursos Públicos com gabarito ou respostas comentadas. Acesse milhares de provas com perguntas para treinar online. Baixe o PDF!

Filtrar questões
💡 Caso não encontre resultados, diminua os filtros.
Limpar filtros

Há uma família de modelos de IA generativa que tem dois modelos treinados em conjunto: o gerador e o discriminador.
O gerador tenta criar dados falsos que sejam indistinguíveis dos dados reais, enquanto que o discriminador tenta distinguir entre dados reais e falsos. O treinamento é um jogo min-max, em que o gerador melhora suas habilidades para enganar o discriminador, e o discriminador melhora suas habilidades para detectar dados falsos.
Assinale a opção que apresenta as características do modelo de IA generativa descritas no texto.
O Excel é um programa de desenvolvimento de planilhas digitais criado pela Microsoft na década de 1980.

Devido ao renome da marca, a longa trajetória do software e as suas excelentes funcionalidades, atualmente, o Excel é um dos aplicativos mais utilizados por empresas no mundo.

Assinale a opção que apresenta a funcionalidade do Excel que permite automatizar tarefas repetitivas.
A respeito dos conceitos de DevOps, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Uma das práticas da Integração Contínua é estimular que a equipe de desenvolvimento agregue código em um repositório compartilhado várias vezes ao dia.
( ) Executar casos de teste automatizados e compilar o código fonte são tarefas de ferramentas de automação de build, como Cucumber, Travis CI e Zabbix.
( ) Configuration Management é eficiente quando nem todas as instalações e modificações são aplicadas novamente aos servidores, atualizando apenas o comportamento alterado.

As afirmativas são, respectivamente,
Uma plataforma de desenvolvimento fornece recursos como servidores, bancos de dados e ambientes de desenvolvimento integrados (IDEs) necessários para criar, testar e implantar uma aplicação web.
Assinale a opção que apresenta o modelo de serviço de computação em nuvem no qual essa plataforma se enquadra
Considerando as técnicas e as ferramentas da gerência de um projeto, analise as afirmativas a seguir.

I. As técnicas de coleta de dados, tais como listas de verificação, grupos de discussão, entrevistas e brainstorming, são utilizadas para obter dados de forma mais eficiente.

II. Análise de dados, opinião especializada, representação de dados e mapa mental não são exemplos de ferramentas e técnicas da gerência de um projeto.

III. Como técnica e ferramenta de um projeto é possível encontrar as estimativas análoga, paramétrica, única, de três pontos e a bottom-up, por exemplo.


Está correto o que se afirma em:
Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.
Sobre as a construção de dashboards, assinale a afirmativa correta.
Um analista da área de ciência de dados construiu um histograma levando em consideração uma determinada base de dados. Para incluir uma curva nesse histograma foi utilizado a função as.timeSeries.

Essa função pertence à biblioteca
Na Ciência de Dados é muito comum a utilização da linguagem Python e do R para visualização de dados.

Sobre as diferenças entre essas duas ferramentas, analise as afirmativas a seguir.


I. Python possui um padrão mais bem definido, permitindo que diferentes tipos de funcionalidades sejam escritos da mesma forma, enquanto no R, a mesma funcionalidade pode ser escrita de diversas formas diferentes.

II. Python é principalmente usada quando a análise de dados precisa ser integrada com aplicativos web ou se o código estatístico precisa ser integrado em um servidor em ambiente de produção, que vai servir muitos usuários, enquanto o R é principalmente usado quando as atividades de análise de dados requerem computação standalone (em um único computador) ou análise em servidores individuais.

III. Tanto o Python quanto o R foram criados inicialmente para análise de dados.


Está correto o que se afirma em
O pacote dplyr do R é um dos mais usados para manipulação de dados.
Assinale a opção que indica o conjunto de funções auxiliares desse pacote que são muito úteis para a seleção de colunas.
As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;
II. utilizar uma das partes para teste e as outras k-1 para treinamento;
III. repetir o processo para cada uma das k partes do conjunto de dados; e
IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de