Questões de Concursos

selecione os filtros para encontrar suas questões de concursos e clique no botão abaixo para filtrar e resolver.

Publicidade

Considere o seguinte conjunto de dados, que representa as notas de 10 alunos em uma avaliação:

7, 8, 6, 9, 10 , 5, 7, 8, 6, 9.


A mediana, o desvio interquartil e o desvio absoluto médio são, respectivamente, iguais a

Considerando a relação entre média, mediana e moda em distribuições de dados, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Se, em um conjunto de dados, a média for maior que a mediana, a distribuição será assimétrica à direita (positiva).
( ) Em uma distribuição simétrica, a média, a mediana e a moda coincidem.
( ) Para uma distribuição multimodal, é possível que a relação entre média, mediana e moda não siga um padrão consistente.
( ) Se a mediana for maior que a média, a distribuição pode apresentar assimetria à esquerda (negativa).


As afirmativas são, respectivamente,
Sobre a Análise Exploratória de Dados (AED), avalie as afirmativas a seguir.
I. A AED permite a obtenção do entendimento sobre os dados coletados. II. A AED fornece uma ideia de como os dados se distribuem e sua forma de apresentação. III. Algoritmos de Machine Learning são as principais ferramentas utilizadas na AED.
Está correto o que se afirma em

Observe a amostra de dados contábeis (em milhares de reais) a seguir.

132 202 185 214 240 186 183 180 203 204 138 98 194 295 103 222 104

A mediana desse conjunto de dados, em milhares de reais, é igual a:

Com relação aos conceitos básicos de análise exploratória de dados, analise as afirmativas a seguir.

I. O coeficiente de curtose é uma medida adimensional que depende da diferença entre os percentis de ordem 90 e 10.

II. Quando o coeficiente de correlação entre duas variáveis aleatórias é nulo, isso implica que as mesmas são independentes.

III. Um conjunto de dados cujo desvio padrão é maior do que o de outro conjunto possui maior dispersão.


Está correto o que se afirma em
Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores
xA = [2, −2, 0, 1,] e xB = [−4, 0, 2, −4].
Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente:
Na estimação de parâmetros de modelos econométricos, o estimador de mínimos quadrados ordinários (MQO) é largamente utilizado. A principal propriedade que esse estimador deve ter é ser consistente, ou seja, o estimador deve convergir para o verdadeiro parâmetro conforme o tamanho da amostra aumenta.

Avalie se as seguintes condições são necessárias para a consistência do estimador de MQO.

I. A distribuição de probabilidade dos erros do modelo deve ser uma distribuição Normal.

II. A correlação entre as variáveis explicativas do modelo e o termo de erro deve convergir para zero.

III. Os erros do modelo devem ter média igual a zero.


Está correto o que se apresenta em
Em relação à distribuição normal N(μ, σ2 ), avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Toda distribuição normal é simétrica em relação à média μ.
( ) A média, a mediana e a moda de uma distribuição normal coincidem.
( ) Aproximadamente 68% dos valores de uma variável normalmente distribuída estão no intervalo (μ−σ, μ+σ).

As afirmativas são, respectivamente,
No estudo do desmatamento de uma região específica verificou-se que em uma década, a média de desmatamento aumentou 60% e a variância quadruplicou.
Assim, é correto afirmar que a variância relativa
Um analista do Tribunal de Contas realizou um estudo para tentar prever o gasto com passagens áreas com os servidores do tribunal.
Nesse estudo, ele levou em consideração as seguintes variáveis:
1. A distância entre o local de origem e o local de destino. 2. Se o servidor é de nível médio ou superior. 3. Se o servidor tem direito a bagagem ou não.
Essas variáveis são dos seguintes tipos, respectivamente:
Uma das etapas essenciais do tratamento e processamento de dados, em especial para estatística e para o aprendizado de máquina, consiste em sua organização e identificação. Uma maneira de organizar os dados de um conjunto consiste em classificá-los.
Relacione cada uma das variáveis a seguir, constantes de um conjunto de dados sobre um grupo de pessoas, com a classificação a ela mais adequada.

1. Grau de instrução (ex.: superior)
2. Número de filhos
3. Estado de Procedência (ex.: Minas Gerais)
4. Massa corporal


( ) Quantitativa Contínua ( ) Quantitativa Discreta ( ) Qualitativa Nominal ( ) Qualitativa Ordinal


A relação correta, na ordem apresentada, é
A ciência de dados usa as análises descritiva, a diagnóstica, a preditiva e a prescritiva para estudar dados. Uma companhia aérea contratou um estudo dos dados para melhorar sua performance no mercado.
Associe a metodologia de estudo ao exemplo dado.
1. Análise Descritiva 2. Análise Diagnóstica 3. Análise Preditiva

( ) O serviço de reserva de voos da companhia pode registrar dados como o número de bilhetes reservados a cada dia. A análise revelará picos de reservas, quedas nas reservas e meses de alta performance para este serviço.

( ) O serviço de voo da companhia pode fazer drill-down em um mês particularmente de alta performance para entender melhor o pico de reserva.

( ) A equipe de serviço de voo da companhia pode usar a ciência de dados para prever, no início de cada ano, padrões de reserva de voo para o próximo ano.

Assinale a opção que apresenta a sequência correta, na ordem apresentada.
Seja o conjunto de dados abaixo cuja média aritmética é 30:

{21, 42, 29, 15, 27, 36, 25, 45}

Considerando o exposto, analise os itens a seguir.

I. A amplitude dos dados é igual àI, II média.
II. A mediana é 28.
III. A moda é 45.

Está correto o que se afirma em
Aldo está implementando um painel de visualização de dados com a quantidade de atendimentos ao público que seu setor faz ao longo do tempo.
Para apresentar a quantidade de atendimentos, Aldo deve implementar uma variável do tipo:
Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.
Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.
Considere uma variável aleatória X com distribuição normal commédia  e variância σ2 e avalie se as seguintes afirmativas estãocorretas:
I. A variável Z = (X - μ)/σ tem distribuição normal commédia 0 e variância 1. II. A probabilidade P[ μ – 2σ < X < μ + 2σ] é aproximadamenteigual a 95%. III. P [ X < μ ] = 0,5
Está correto o que se afirma em
Página 1
Publicidade