Questões de Concursos

filtre e encontre questões para seus estudos.

Os formatos de dados XML, JSON e CSV são amplamente usados para armazenamento e troca de informações, cada um com características distintas.
Assinale a opção que descreve corretamente uma diferença entre os padrões XML, JSON e CSV.
Uma amostra aleatória simples de tamanho 100 foi obtida para estimar uma proporção p populacional de indivíduos que apresentam uma característica A. Como resultado, 36 indivíduos amostrais apresentaram a característica A.
Lembre-se que de, se Z tem distribuição normal padrão, então P [ Z < 1.96 ] = 0,975. Usando a estimativa de p no lugar do valor desconhecido, um intervalo de 95% de confiança para p será dado aproximadamente por
O tamanho da amostra aleatória simples necessário para que possamos garantir, com 99% de confiança, que o valor da média amostral não se afaste do valor da média populacional por mais de 5% do valor do desvio padrão populacional será, no mínimo, aproximadamente igual a
[Lembre-se de que, se Z tem distribuição normal padrão, então P [ Z < 2,58 ] = 0,995]
Para testar a hipótese nula de que uma proporção populacional p de sucessos é menor ou igual a 0,5 contra a hipótese alternativa de que p é maior do que 0,5, uma amostra aleatória simples de tamanho 100 será observada e o critério que rejeita a hipótese nula se a proporção de sucessos amostral for maior do que 0,64 será usado.
A probabilidade de erro tipo I máxima com esse critério é aproximadamente igual a
Para testar H0:μ≤ 30 versus H1:μ> 30, em queμé a média de uma variável populacional suposta normalmente distribuída com variância 64, uma amostra aleatória simples de tamanho 100 será obtida.
Lembre-se de que, se Z tem distribuição normal padrão, P[ Z > 1,64 ] ≈ 0,05.
O teste uniformemente mais potente de tamanhoα= 0,05 rejeitará H0 se o valor da média amostral observada for maior ou igual a
Numa população, 10% das pessoas sofrem de uma certa doença W.
Se uma amostra aleatória simples de tamanho 4 dessa população for observada, a probabilidade de que duas ou mais sofram da doença W é aproximadamente igual a
No aprendizado de máquina, técnicas de classificação e agrupamento têm objetivos distintos.
Assinale a opção que descreve corretamente uma diferença fundamental entre técnicas de agrupamento e técnicas de classificação.
Os classificadores Naive Bayes são amplamente utilizados em aprendizado de máquina devido à sua simplicidade e eficácia.
Assim, é correto afirmar que os classificadores Naive Bayes
A otimização de hiperparâmetros é crucial na construção de modelos de Machine Learning, pois pode afetar significativamente o desempenho do modelo. Diversas técnicas de busca são usadas para encontrar a melhor combinação de hiperparâmetros, e entender quais são eficazes para esse propósito é essencial para aprimorar a precisão do modelo.
A técnica apropriada na otimização de hiperparâmetros para um modelo de aprendizado supervisionado, considerando tanto a eficiência quanto a eficácia é a
No processamento de linguagem natural (PLN), a redução de dimensionalidade é vital para simplificar dados textuais e melhorar o desempenho dos algoritmos de aprendizado de máquina. Diversos métodos são usados para esse fim, cada um com suas próprias características.
Na redução de dimensionalidade em PLN, a técnica utilizada é chamada
Considere uma variável aleatória contínua X com função de densidade de probabilidade dada por

f(x) = Kx2, se 0 < x < 3,
f(x) = 0, nos demais casos,
sendo k constante.

A média de X é igual a
O processo de ETL (Extract, Transform, and Load) é importante na integração de dados, especialmente em projetos de data warehousing e business intelligence. Ele envolve três etapas principais, que são fundamentais para garantir a integridade e a qualidade dos dados permitindo análises precisas e insights valiosos.
No processo ETL, a etapa de transformação