Os formatos de dados XML, JSON e CSV são amplamente usados
para armazenamento e troca de informações, cada um com
características distintas.
Assinale a opção que descreve corretamente uma diferença entre
os padrões XML, JSON e CSV.
Uma amostra aleatória simples de tamanho 100 foi obtida para
estimar uma proporção p populacional de indivíduos que
apresentam uma característica A. Como resultado, 36 indivíduos
amostrais apresentaram a característica A.
Lembre-se que de, se Z tem distribuição normal padrão, então
P [ Z < 1.96 ] = 0,975. Usando a estimativa de p no lugar do valor
desconhecido, um intervalo de 95% de confiança para p será dado
aproximadamente por
O tamanho da amostra aleatória simples necessário para que
possamos garantir, com 99% de confiança, que o valor da média
amostral não se afaste do valor da média populacional por mais de
5% do valor do desvio padrão populacional será, no mínimo,
aproximadamente igual a
[Lembre-se de que, se Z tem distribuição normal padrão, então
P [ Z < 2,58 ] = 0,995]
Para testar a hipótese nula de que uma proporção populacional p
de sucessos é menor ou igual a 0,5 contra a hipótese alternativa
de que p é maior do que 0,5, uma amostra aleatória simples de
tamanho 100 será observada e o critério que rejeita a hipótese
nula se a proporção de sucessos amostral for maior do que 0,64
será usado.
A probabilidade de erro tipo I máxima com esse critério é
aproximadamente igual a
Para testar H0:μ≤ 30 versus H1:μ> 30, em queμé a média de
uma variável populacional suposta normalmente distribuída com
variância 64, uma amostra aleatória simples de tamanho 100 será
obtida. Lembre-se de que, se Z tem distribuição normal padrão,
P[ Z > 1,64 ] ≈ 0,05.
O teste uniformemente mais potente de tamanhoα= 0,05
rejeitará H0 se o valor da média amostral observada for maior ou
igual a
Numa população, 10% das pessoas sofrem de uma certa doença
W.
Se uma amostra aleatória simples de tamanho 4 dessa população
for observada, a probabilidade de que duas ou mais sofram da
doença W é aproximadamente igual a
No aprendizado de máquina, técnicas de classificação e
agrupamento têm objetivos distintos.
Assinale a opção que descreve corretamente uma diferença
fundamental entre técnicas de agrupamento e técnicas de
classificação.
Os classificadores Naive Bayes são amplamente utilizados em
aprendizado de máquina devido à sua simplicidade e eficácia.
Assim, é correto afirmar que os classificadores Naive Bayes
A otimização de hiperparâmetros é crucial na construção de
modelos de Machine Learning, pois pode afetar significativamente
o desempenho do modelo. Diversas técnicas de busca são usadas
para encontrar a melhor combinação de hiperparâmetros, e
entender quais são eficazes para esse propósito é essencial para
aprimorar a precisão do modelo.
A técnica apropriada na otimização de hiperparâmetros para um
modelo de aprendizado supervisionado, considerando tanto a
eficiência quanto a eficácia é a
No processamento de linguagem natural (PLN), a redução de
dimensionalidade é vital para simplificar dados textuais e melhorar
o desempenho dos algoritmos de aprendizado de máquina.
Diversos métodos são usados para esse fim, cada um com suas
próprias características.
Na redução de dimensionalidade em PLN, a técnica utilizada é
chamada
O processo de ETL (Extract, Transform, and Load) é importante na
integração de dados, especialmente em projetos de data
warehousing e business intelligence. Ele envolve três etapas
principais, que são fundamentais para garantir a integridade e a
qualidade dos dados permitindo análises precisas e insights
valiosos.
No processo ETL, a etapa de transformação