Para cientistas de dados, usar bibliotecas de Python 3.9
é crucial, mas também desafiador. A variedade e a constante evolução das opções exigem domínio das diferentes
sintaxes e funcionalidades. Além disso, é fundamental otimizar o desempenho e garantir a interoperabilidade entre
essas bibliotecas. Dominar esse ecossistema é uma habilidade essencial para extrair insights significativos dos
dados.
No processo de escolha, o cientista de dados deverá
atentar que a biblioteca
a) NumPy oferece rotinas de tratamento de dados como
groupby, merge e join, e que a Matplotlib fornece execução eficiente em transformadores, CPUs, GPUs e
TPUs.
b) Pandas oferece estruturas de dados e algoritmos espaciais para tratamento de imagens multidimensionais, e que a Matplotlib fornece suporte para redes
neurais profundas.
c) PyTorch adota o modelo computacional dinâmico
(Define-by-Run), e que a TensorFlow utiliza o modelo
estático (Define-and-Run).
d) Scikit-learn oferece tensores para geração de autovalores e autovetores, e que a Pandas fornece um sistema de diferenciação automática de computação de
gradientes.
e) TensorFlow oferece suporte a diversos tipos de dados,
tais como JSON e SQL, e que a SciPy nativamente desenha múltiplos gráficos dentro de uma mesma figura.