Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.
- Python e Programação Orientada à Objetos
- Álgebra Linear com
NumPy
- Análise de Dados com
pandas
- Visualização de Dados com
pandas
,matplotlib
eseaborn
- Machine Learning com
Scikit-Learn
- Redes Neurais com
TensorFlow
,Keras
ePyTorch
-
Prof. Dr. Edson Melo de Souza - Currículo Lattes - ORCID
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.
Para configurar um ambiente local:
- Clone o repositório do GitHub:
git clone https://github.com/storopoli/ciencia-de-dados.git
- Acesse o diretório:
cd ciencia-de-dados
- Instale as bibliotecas necessárias:
pip install -r .binder/requirements.txt
ouconda env create -f .binder/environment.yml
- Notebooks: Jupyter Notebooks das aulas
- Aula Especial - Curso Rápido de Python para Programadores
- Aula 0 - Jupyter Notebook
- Aula 1 - Operadores aritméticos, relacionais e lógicos
- Aula 2 - Desvio Condicional (
IF
) - Aula 3 - Estruturas de Repetição (
FOR
eWHILE
) - Aula 4 - Estruturas de Dados (
list
edict
) - Aula 5 - Funções
- Aula 5a - Classes e métodos
- Aula 6 -
NumPy
e Algebra Linear - Aula 7 -
pandas
- Aula 8 -
pandas
estatística - Aula 9 - Gráficos com
matplotlib
epandas
- Aula 10 - Machine Learning com
Scikit-Learn
- Aula 11 - Regressão Linear com
Scikit-Learn
- Aula 12 - Regressão Logística com
Scikit-Learn
- Aula 13 - Support Vector Machines com
Scikit-Learn
- Aula 14 - Árvores de Decisão com
Scikit-Learn
- Aula 15 - Florestas Aleatórias com
Scikit-Learn
- Aula 16 - Análise de Componentes Principais (PCA) com
Scikit-Learn
- Aula 17 - Análise de Agrupamentos (Clusterização) com
Scikit-Learn
- Aula 18a - Redes Neurais com
TensorFlow
eKeras
- Aula 18b - Redes Neurais com
PyTorch
- Aula 19 - Redes Neurais Convolucionais com
PyTorch
Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:
- Pandas:
pandas.pydata.org
- Matplotlib:
matplotlib/cheatsheets
- Scikit-Learn: choosing the right estimator
- PyTorch:
pytorch.org
- Git: português ou inglês
- Machine Learning: diversas linguas em
afshinea/stanford-cs-229-machine-learning
e tambémremicnrd/ml_cheatsheet
- Markdown: sintaxe geral e sintaxe GitHub
- RegEx:
regex101.com
- GitHub: atalhos do teclado em português e inglês
A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:
- Leitura de dados com
pandas
- Manipulação e limpeza de dados com
pandas
- Descritivo e exploração de dados com
pandas
(groupby
s) - Figuras que mostrem insights sobre os dados com
pandas
ematplotlib
- Quebrar os dados em conjunto de treino e conjunto de teste
- Treinar um estimador do
scikit-learn
de aprendizagem supervisionada (regressor ou classificador) no conjunto de treino - Verificar o desempenho do estimador do
scikit-learn
no conjunto de teste
A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md
bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.
A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.
Para citar o conteúdo use:
Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados
Ou em formato BibTeX para LaTeX:
@misc{storopolisouza2020cienciadedados,
author = {Storopoli, Jose and Souza, Edson Melo de},
title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
url = {https://github.com/storopoli/ciencia-de-dado},
year = {2020}
}
Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).