Este projeto visa analisar dados climáticos de estações meteorológicas públicas utilizando PySpark e Pandas, com o objetivo de fornecer insights úteis sobre padrões e tendências climáticas.
data/
: Contém os dados brutos coletados das estações meteorológicas.notebooks/
: Notebooks Jupyter para exploração e análise dos dados.scripts/
: Scripts Python para processamento e análise de dados.visualizations/
: Dashboards e gráficos gerados a partir da análise de dados.
- Clone este repositório:
git clone [link do repositório]
- Navegue até o diretório do projeto:
cd nome-do-repositorio
- Crie um ambiente virtual e ative-o:
python -m venv venv source venv/bin/activate # Linux/MacOS .\venv\Scripts\activate # Windows
- Instale as dependências:
pip install -r requirements.txt
- Crie um arquivo
.env
no diretório raiz e adicione sua chave API:API_KEY=sua_chave_de_api
- Execute o script de processamento de dados:
python process_data.py
- Abra os notebooks Jupyter para explorar e analisar os dados:
jupyter notebook
- Visualize os gráficos e dashboards na pasta
visualizations
.
Contribuições são bem-vindas! Por favor, abra um pull request ou reporte um problema.
Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE
para mais detalhes.