Este é um projeto de machine learning para análise de dados de vendas de carros, com informações de clientes e valores pagos pelos veículos, os dados foram disponibilizados na plataforma Kaggle.
O caso proposto e o problema a ser solucionado: "Você está trabalhando como cientista de dados em uma empresa automobilística. Você gostaria de desenvolver um modelo para prever o valor total que os clientes estão dispostos a pagar pelo carro novo. Essas informações serão utilizadas pela empresa para fazer o marketing direcionado com base no perfil do cliente."
Sobre o conjunto de dados: "Este arquivo contém as informações das várias pessoas com os seguintes detalhes que podem nos ajudar a descobrir a melhor previsão e também nos ajudar a treinar nosso modelo para prever o valor correto e obter um bom F1 Score."
- Analisar a correlação dos dados dos clientes com os valores de compra de carros.
- Gerar um modelo preditivo para o valor que um cliente está disposto a pagar por um carro novo.
- Simular novas entradas de dados e previsão de valor a pagra por um carro novo.
- Análise das medidas estatísticas dos dados
- Distribuição dos dados entre as variáveis independentes (features) e dependente (target)
- Correlação entre as variáveis
- Criação do modelo de regressão linear múltipla
- Separação dos dados de treino e teste
- Treinamento do modelo
- Predições do modelo com dados de teste
- Resíduo, diferença entre dados de teste e dados previstos
- Métricas de performance
- Previsões com novos dados
- Python
- Biblioteca GC
- Biblioteca Pandas
- Biblioteca Matplotlib
- Biblioteca Seaborn
- Biblioteca Numpy
- Biblioteca Warnings
- Biblioteca Tabulate
- Biblioteca SciKit-learn
Licença MIT (MIT). Por favor leia o arquivo da licença para mais informações.