Predicting Machine Failures with Distributed Computing (Spark, AWS EMR, and DL)

This repo contains an example implementation for training a deep learning model to predict machine failures on a training set that wouldn't fit on a single machine. Distributed data wrangling and model training is done by using Spark and Spark's ML library. AWS EMR service is used to create a cluster and run the Spark job.

The article is here.

Tags: spark, pyspark, aws, emr, bigdata, deeplearning, digitaltransformation

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
dataset.md		dataset.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Predicting Machine Failures with Distributed Computing (Spark, AWS EMR, and DL)

About

Releases

Packages

Languages

License

musa-atlihan/spark-pm

Folders and files

Latest commit

History

Repository files navigation

Predicting Machine Failures with Distributed Computing (Spark, AWS EMR, and DL)

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages