Data yang digunakan pada capstone project ini adalah data hasil scraping dari Google Playstore App. Data Google Playstore App terdiri dari beberapa variabe dengan rincian sebagai berikut:
App
: Nama aplikasiCategory
: Kategori aplikasiRating
: Rating keseluruhan yang diberikan oleh user aplikasi(ketika di scrap)Reviews
: Jumlah review yang diberikan oleh user aplikasi(ketika di scrap)Size
: Ukuran aplikasi(ketika di scrap)Installs
: Jumlah user yang menginstall/mendownload aplikasi(Ketika di scrap)Type
: Tipe aplikasi (berbayar/gratis)Price
: Harga aplikasi (ketika di scrap)Content Rating
: Kelompok usia aplikasi ini ditargetkan - Children / Mature 21+ / AdultGenres
: Genre aplikasi.Last Updated
: Tanggal kapan aplikasi terakhir diperbarui di Play Store (ketika discrap)Current Ver
: Versi aplikasi saat ini tersedia di Play Store (ketika discrap)Android Ver
: Minimum versi Android yang diperlukan (ketika discrap)
- Flask
- Matplotlib
- Pandas
- Numpy
Semua modul tersebut dapat Anda install dengan cara :
pip install -r requirements.txt
Pada capstone ini, Anda diharapkan untuk dapat membangun sebuah aplikasi Flask yang fokus pada tampilan user interface. Langkah pertama yang harus Anda lakukan adalah silahkan download atau clone repositori ini. File pada repositori ini merupakan sebuah skeleton untuk membuat sebuah dashboard aplikasi Flask. Pada bagian app.py
dan templates/index.html
ada beberapa bagian yang rumpang dan harus Anda lengkapi. Beberapa bagian yang harus diperhatikan adalah sebagai berikut:
- Repository
a. Membuat repository baru di Github
b. Clone repository tersebut ke local dengan git clone
- Environment
a. Created virtual environment called "capstone-flask"
Hal pertama yang harus dilakukan adalah melakukan pengaturan environment conda. Untuk menyiapkan conda environment dan kernel, silahkan gunakan command berikut:
conda create -n <ENV_NAME> python=3.7
conda activate <ENV_NAME>
conda install ipykernel
python -m ipykernel install --user --name <ENV_NAME>
b. Install packages: pandas, flask, matplotlib, dan numpy Seluruh dependecies telah di-export ke dalam file requirements.txt. Oleh karena itu untuk melakukan install packages, Anda dapat menggunakan perintah berikut:
pip install -r requirements.txt --user
Pada tahap praproses ini, Anda diminta untuk melengkapi praproses data seperti menghapus data yang duplikat, mengubah tipe data dan memodifikasi nilai data. Pada file app.py
Anda diminta untuk melengkapi data yang rumpang tanpa mengubah alur praproses yang telah ada.
Berikut ini contoh bagian yang harus Anda lengkapi saat praproses data:
playstore._________(subset ="_____", keep = '_____', inplace=True)
playstore.drop([10472], inplace=True)
# Buang tanda koma(,) dan tambah(+) kemudian ubah tipe data menjadi integer
playstore.Category = playstore.Category.astype('category')
playstore.Installs = ________.apply(lambda x: x.replace(______))
playstore.Installs = ________.apply(lambda x: x.replace(______))
- Pada tahap ini Anda diminta untuk melakukan grouping dan agregasi data. Data wrangling digunakan untuk menyiapkan data yang tepat sesuai analisis yang diminta. Pada capstone ini terdapat objek dictionary dengan nama
stats
dan Anda diminta untuk melengkapi bagian yang rumpang agar menghasilkan data/nilai yang sesuai. Sebagai gambaran pada objekstats
terdapat variabelrev_tablel
dimana Anda harus melakukan grouping dan agregasi data yang digunakan untuk membuat data table seperti di bawah ini:
- Membuat atau menduplikasi bar plot yang menggambarkan top 5 Category pada Google Playstore
- Membuat atau menduplikasi scatter plot yang menggambarkan sebaran aplikasi jika dilihat berdasarkan Review, Rating, dan jumlah aplikasi yang terinstall.
- Membuat atau menduplikasi histogram plot untuk melihat distribusi ukuran aplikasi
- Membuat 1 plot tambahan bebas yang dapat merepresentasikan insight di dalam data
*Notes : Anda dapat melihat contoh plot lain yang hraus dibuat/diduplikat pada repositori ini. Silahkan clone/download repositori ini.
Mengacu pada poin ke empat Data Visualization di atas, selain membuat plot baru Anda harus mendemonstrasikan bagaimana cara merender plot tersebut pada aplikasi Flask dan menampilkannya pada templates / halaman html. Yang perlu Anda perhatikan adalah pada bagian app.py
:
render_templates(__________)
dan pada templates/index.html
Anda perlu memanggil source plot.png tempat Anda menyimpan gambar plot tersebut.
<img src="________________________" height="450" width=500>