- SIC: Samsung Innovation Campus
- IT/BD/IoT: là tên chương trình học
- Buổi học của chương trình
- Số file được tạo ra trong buổi học
https://www.youtube.com/playlist?list=PLdLdajKprVM_QgwexWpbIvQgTyhwXR3eI
- Tìm hiểu và ứng dụng KNN và Binary Classification
- Làm Web crawler
- Lọc tất cả file có #box_comments ra khỏi kích thước phần tử
- Lọc được giới sao trong web và trích xuất ra file.
- Lưu vào file với cấu trúc Date, Content, Source