GitHub - thua101/ukraine-conflict-tweets-sentiment-analysis-Recommandation-System

Data: Tweets monitoring the current ongoing Ukraine-Russia conflict.

Keywords:

What exactly did I do?

Around 1 million tweets were posted between 17 Mar and 18 Mar about Ukraine Conflict, I converted them into Feather File Format for faster processing speed, and less ram usage.
I used certain text mining techniques, including tokenization, sentiment analysis, emoji cleaning and converting, keyword visualization (wordcloud maps), and ordinary exploartion (location, time distributions of those tweets).
I also built a recommendation system for recommending 10 most sentimentally alike tweets based on cosine similarity.
I applied most popular classifier methods (including SVM, random forest, decision tree, naive bayes, gradient boost and xgboost) to build predictive models that predict the sentiment of the tweets, and SVM model provides the best accuracy (99%).

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
README.md		README.md
Ukraine Conflict Twitter - Sentiment AnalysisRecommandation based on Cosine SimiliarityCross Validation with Muliple Classification Techniques (98% ACC).ipynb		Ukraine Conflict Twitter - Sentiment AnalysisRecommandation based on Cosine SimiliarityCross Validation with Muliple Classification Techniques (98% ACC).ipynb
Ukraine Conflict Twitter - Sentiment AnalysisRecommandation based on Cosine SimiliarityCross Validation with Muliple Classification Techniques (99% ACC).pdf		Ukraine Conflict Twitter - Sentiment AnalysisRecommandation based on Cosine SimiliarityCross Validation with Muliple Classification Techniques (99% ACC).pdf

Provide feedback