🚀 机器学习

1939323749 · Jun 29, 2020 · 4b0a191 · 4b0a191
1 parent e4699b9
commit 4b0a191
Show file tree

Hide file tree

Showing 14 changed files with 121,642 additions and 2 deletions.
diff --git a/数据库系统原理/GTKiller_linux.zip b/数据库系统原理/GTKiller_linux.zip
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/__init__.py b/机器学习/结课项目/疫情期间网民情绪识别/covid19/__init__.py
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/bosonnlp/BosonNLP_sentiment_score.txt b/机器学习/结课项目/疫情期间网民情绪识别/covid19/bosonnlp/BosonNLP_sentiment_score.txt
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/main.py b/机器学习/结课项目/疫情期间网民情绪识别/covid19/main.py
@@ -1,2 +1,50 @@
-import json
-print("alex")
+# coding=utf-8
+import pandas as pd
+import jieba
+import numpy as np
+from snownlp import SnowNLP
+from snownlp import sentiment
+import pandas as pd
+import numpy as np
+import jieba
+
+def GetScore(line, score, key):
+    segs = jieba.lcut(line)
+    score_list = [score[key.index(x)] for x in segs if (x in key)]
+    # print(segs)
+    return sum(score_list)
+
+
+BosonNlpScore = pd.read_csv("bosonnlp//BosonNLP_sentiment_score.txt", sep=" ", names=['key', 'score'])
+key = BosonNlpScore['key'].values.tolist()
+score = BosonNlpScore['score'].values.tolist()
+
+sentiment.train('train&test/neg.txt','train&test/pos.txt')
+sentiment.save('/Users/alexfan/anaconda3/lib/python3.7/site-packages/snownlp/sentiment/sentiment.marshal')
+
+'''
+获取test.csv中所有的舆论
+'''
+test = pd.read_csv("train&test/test.csv")
+# print(test)
+test_list = test.values.tolist()
+test_str = []
+for i in test_list:
+    test_str.append(i[0])
+
+'''
+获取test_label.csv的最终结果标识
+'''
+test_label = pd.read_csv("train&test/test_label.csv")
+test_label = test_label["情感倾向"].values.tolist()
+
+result = []
+for comment in test_str[0:100]:
+    #comment_predict = int(GetScore(comment, score, key))
+    # if(comment_predict>0):comment_predict=1
+    # if(comment_predict<0):comment_predict=-1
+    comment = SnowNLP(comment)
+    result.append(comment.sentiments)
+
+print(test_label)
+print(result)
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/splitNegPos.py b/机器学习/结课项目/疫情期间网民情绪识别/covid19/splitNegPos.py
@@ -0,0 +1,34 @@
+# coding=utf-8
+import pandas as pd
+import jieba
+import numpy as np
+
+all = pd.read_csv("train&test/train.csv")
+
+pos = all.loc[all['情感倾向']==1]
+pos = pos['微博中文内容'].values.tolist()
+
+neg = all.loc[all['情感倾向']==-1]
+neg = neg['微博中文内容'].values.tolist()
+
+mid = all.loc[all['情感倾向']==0]
+mid = mid['微博中文内容'].values.tolist()
+
+file = open("train&test/pos.txt",'w');
+for comment in pos[0:1000]:
+    file.write(comment)
+    file.write('\n')
+file.close()
+
+file = open("train&test/neg.txt",'w');
+for comment in neg[0:1000]:
+    file.write(comment)
+    file.write('\n')
+file.close()
+
+file = open("train&test/mid.txt",'w');
+for comment in mid:
+    file.write(comment)
+    file.write('\n')
+file.close()
+
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/test.py b/机器学习/结课项目/疫情期间网民情绪识别/covid19/test.py
@@ -1,4 +1,6 @@
+# coding=utf-8
 def main():
     print("Welcome Back,Alex Fan")
+
 if __name__ == '__main__':
     main()
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/mid.txt b/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/mid.txt
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/neg.txt b/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/neg.txt
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/pos.txt b/机器学习/结课项目/疫情期间网民情绪识别/covid19/train&test/pos.txt
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/test.csv → ...项目/疫情期间网民情绪识别/covid19/train&test/test.csv b/机器学习/结课项目/疫情期间网民情绪识别/test.csv → ...项目/疫情期间网民情绪识别/covid19/train&test/test.csv
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/test_labled.csv → ...间网民情绪识别/covid19/train&test/test_label.csv b/机器学习/结课项目/疫情期间网民情绪识别/test_labled.csv → ...间网民情绪识别/covid19/train&test/test_label.csv
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/train.csv → ...目/疫情期间网民情绪识别/covid19/train&test/train.csv b/机器学习/结课项目/疫情期间网民情绪识别/train.csv → ...目/疫情期间网民情绪识别/covid19/train&test/train.csv
diff --git a/机器学习/结课项目/疫情期间网民情绪识别/题目描述.pdf b/机器学习/结课项目/疫情期间网民情绪识别/题目描述.pdf
diff --git a/编译原理/README.md b/编译原理/README.md
@@ -58,6 +58,16 @@ FLEX BISON
 
 
 ### 实验三 ：中间代码生成与优化
+ - [x] (1)中间代码结构；
+ - [x] (2)基本快划分；
+ - [x] (3)DAG构造；
+ - [x] (4)代码优化算法；
+
 
 ### 实验四 ：目标代码生成
 
+- [x] (1)指令系统选择；
+- [ ] (2)寄存器分配算法；
+- [ ] (3) AR结构；
+- [x] (4)目标代码生成；
+- [x] (5)自己的CPU上运行增加项