Folders and files Name Name Last commit message
Last commit date
parent directory
View all files
장소 : 성동공업고등학교
일시 : 06.05(토) 13:00
학생들 성적 데이터를 활용한 등급예측 문제로 정확히는 기억 안나지만 1 ~ 11(?) 의 값을 맞추는 문제였다.
직관적으로 multiclass라고 생각하여 classifier로 접근함. but regressor로 푼 사람도 있다고 함.
간단한 EDA
결측치 식별하고 최소 2가지 이상의 결측치 예측 방법 제시 -> 그 중 하나로 보정하고 기준과 타당성 제시
인코딩 필요한 컬럼과 이유 제시하고 인코딩 수행
train test split 기법을 종류별로 설명하는 문제
RF, SVM, XGB 공통점 서술
최종 알고리즘을 선택하고 이유와 실제 업무에서 사용할 때 그 방법을 서술하라고 함.
feature수가 엄청 많은 regression 문제였다.
보자마자 차원축소가 떠올라 PCA로 차원을 축소한 후 regression을 함.
팔꿈치 그림으로 차원 수를 설정함.
Ridge, Lasso의 alpha를 변경해가며(0 ~ 1까지 0.1간격) 결정계수, RMSE, alpha 값을 보여주는 code를 함께 제출하라고함. -> for 문 돌려서 한꺼번에 출력시킴
일반 데이터를 3차항까지 만들어서 문제에 출시된 그래프와 동일한 형태로 그리는 문제 -> 솔직히 출제 의도를 모르겠다.
Polynomial 적용해 바로 그림
3번까지 풀고 이미 합격했다는 생각에 대충 풀고 냄.
일반 데이터를 주고 이원 배치 분산 분석 결과를 해석하라고함.
샘플링 방법들에 대해 간단히 설명하고 결과 해석해서 냈다.
지난 시험 보다 훨씬 쉬었다. 이래도 되나 싶을 정도로 쉬웠음
이제 R 보다 Python으로 준비하는 것을 응시생들에게 적극 권장하는 듯한 시험
역시나 자료는 가져가도 사용하지 않게 된다. -> 차라리 전날 푹자고 아침 일찍 일어나서 모의고사 한 번 더 푸는게 이득일 듯
90점은 넘을 줄 알았는데 77점 밖에 안돼 당황한 시험.
You can’t perform that action at this time.