"산업시스템공학과에서 배운 데이터 관련 전공 이수"
파이썬, 자바, 자료구조론, 데이터베이스, 통계, R, 생산관리, 품질관리 등을 수강하였습니다. 특히 졸업 발표에서는 148,646개의 레코드와 11개의 컬럼이 있는 '2020년 전국 한 해 아파트 구매 관련 데이터'전처리 시각화 및 머신러닝 기반의 예측 하여 플라스크 웹에 올려놓는 프로젝트를 2달 간 진행하였습니다. EDA와 시각화, 그리고 ML의 LinearRegression과 Ridge, Lasso, ElasticNet 규제를걸고 GridSearch CV를 사용해 최적의 파라미터 모델을 찾는 과정을 진행하였으며, 추가로 트리모델 XGBoost나 LightGBM을 수행해본 결과도 나타내었습니다.
"데이터리안 SQL 데이터 분석 캠프 2개월 과정 수료"
22년 3월부터 4월까지 RFM, 코호트, Funnel 분석 등 다양한 분석 기법을 SQL 기반으로 배웠습니다. 그 중 RFM 분석을 같은 기수 동료들과 스터디를 만들어 각자 프로젝트를 진행하였습니다. 데이터 셋은 캐글의 'United States E-Commerce records 2020'을 사용하였으며, 데이터리안 측에서 웹으로 제공한 solvesql을 이용해 SQL로 데이터를 추출하며 해당 프로젝트를 수행하였습니다. 프로젝트 데이터 셋을 draw.io를 이용해 E-R 모델을 그려보고, EDA, RFM Segmentation, Action Item을 위주로 생각을 해보고 벨로그에 작성하였습니다.
"OOOOOO OOOOO OOOOOOO 스쿨 부트 캠프 6개월 과정 수료"
4월 25일 부터 6개월 간 해당 과정을 통해 파이썬 기초, 자료구조 알고리즘, EDA, MySQL, 태블로, 머신러닝과 딥러닝등을 익혔습니다. 마지막 한 달간의 머신러닝, 딥러닝 프로젝트로 '시험 문제 유사 문제 찾기' 를 맡았으며 자연어 처리와 유사도 분석을 공부했습니다. 해당 프로젝트에서 자연어 처리 카운터 기반의 벡터화와 유사도 방법에 대한 종류와 이론을 학습할 수 있었습니다.