"빅데이터 분석을 통한 상품 구매예측 알고리즘 완성"
평소에 빅데이터에 관심이 많았습니다. 빅데이터의 중요성과 다양한 활용분야에 적용된 사례들을 접하며 실제로 데이터를 다뤄보고 싶다는 생각이 들었습니다. 특히 방대한 양의 데이터를 분석하여 가치 있는 데이터를 선별해 정보화하는 과정이 무척 흥미로웠습니다. 이러한 흥미로 L.POINT에서 주관하는 빅데이터 공모전에 도전하여 실제로 데이터를 분석해보고자 했습니다.
좋은점 1
공모전의 주제는 고객의 구매내역 데이터를 분석하여 다음 연도 1월에 구매할 것으로 예상되는 상품을 추천하는 것이었습니다. 구매내역 데이터에서 고객의 선호상품을 예측할 수 있는 필드를 선별하기 위해 먼저 고객의 구매패턴에 대해 관찰하고 고민해보았습니다. 그 결과 구매 빈도수, 구매주기, 최근 구매일자 이 3가지 항목의 값이 필요하다고 생각했습니다. 이에 따라 구매내역 데이터에서 고객 번호, 상품코드, 구매 날짜 필드들을 선별해 분석했고 이를 통해 위의 3가지 항목의 값을 구해 상품을 추천하는 알고리즘을 작성했습니다. 해당 알고리즘은 상품별로 3가지 항목의 값을 구해 점수를 매긴 후, 항목별로 가중치를 달리하여 합산해 높은 점수의 상품부터 추천하는 방식이었습니다. 정확도를 측정하기 위해 전년도 동월에 고객이 구매한 상품과 추천한 상품이 어느 정도 일치하는지 계산했고 그 결과 90% 이상의 정확도를 구할 수 있었습니다. 아쉬운점 1
이러한 도전을 통해 완성도 높은 구매 예측 알고리즘을 작성할 수 있었고 실제로 빅데이터를 분석하여 마케팅 분야에 적용해보는 경험을 쌓을 수 있었습니다.
좋은점 1 해당 기업의 제품 및 솔루션과 연관된 분야의 소재라는 점이 좋습니다. 다만 빅데이터에 대한 관심이 많았다고 했는데, 공모전 사례 하나만 제시한 점이 아쉽습니다. 물론 가장 기억에 남는 대표적인 사례를 제시하는 항목이지만 이 부분에서 지원자가 빅데이터와 관련하여 했던 다양한 활동을 간략히 제시하는 것이 더 효과적입니다.
아쉬운점 1 구체적인 내용이 없어 이 경험의 가치를 판단하기 어렵습니다. 어떤 고객의 어떤 구매내역 데이터를 분석했는지, 고객의 구매패턴을 어떻게 파악을 했는지, 상품 추천 알고리즘은 무엇으로 만들었는지 등 구체적인 내용이 전혀 없고 막연한 설명만 있습니다.