• 3차보고서 작성(Deliverable 추가) 및 데이터 수집 시작 [ 빅데이터 캡스톤 디자인 진행 3편]

    2020. 5. 24.

    by. 규우웁

    반응형

     

     안녕하세요 오랜만에 포스팅하는 우당탕탕 기획 일기입니다. 그동안 프로젝트가 생각보다 진전이 되지 않고, 저도 나름대로 다른 일정들을 먼저 수행하느라 이제야 프로젝트가 다시 진행되고 있어서 지금에서야 포스팅을 하게 되었습니다.

     

     지난 시간까지는 1차보고서 작성 시에 포함한 NABCD 중에서 NAB와 관련된 내용을 어떻게 넣었는지, 보여드렸었는데요. 그 사이에 2차 보고서까지 제출 및 발표를 마무리하면서 Competition 부분까지 완성을 했습니다. Competition부분도 이번 포스팅에 넣어서 설명을 하려 했지만, 여러분도 아시다시피 경쟁사 분석은 어떤 기술보다는 얼마나 효과적으로 정보를 잘 찾아내냐의 싸움이기 때문에 여러분이 직접 하셔도 큰 차이는 없을 거라 생각합니다!

     

    3차 보고서 : 'D'eliverable 작성

     오늘은 3차보고서와 관련된 내용을 포스팅을 하려고 합니다. 3차 보고서에는 벌써 NABCD 기획의 마지막인 D에 대해서 작성을 하고 발표를 하면 되는 일입니다. 사실 대부분의 기획 방법에는 NABC기획 방법이라고 해서 C가 보통은 마지막인데요. 저희 교수님은 D를 추가해서 보고서를 작성하기를 바라셨습니다.

     

    Deliverable : 고객에게 어떻게 도달하고 있는 중인가? - 시제품 개발 진행상황

     먼저 보고서를 작성하기에 앞서서 NABCD 기획의 가장 마지막 단계인 'Deliverable'에 대해서 설명을 하자면

     단어의 뜻을 그대로 활용하자면, '전달가능성'입니다. 우리가 만드는 제품을 어떻게 어느 정도까지 전달할 수 있는가에 대한 부분을 작성해야 하는 것이죠. 따라서 쉽게 말하면 서비스나 제품을 어떤 방식으로 개발을 할 것인가에 대한 구체적인 진행상황을 작성하는 것입니다.

     

     예를 들어서 설명을 하면, 오랜만에 집에 빨리가는 방법의 예시를 다시 한 번 사용해보겠습니다. 집에 빨리 가는 방법이 지하철을 타는 것이 가장 빠르다면, 지하철을 타기 위한 방법과 노력의 과정이 Deliverable입니다. 지하철이 도착시간이 언제인지, 스마트폰 앱으로 확인한다 던 지, 빠른 환승 출입문에서 지하철을 탑승하는 방법 등이 바로 Deliverable입니다.

     

     그래서 지금부터 3차 보고서에 작성될 저희 팀의 Deliverable을 차례대로 보여드리려고 합니다.

     

    프로젝트 진행상황 (1) : 설문조사 배포 시작 및 데이터 수집 진행 중

     그럼 이제 본격적으로 3차보고서 작성에 대한 부분을 살펴보도록 할게요. 저희 프로젝트 주제가 '빅데이터 기반의 커피숍 창업자들을 위한 간편 솔루션'입니다. 따라서 고객 데이터를 수집하는 것이 필수적으로 필요했는데요. 기존의 나와있는 데이터는 고객기반이 아닌, 철저한 상권 중심의 데이터였기 때문에 고객 중심의 커피 전문점 데이터가 필요했습니다.

     

    설문조사 플랫폼 '오픈서베이' 결과 화면

     그래서 '오픈서베이'라는 설문조사 플랫폼을 활용하여 고객을 군집화할 수 있는 문항을 만들어서 드디어 배포를 시작했습니다! 원래는 지원금을 활용해서 외주를 맡겨서 더 많은 데이터를 수집하려고 했으나...예기치 못한 지원금 사용 규정으로 인해서 수동으로 열심히 돌리고 있습니다ㅠㅠ

     

     혹시나 설문조사에 응해주실 분들은 아래 링크에서 설문에 참여해주시면 감사하겠습니다...!

     

    카페, 커피 기호도 조사

    소비자의 카페, 커피 선호도 조사를 위한 설문입니다.

    ovey.kr

    위의 화면처럼 설문조사 결과가 즉각적으로 분석이 가능하도록 출력해주고 있지만, 분석을 하기 위해서는 데이터의 기준을 변화를 줘야하기 때문에 일일이 엑셀을 활용해서 형식을 변경을 해줘야 합니다.

     

    멀고도 험한 데이터 변형의 길

     너무 오랜만에 엑셀로 데이터를 만지는 거라 굉장히 낯설고 어색해서 조금 더 시간을 들여야 할 것 같습니다. 일단 3차 보고서가 최종보고서가 아니므로 프로젝트가 이런 식으로 진행되고 있다라는 것만 작성해야 할 것 같습니다.

     

     

     

     

     

    프로젝트 진행상황 (2) : 상권의 기본 분석을 위한 공공데이터 수집

     고객데이터는 설문조사를 통해서 수집이 가능하고 분석을 할 수 있지만, 어느 지역에 어떤 유형의 고객이 주로 유입이 되는지 알기 위해서는 공공 데이터를 활용해야 합니다. 다양한 공공데이터를 여기저기서 오픈해서 제공하고 있기 때문에 수집할 수 있는 자료는 많았지만, 활용하고자 하는 구체적인 데이터는 '지역 별 유동인구'에 관련된 데이터였습니다.

     

    skt에서 데이터 통신 기반으로 수집한 자료들을 제공하는 BigData Hub

     자료를 찾던 와중에 SKT에서 제공하는 'BigData Hub'라는 오픈소스 페이지가 있었습니다. Tmap, 통화 등 데이터 통신을 기반으로 사람들의 유동인구 데이터를 무료로 공개를 하고 있었습니다. 아쉽게도 서울 이외의 지역은 구할 수 없었습니다. 하지만 1,000만이 넘는 서울의 유동인구를 각 지역구 별로 날짜 및 시간대, 연령대, 성별로 나누어서 확인할 수 있다는 점만 해도 굉장한 부분이었습니다.

     

     일단 프로젝트는 최신 정보를 기반으로 제공하는 것을 목표로 하기 때문에, [2020년 4월 기준 서울시 유동인구 데이터]를 다운로드 하여 데이터를 변형하고자 했습니다.

     

    지역구 별로 다시 변형 진행 중인 유동인구 데이터

    SKT에서 제공된 유동인구 데이터는 시간의 순서대로 수집된 데이터기 때문에, 엑셀에서 다시 지역구 별, 성별, 연령대 별로 나누어서 데이터를 분류해야 하는 작업은 필요합니다.

     

     이럴 때 효과적으로 활용할 수 있는 방법이 바로 '피벗 테이블'인데요. 분석하고자 하는 분류기준만 작업하는 사람이 명확하게 안다면, 쉽게 열과 행을 나누어서 데이터를 다시 재가공할 수 있는 기능입니다. 

     

     프로젝트의 기준이 지역구의 주요 핵심 유동인구를 파악하고 핵심 유동인구의 고객적 성향을 출력하는 프로세스이기 때문에, 지역별 핵심유동인구를 한 번에 확인할 수 있도록 변형을 해줘야 하는 것이죠. 아직 완벽하게 진행되지 않고, 이것 역시 3차 보고서에는 작업이 여전히 진행 중이라는 표시만 보고서에 올라가고, 추가적으로 작업된 사항은 4차 보고서 또는 최종 보고서에 올라갈 계획입니다.


     지금까지 빅데이터 캡스톤 디자인 진행 3편인 NABCD 중에서 Deliverable과 관련된 프로젝트 작업 진행상황에 대해서 알아보았는데요. 저 같은 경우에는 아직 최종 보고서가 아니기 때문에, 작업의 현재 진행상황만 보고서 내용에 작성했지만, 만약 최종보고서에 Deliverable을 작성하시는 분들의 경우는 실제로 작업이 완료된 결과물을 보고서에 넣어서 시제품의 실제 시험 평가도 진행을 해본 결과까지 넣어야 합니다.

     

     저 역시도 다음 번 보고서부터는 실제 서비스를 돌려보고 오류 또는 데이터의 문제 등 다양한 피드백을 중심으로 Deliverable을 수정해서 보고서에 작성할 계획입니다. 혹시나 더 궁금하신 점 있으시면, 댓글 또는 인스타 DM 주시면 감사합니다. 저는 더 알찬 자료 준비해서 기획에 도움될 수 있는 포스팅으로 돌아오겠습니다. 그리고 4편 역시도 기대해주세요!

    반응형

    댓글