KDX 소비트렌드 시각화 대상 후기 Part 1

11 minute read

이번에 좋은 취지로 공모전에 참여했다가 좋은 결과도 함께 얻게 되어 기쁜 소식에 대한 소감을 남기지 않으려야 않지 않을 수가 없을 수가 없었다. 참여 기간은 아주 짧은 기간이었지만 개인적으로 느낀 점이 정말 많아서 참여 과정공모전 내용으로 파트를 나누어 후기를 써보려 한다.


우앙 뉴스 나와써여

결론부터 얘기하자면 대상을 타게 되었다. 솔직한 심정으로는 대상을 예상하고 참여하지 않았지만, 대상을 받게 되어 기쁜 건 사실이다. 하지만 항상 결과물은 아쉽고 부족한 점이 많아서 (실제로도 더 해보고 싶은 게 많았지만 그럴 시간이 부족했다) 좋게 봐주었다는 사실에만 감사히 생각하고 상을 받았다.

참여 계기

긴 시간 데이터 분석이나 개발과 동떨어진 삶을 살면서 한참 집중하며 연구하고 종일 노트북만 보며 고민하던 시기가 많이 그리웠었다.. 슬슬 올 한 해 나의 앞길도 정해지고 내년에 가야 할 길도 어느 정도 준비가 된 시점이었기에 다시 나를 채찍질하며 원래 삶으로 돌아갈 때가 되었다고 느꼈다.

마침 데이터 분석과 통계에 관심이 있어 하는 분이 있어서 단기간에 스스로에 대해 많이 느낄 수 있고 경험할 수 있는 공모전으로 경험을 가짐과 동시에 나는 다시 실컷 고민하고 코딩을 할 수 있는 시간을 가지기로 했다.

연말에는 매년 공모전들이 물밀 듯이 쏟아져 나온다. 특히나 올해는 코로나 때문에 예산이 많이 남아서 그런지 코로나 관련된 주제로 지역 활성화 아이디어, 소비 트렌드 변화와 같은 대회가 많았고 최근 데이터 뉴딜 사업이라며 여러 공공데이터 플랫폼 사업이 일어나면서 공공 데이터를 활용한 빅데이터 해커톤 같은 대회가 많았다. 대충 찾아봐도 9개 정도 있었는데 더 찾아보면 훨씬 더 많았을 것이다…

처음에는 경기지역 활성화 아이디어 경진 대회KDX 소비 트렌드 시각화 공모전을 둘 다 참여할 생각이었다. 당연 큰 상을 목적으로 하는 것이 아니라 단지 오랜만에 데이터를 보고 고민하는 시간을 가진다는 것과 오랜만에 여러가지 방법들을 적용해보고 결과를 만들어 보고 싶다는 생각이었다. 사실 두 대회가 각각 제출 기간이 10월24일(토), 10월25일(일)이 었기에 우리가 시작한 날짜가 10월 17일(토)였다는 것을 감안하면 고작 일주일되는 기간 동안 좋은 결과를 기대를 하며 접근하는 것도 욕심이었다.

지역 활성화 아이디어 공모전

우선 경기지역 활성화 아이디어 경진 대회를 빠르게 마무리하고 KDX 공모전으로 넘어갈 계획이었다. 지역 활성화는 올 한 해 가장 큰 걱정거리가 아닌가 싶다. 내 친척들도 모두 자영업을 하기 때문에 코로나로 받은 여파가 이만저만이 아니기에 더욱 공감이 되었다. 하지만 이런점을 해결해 줄만한 개선책이 많지 않은 것도 사실이다.

[지역 활성화 캠페인 사례]

이와 관련된 공모전을 찾아봤을 때 두 가지 정도 사례가 있었는데 하나는 한국전력기술(한전)이고 다른 하나는 오산시에서 열었던 지역 활성화 공모전이었다. 각각 수상작들에 대한 내용이 공개되었는데 특별히 정말 좋은 아이디어다! 라고 느껴지는 건 없었다. 한전에서 열었던 수상작 중 하나는 사내에서 운영하는 식재료를 지역 내에서 생산하는 식료품 위주로 사용하자는 것이었다1. 오산시에서 열었던 공모전 수상작 중 하나는 홍보개체를 현수막이나 여러 전단지가 아닌 카카오톡을 활용한 오산시 채널을 개설하자는 것이었다2.

이미 이전에 수상했던 작품들을 배경으로 아이디어를 구성하기란 쉽지 않았다. 뭔가 괜찮다! 생각되는 아이디어도 아니었기에.. 다른 방식으로 접근하고 싶었다. 최근 기사들을 보며 아이디어를 찾아보는데 웬만큼 괜찮다? 라고 생각된 것들은 이미 잘 진행이 되고 있었다. 이번 코로나 시점에 지역 화폐가 활성화되는 걸 보면 이만큼 괜찮은 사업도 없어 보였다. 물론 단점도 있지만 현재로서는 지역 활성화에 가장 큰 도움을 주는 사업이 아닌가 싶었다. 다음으로는 최근 도보 배달 관련해서 막 사업이 일어나고 있었다. 작년부터 엠지플레잉의 ‘도보 60’이 시행되고 있었는데 지난 10월 GS에서도 ‘우딜(우리동네 딜리버리)’이라는 사업으로 시행하고 있었다. 뭔가 우버같이 배달을 주제로 사업화해도 괜찮겠다 싶었지만 역시나 ‘우버이츠’가 이미 있었다. 하지만 ‘쿠팡이츠’의 무서운 행보에 결국 한국에서 철수하게 되었다3.

[빠른 결단력 이코르 포기]

3일 정도 이런저런 자료들을 팀원과 함께 찾아보며 아이디어를 떠올려봤지만 좋은 아이디어가 전혀 생각나지 않았다. 게다가 아이디어를 기반으로 사업성까지 고려해서 점수를 매기니 택도 없었다 ㅎㅎ.. 벌써 기간은 21일이 되었고 남은 기간이 며칠 남지 않은 시점에서 더 길게 끌었다가는 둘 다 놓치겠다 싶어서 빠른 포기를 결정했다. 때로는 빠른 포기가 정신 건강에 이롭다. 이게 바로 정신승리

과정

[KDX 한국데이터거래소란?]

잠깐 간략하게 KDX에 대해 적어두자면, KDX 한국데이터거래소는 올해 새롭게 생긴 데이터 공유 플랫폼이다.

KDX 시작

21일 밤이 되어서야 이제 KDX에 대해 공모전 개요를 다시 읽어보며 어떻게 접근할지 고민했다. 많은 공모전 중에서 KDX를 골랐던 이유는 제한된 분석 환경이었다. 다른 때 같았으면 분석 환경에 제한이 있다는 얘기에 아쉬움이 컸을 텐데 시간이 얼마 남지 않았던 우리에게는 좋은 소식이었다. 분석은 KDX에서 제공하는 서버 환경의 R studioJupyter Notebook 만 사용할 수 있었는데 시각화 공모전이라기엔 너무나 제한적일 수밖에 없었다. 때문에 오랜 기간 분석해도 저 두 IDE로만 시각화하는 데에는 제한이 있을 수밖에 없었다. 그래서 비교적 경쟁력이 있을 거라 생각되어 참여할 생각이 들었다.

시각화 툴에는 Tableau, Microsoft Power BI, 그리고 Qlik 등 정말 좋은 것들이 많다. 이러한 툴을 사용하게끔 하는 것이 더 좋은 결과를 받을 수 있을 텐데 라는 주최 측에 대한 아쉬움이 있었다.

처음엔 R studio로 할까 고민도 했었지만 결국 jupyter notebook을 사용했다. R studio에서 할 수 있는 markdown 형식의 리포트도 좋고 flexdashboard를 활용해도 좋고.. shiny를 써도 이쁜 대시보드를 구성할 수 있긴 했다. 하지만 R을 손 놓은 지 오래된 지금… 문법을 다시 찾아가며 하기엔 시간이 부족해서 평소 익숙한 python을 사용해서 jupyter notebook을 쓰기로 했다. 물론 R studio에서도 python을 쓸 수 있지만, 예전에 사용해보는 과정에서 겪었던 스트레스로 인해 내 몸이 그걸 거부했다.

이번 대회에서는 KDX에서 공유된 데이터를 활용해야 했고 필요에 따라 다른 공공 데이터를 사용해도 괜찮았다. 대회 참여를 위해 21일부터 22일까지 여러 공공데이터를 찾아봤다. 하지만 2020년도 소비 관련 데이터가 거의 없었다. 있다 해도 굉장히 단편적이었고 다른 데이터와 병합해서 사용하기도 부적절해서 아쉬움이 많았다. 얼마 전 DNA 팀원들이 참여했던 데이콘의 ‘포스트 코로나 데이터 시각화 경진대회’ 에서 제공하는 데이터가 정말 괜찮아 보였지만 아쉽게도 외부적으로 활용이 불가능했었다.

참가 신청

23일이 되고는 쓸만한 데이터가 없어서 고민이 정말 많았다. 그래도 찾았던 데이터 중 병합해서 사용할 만한 것들로 구성해서 해봐야겠다 싶은 찰나에 공모전 공지를 다시 보니…

음..? 아니 뭐지… ㅎㅎ 좋은 데이터가 있었다… 근데 이상하게도 분명 KDX 내에서 찾았을 때 저런 데이터는 없었다!! 정말 꼼꼼하게 봤는데… 그런데 사실 알고 보니 참가 신청을 하면 서버에 접근할 수 있는 계정을 주고 그 안에 데이터가 들어있던 것이었다.. ㅎㅎ 저런 양질의 데이터를 두고 지금까지 했던 수고는 무엇인가… 서둘러 참가 신청을 해서 계정을 받아야 했다.

그런데… 참가 신청을 하려니 참가자 구분에 대학생/구직자/재직자 선택 칸이 있었다. 우리 팀에서 함께 참여하는 우리 팀원은 대학생이고… 나는 구직자에 속하는데 무엇을 선택해야 맞는 건지 몰라서 문의 전화를 했다. 답변은 “담당자가 없어서 문의 내용 확인 후에 연락드리겠습니다.”였다. 그리고 연락은 그날 오지 않았다. 후후… 금요일이 왔다. 그냥 아무거나 선택해야 맞나 싶지만, 혹시나 잘못 선택한 경우 실격이 되지 않을까 걱정돼서 다시 금요일날 전화를 했다. 역시나 “담당자가 자리에 안 계셔서…” … 물어봤다. 아래 내용은 정확하게 통화 당시 말한 그대로는 아니다.

  • : “담당자분 언제 자리에 계시는 걸까요..?”
  • KDX: “외부 행사 때문에 바쁘셔서 자리에 계시기 힘드신 거 같아요.”
  • : “오늘도 참가 신청이 안 되면 내일은 주말이라… 이거 확인만 빨리 부탁드리면 안 될까요..?”
  • KDX: “네 바로 확인하고 연락드릴게요!”
  • : “확인 부탁드립니다ㅠㅠ 엉엉 참가하고 싶어여어어어어”(물론 이러진 않았다)

다행히 바로 연락을 주셨고 큰 상관은 없는 거 같았다. 첨에 참가자 구분이 따로따로 심사를 받는 걸까 싶었는데 공지에 그런 얘기가 없었듯이 단순히 참가자 정보를 얻기 위한 것이었다. 그래도 꼼꼼해서 나쁠 건 없으니까! 하루 지체되었다는 건 나쁘지만…

그렇게 23일(금) 밤이 되어서 카페로 향했고 2박 3일간의 긴 여정이 시작되었다.


정신과 시간의 방으로 출동! 거울은 좀 닦고 살자

분석 시작

[23일]

낙성대 오렌지 카페는 낙성대역에서 바로 몇 미터 떨어지지 않은 곳에 있는 스터디 카페다. 카페 형식은 다른 일반 카페와 다름이 없는데 차이점이라면 24시 운영과 노래를 틀지 않는다는 것이다. 그래서인지 조용한 분위기에서 공부하고 싶어하지만 꽉꽉 막힌 분위기에서 공부하기를 싫어하는 사람들이 많이 모여있다. 더욱이 작업에 집중하기 좋은 점은 조금 시끄럽게 떠든다 싶으면 사장님께서 오셔서 제지해주신다는 점이다. 덕분에 수다 떠시는 분들은 OUT.


카페에서 바라보는 저녁엔 노을과 달이 정말 이쁘게 보인다

카페에 앉아서 받은 계정으로 서버에 접속해보고 데이터 설명과 함께 어떤 식으로 분석할지 쭉 고민해봤다. 이때가 정말 신기하면서도 내가 그동안 헛살았던 건 아니구나고 생각이 들었던 시점이었다. 데이터를 보며 ‘음 데이터는 이렇게 써보고, 그래프는… 음 이런 게 좋으려나. 음 대시보드 구성을 이렇게 하고, 표현은 조금 더 이런 식으로 해주는 게 좋을 거 같고, 스토리는 이렇게 전개하면 괜찮겠다. 군집끼리는 이렇게 표현해주는 게 더 한눈에 비교하기 쉬울 거 같고, 역시 소비 트렌드 관련이니까 시계열 자료를 이렇게 묶어주는 게 좋겠지. 그리고 이후 제안 방향으로는 이전에 찾았던 이런저런 데이터랑 엮어서 표현하면 음… 뭐야 완벽한데? 이제 구현만 하면 되겠다.’ 였다. 뭔가 입코딩 처럼 입분석하고 있네 ㅎㅎ 싶었을 수 있지만 그럴 것도 없는 게 이미 이전에 해본 것들이 있어서 충분히 구현 가능한 범위내에서 구체적으로 잘 그려졌다. 너무나 신기했고 이런 이유로 헛산 게 아니었나 라는 생각이었다.

시각화 공모전 관련해서는 이전에 얻은 경험들이 도움이 많이 되었다. 이전에 경험했던 것들이라 하면 요정도가 있었다.

  • 데이콘의 ‘KCB 금융스타일 시각화 경진대회’ 에 참가하며 아쉬웠던 점들
  • 데이콘에서 일하며 수십 팀의 결과물을 보며 들었던 느낌
  • 같은 DNA 팀의 시각화하는 팀원에 대한 결과물들
  • 빅콘테스트에서 보았던 발표들

누군가에겐 작은 경험처럼 느껴질 수 있지만, 나에겐 충분히 내가 해야 할 방향성에 대해 빠르게 구상할 수 있는 경험이었다. 분석과 시각화 내용에 대한 얘기는 part 2 에서 이어서 작성할 계획이다.


탄수화물 없이는 이 새벽을 버틸 수 없지..

문제는 항상 생각하지 못한 범위에서 발생했다. 착착 진행될 줄 알았는데 생각보다 시간이 사소한 곳에서 엄청나게 딜레이 되었다. 분명 구상한 것들을 구현하는 데는 시간이 그렇게 오래 걸릴 일이 없었다. 데이터가 엄청 큰 것도 아니고 충분히 짧은 시간 내에서 구현할 수 있는 범위로 생각했기 때문에 오래 걸릴 이유가 없었는데 문제는 분석 환경이었다. 아무래도 로컬에서 작업하는 게 아니라 이것저것 설치해야 할 것도 있었고 설치 과정에서 일어나는 오류들, 한글 문제, 그리고 원하던 시각화 방법이 안 되는 것까지 참 탈이 많았다. 적어도 하루 전에는 피피티 작성을 시작하자고 했지만, 시간이 지체되어 결국 둘째 날 시작할 수 없었다.

[24일]

우선 새벽 동안 생각하던 것들을 구상하며 다음 날 아침 일찍 올 팀원에게 같이 해야 할 일을 정리하고 있었다. 아침이 되어 팀원님께서 오고 각자 필요한 역할을 정리한 후 다시 작업을 이어갔다.


든든한 팀원의 뒷모습

저녁이 되자 다시 에너지 보충을 위해 간만에 유가네 닭갈비를 들려서 밥을 먹고 다시 작업을 시작했다. 함께한 팀원은 밤을 새우는 게 불가능 했기에 늦은 시간까지 함께 작업을 마무리하고 귀가했다. 다행히 분석 과정이랑 그래프 정리는 어느 정도 마무리가 되어가고 있어서 다음 새벽이면 다 끝날 것 같았다.


역시 새벽을 시작하기 전에 탄수화물을 보충해줘야 한다.

[25일]

마지막 날 아침이 되어서야 드디어..!! 피피티를 시작하게 되었다. 피피티를 작성하는 데 시간이 얼마나 걸릴지 예상할 수 없었다. 나는 원래 피피티 양식을 가져다 사용하는 편이 아니었다. 이쁜 피피티도 중요하지만, 핵심은 내용 전달이 얼마나 빠르게 되는지흐름이 잘 이어가는지 라고 생각하기 때문에 겉으로만 번지르르한 이미지나 색상 구도는 나중에 생각할 문제라 생각한다.


아침이 밝아오는 바깥이 보인다. 거의 무박 숙소같은 느낌

여러 발표자료를 보면서 드는 생각은 우선 자료의 구성이 일관되어야 한다는 점이다. 여기저기 사방팔방 내용이 뿌려져 있고 슬라이드 핵심 내용이 안 적힌 발표 자료는 보기도 어렵고 내용이 길어질수록 이전 슬라이드를 반복하며 왔다 갔다 보면서 이해해야 하는 경우가 많다. 그 때문에 나는 항상 보조선을 엄청나게 많이 사용한다.

이틀이라는 시간이 많지는 않았기 때문에 간단한 방법을 사용하면서 조금씩 그래프에 아이디어를 추가하고 지금부터는 하나씩 이미지를 따내며 구성하고 결과에 대해 하나씩 서술해 나갔다. 마감일(25일) 자정까지가 제출 기한이었지만 3시쯤 지나고 나서는 마음이 굉장히 촉박했다. 사실 하고 싶은 분석 방법이나 사용하고 싶은 데이터도 더 있었기에 다 하지 못한다는 아쉬움에 더 촉박했던 것 같다. 때문에 우선 피피티까지 완성하고 그 뒤에 시간이 남으면 이어서 붙여가며 하려고 했는데 결국 못했다…

저녁 8시가 지나서야 결론까지 마무리하게 되었고 결과를 팀원과 같이 공유하고 추가로 피드백 받은 내용을 수정하며 밤이 다되어서야 제출했다. 드디어.. 오렌지 카페를 이틀 만에 탈출 할 수 있었다. 오렌지 카페에 온지 얼마나 오렌지…


제출 마감!!

이틀이 정말 금방 갔다. 집중도 너무 잘됐고 재밌었다. 오랜만에 하루종일, 이틀종일인가 어쨌든 시간 가는 줄 모르고 생각하고 있는걸 구현해나가는 그 느낌은 정말 재밌다.


마지막 인사. 수고했다!

[결과 발표]

나름대로 결과에 대해 나쁘지만은 않다고 생각해서 상에 대한 기대감은 어느 정도 있었다. 상은 크게 대상, 최우수상, 우수상, 그리고 장려상 이렇게 있었는데 어떤 상이든 우선 상을 받을 수는 있지 않을까 싶었다. 11월 중 결과가 나온다니 언제 나오려나 싶었는데 생각보다 결과 발표가 굉장히 빨랐다. 결과는 앞에서 이미 공개한 것처럼 대상! 우아!

대상이라니… 참 신기했다. 지금 참가 기간도 짧았는데 대상 탔다고 티 내는 거야? 싶지만 반은 맞고 반은 틀리다. 짧은 기간 동안 낸 결과로 좋은 결과를 받았다는 것도 기분이 좋지만, 또 한편으로는 그만큼 경험했던 게 있어서 해낼 수 있지 않았나 싶다.

물론 참가 팀이 엄청 많은 편도 아니었다. 당연히 최근 공모전이 정말 많기도 했고 KDX는 신생 기업이라 공모전 홍보가 많이되지는 않았던 거 같다. 이후 들었던 내용으로는 참가팀이 약 80여 팀 정도였다고 한다.

시상식

이번 대회는 주최 기관이 MBN이었기 때문에 MBN 건물에서 시상식을 열었다. MBN에서 주최해서 그런지 기자들도 오고 바로 옆에서는 이미 기사를 쓰고 있었다. 이게 웬일 ㅎㅎ .. 그렇게 받은 대상.. 우아!!! 맛있는 거 먹으러 가야지.

시상식에 앞서서 대상팀은 제출 자료를 발표하는 시간이 있었다. 열심히 준비한 우리 팀원 칭찬해ㅎㅎ 이런 자리에서 발표하는 건 처음이라 긴장을 많이 했지만 이전에 준비를 많이 해서 그런지 긴장이 뭐져? 라는 느낌으로 침착하게 잘 발표를 했다.

코로나로 인해 간단한 도시락은 포장해서 각자 가져가서 먹을 수 있도록 주었다. 도시락에 있는 깐풍기? 닭강정?이 진짜 맛있었다. 깐풍기와 닭강정을 어떻게 구분을 못해? 한다면 둘 다 사줘보시길… 시상에서는 꽃다발과 함께 MBN에서 주는 상장과 KDX에서 주는 상장을 하나씩 받았다.

시상이 끝나고 나서 기사가 언제 나올까 기다리면 두근두근하고 있었는데 기사4도 나오고 생각지 못했던 뉴스까지 나왔다. 우아! 세상 사람들!! 나 티비 나왔어여!

맺음말

오랜만에 공모전에 참여하면서 먼 길을 돌아와 다시 내가 하는 일에 재미를 느낄 수 있는 좋은 경험이었다고 생각한다. 대상이라는 사실이 정말 좋지만, 한편으로는 부족한 게 많아서 더 시간을 갖고 충분히 했다고 생각할 정도로 완성하지 못한 아쉬움이 크다. 이후 조금 더 해보고 싶었던 것들을 완성해서 공유해보려 했는데 아무래도 저작권 때문에 어려울 것 같다.

상금 받은 거로 맛있는 걸 사 먹었다. 사실 시상식 전에 상금을 타기도 전에 이미 우리끼리 뒤풀이를 열었다. 오이도로 방어를 먹으러 갔는데 하 … 오이도 안 갈래… 맛있었는데 중방어라 그런지 기름기도 없고 다른 시내 횟집보다 가격도 저렴하지 않아서 그냥 시내 맛있는 대방어 집에 가는 게 더 좋을 거 같다.

대상인 만큼 상금도 넉넉하니 지금 따로 하는 공모전이나 해보고 싶은 실험들에 그래픽 카드 하나 정도 더 넉넉하게 달아도 되지 않을까 싶어서 질렀다. 후후… 그동안 사용했던 1080 ti도 좋았지만 이번에 RTX 3080 소식을 듣고… 안 살 수가 없었다. 재고가 없어서 구하기 힘들다 했지만 나는 참 운이 좋게도 바로 구할 수 있었다. 1080 ti와 비교해보니 속도 면에서 월등히 빨랐다. 크… 지금 두 개 그래픽카드 비교도 해보고 이참에 multi GPU 실험도 해보고 있어서 조만간 관련 글을 써볼까 한다.

연말에 좋은 소식이 생겨서 좋고 주변에도 하나둘 좋은 소식이 있는 것 같아서 참 다행이다. 올 한 해 아직 끝난 건 아니지만, 기분 좋게 마무리 할 수 있었으면 좋겠다. 담달이면 이제 벌써 2020, 2부작 제2부를 쓸 시간이다. 그리고 마저 part 2도 써야 하니 쓰고 싶은 글이 정말 많다. 시간은 부족한데 몸은 게으르고 하고 싶은 건 많고! 나뭇잎 마을로 유학을 가고 싶다.

우리 팀원 수고했어!

참고

Leave a comment