안녕하세요. 지난 이틀간 '빅데이터를 활용한 예측 마케팅 전략' 책 앞부분은 잘 읽으셨나? 세상에 많은 책들이 나와 있지만, 제가 특별히 이 책을 골랐던 이유는 이 책이 다른 무엇보다 '액션'에 초점을 맞추고 있기 때문이었습니다. 세부 기술적 표현에 대해서는 간단히 이해할 정도로는 충분히 설명하지만, 다른 책들처럼 거기에서 끝나는 것이 아니라, 그리하여 이것을 통해서 어떤 것을 할 수 있는지 활용방안에 대해서 잘 설명하고 있기 때문에, 이번 스터디 뿐만 아니라, 스터디가 끝나고 나서도 짬짬히 읽어내시면 큰 도움이 되리라 생각해요.

오늘은 이번주의 마지막 읽을 글이되겠습니다. 하버드비즈니스리뷰의 https://hbr.org/2019/05/do-your-data-scientists-know-the-why-behind-their-work 입니다. 하버드비즈니스리뷰는 보통 줄여서 HBR로 표기를 많이 하곤 합니다. 물론 '오오 하버드~' 하면서 좀 폼이 나는 것도 사실입니다만, 폼은 둘째치고라도, 데이터 분야와 관련해서도 괜찮은 양질의 글들이 정말 많이 올라옵니다. https://hbr.org/topic/data 이 섹션에 가보면 재미난 아티클이 많습니다. 영어가 불편할 수도 있지만, 요즘은 기술의 발전으로 구글번역, 파파고 같은 인터넷 번역기를 통해 충분히 읽을만한 번역문을 보실 수 있습니다. 제가 개인적으로 해보니 HBR의 글은 구글번역보다는 파파고가 더 잘 번역해줍니다. (한가지 팁이라면, 파파고를 통해 번역을 하다보면, 일 공짜 읽을 수 있는 제한을 넘었다고 나올때가 종종 있는데, 이럴때는 사이트 번역 기능말고, 전체 텍스트를 복사 붙여넣기로 넣으면 잘 됩니다)

다시 오늘 다룰 글로 넘어와, Do Your Data Scientists Know the ‘Why’ Behind Their Work? (당신의 데이터 사이언티스트들이 현업 뒤에 있는 why에 대해 알고 있나요?) 는 제가 첫번째주에 강의하고 싶은 골자들을 잘 표현해주는 글이라 골랐습니다. 이번 어제까지 우리는 1) 데이터 사이언스가 뭔지 2) 그것이 단지 예쁜 리포트가 되면 안되고 어떤 것이 되어야 하는지 3) 예측마케팅과 그 기저의 간단한 기술적 기반 들을 살펴보았습니다. 결국 '액션하는 데이터'라는 골자를 향해 가고 있습니다. 오늘은 그것을 지향하며 하는데도, 잘 안되는 이유들. 빠지기 쉬운 함정들에 대해서 다룬 글입니다.

아래는 링크한 글의 원문을, 축약하고, 좀 더 부드러운 한글로 제가 번역한 글입니다.

좀 광범위하게 정의되어 있기는 하지만 데이터 과학이 우리 곁에 존재한지는 꽤 되었습니다. 하지만 빅데이터 & AI 프로젝트의 실패율은 상당히 높습니다. 그 명성에도 불구하고, 회사의 수익에 기여를 하지 못하는 경우가 많습니다. 도대체 왜 그럴까요?

어떤 데이터 프로젝트가 성공하고 실패하는지를 분석해보았는데 결과는 명확했습니다. 가장 큰 성공은 단지 기술적 탁월성이 아니라 다른 요인들로 부터 나왔습니다. 비즈니스에 대한 깊은 이해, 이해결정자들과의 신뢰 형성, 결과를 더 쉽고 확실하게 언어로 설명하는 일, 관여되어 있는 수십가지 일로부터 참을성 있게 꾸준히 일해나가는 것등이었습니다.

하지만 많은 회사에서 데이터 사이언티스트들은 이러한 분야에 크게 관여되어 있지 않습니다. 2가지 이유가 있는데, 첫번째로 데이터 사이언티스트들은 비즈니스 문제를 해결하는 것보다, 말 그대로 데이터 더미에 묻혀있는 재미난 것들을 찾아내는 것이 더 흥미롭기 때문입니다. 뭐 당연하긴 하죠. 그게 더 쉽게 그들의 기술도 주변으로부터 인정받을 수 있고, 회사의 지저분한 현실을 다루는 것보다 더 재미나기 때문이니까요

두번째로는 회사의 관점인데, 데이터 사이언티스트들이 귀하다보니 이 사람들을 현실의 척박함에 던지기 보다는 좀 더 보호하려 한다는 겁니다. 하지만 그러면서 실제 회사의 가장 중요한 문제와 이 사람들이 멀어진다는 것에 문제가 있습니다. 거기다가 회사들도 데이터 과학자들과 일해본 경험이 없습니다. 이들을 어떻게 다루고 써야할지도 잘 모르는 거죠

그러면 제대로 데이터 사이언스를 하는 방법은 무엇일까요?

첫번째, 데이터 사이언티스트들에게 비즈니스 목표와 어떻게 진척을 측정할 것인지를 명확하게 하세요. 초기에 꽤 많은 힘이 들겠지만 비용 감소, 새로운 이익, 향상된 고객 만족, 위험 감소 등 같은 진짜 결과를 추구해야 합니다. 머신러닝같이 멋진 말에 조직이 제대로 준비가 되어 있지 않다는 것을 인정하고, 일상 운영을 제대로 돌린다던가, 데이터 퀼리티를 올린다던가, 고객에 대해 더 깊게 이해하기 위한 것같은 더 기본적인 것들을 우선해야 합니다.

두번째 데이터 사이언티스들을 지금 당장 매일매일 회사가 당면하고 있는 문제를 풀도록 시키세요. 물론 기술적 역량도 중요하지만, 그러한 비즈니스에 관심있고, 그런 일상일을 더 낫게 만드는데 관심있는 사람을 고용하는 것이 좋습니다. 그리고 데이터 사이언티스트들을 현실의 거칠고 힘든 일과 제대로 연결되게 만드세요. 절대로 데이터 사이언티스트 고립지대를 만들지 않도록 하세요. 대신에 그들이 지금 기여할 부서에 편입시키는 편이 낫습니다.

세번째로 데이터 사이언티스트들이 자신들의 일의 처음부터 끝까지의 책임을 지도록 하세요. 분석에 앞서서 되어야 하는 일들은 정말 중요합니다. 명확하게 정의된 문제 정의 없이 하는 일은, 단지 낚시같이 뭔가 걸리길 바라는 요행일 뿐입니다. 중요한 문제를 정리하고 우선순위를 정하는 일은 복잡하고, 혼란스러울 겁니다. 뭔가 보여주길 바라는 신입 데이터 사이언티스트들에게는 꽤 인내가 필요한 일이죠. 경력자가 더 잘 알긴 할겁니다. 어쨌거나 명확하게 정리된 문제 정의는 정치적 어려움도 뚫게 해주고, 때로는 심지어 데이터 사이언스 없이 더 쉽고 강력한 해결책을 제시하기도 합니다. 나는 내 가치기여의 절반이 그들의 진짜 문제가 무엇인지 이해하게 해주는데서 나오는 것을 경험했습니다.

인사이트와 알고리즘이 현실의 척박함을 뚫고 의미있게 되려면 분석 이 나오고 나서 어떻게 해 나가야하는지도 매우 중요합니다. 현실의 자잘한 정치적 이슈가 사실 가장 큰 걱정이 될것이고, 이런 것은 쥬니어 데이터 사이언티스트의 인내를 시험하는 일이죠. 경험많은 데이터 사이언티스트들은 이런 것들을 다루기 위한 정치를 좀 압니다. 그래서 일에 영향줄 수 있는 모든 것들과 좋은 연합을 하기 위해 많은 시간을 쓰곤 합니다.

마지막으로 데이터 사이언티스트들이 사내에 전체 사람들에게 교육을 수행하게 하세요. 모든 사람들이 그들의 작업에서 데이터 사이언스를 조금이라도 쓸 수 있다면 큰 도움이 될 것입니다. 하지만 대부분 기술들에 대해서는 잘 모르죠. 데이터 사이언티스트들이 이들을 가르치게 한다면 큰 편익이 생길겁니다. 동시에 데이터 사이언티스트들이 비즈니스를 배울 기회이기도 하구요

(후략)