어떤 일을 하게 된다면 먼저 그 일을 잘 하기 위한 조건을 찾게 됩니다. 일이 잘 되는 이유와 잘 되지 않는 이유는 대개 서로 맞닿아 있는데요. 하지만 남들이 구체적인 맥락 속에서 어떤 일을 잘 해낸 이유를 다른 맥락에 처해 있는 내게 그대로 적용하기는 조심스럽습니다. 반면 잘 되지 않는 이유는 일반화하기 상대적으로 쉽습니다. 이건 어떤 일이 잘 되지 않는 이유가 구체적인 맥락과는 무관한 보편적인 교훈을 담고 있기 때문입니다.
"교과서 중심으로 열심히 한다고 다 좋은 대학에 가는 건 아니지만 공부를 안 하면 그 문턱도 못 가는 이치”와 비슷하죠.
늘 하던 일을 기계가 더 빠르게 해준다면 편하고 고마운 일입니다. 자동화 작업을 위해서는 자본이 많이 듭니다. 그러나 장기적으로 보았을 때 결국에는 비용이 절감되어 남는 장사가 될 터이니 기업 입장에서는 무조건 하는 편이 옳습니다. 문제는 현재 (지식) 노동자들이 하고 있는 일들은 추가로 자동화할 여지가 크지 않다는 것입니다.
새로운 일을 배워서 기존 일을 더 잘해야 한다면 피곤합니다. 배움에는 끝이 없다고 합니다. 하지만 이건 문장으로 존재할 때만 동의할 수 있는 일이에요. 내가 따로 시간을 내어서 뭘 배워야 한다면 일에 대한 염증, 일을 시킨 사람에 대한 화가 치밀기도 하니까요.

©pixabay
기계학습은 의사결정 기술입니다. 기존에는 비용 문제로 의사결정을 할 엄두조차 낼 수 없었던 일들이 기계에 의해 자동화되고 있습니다. 빈번하고 개별 의사결정의 중요도가 크지 않아 잘못된 결정에 대한 책임을 아무도 질 필요 없는 "이 책 한 번 읽어 보실래요?" 혹은 "이 영화 취향에 맞죠?"와 같은, 스스로도 잘 모르는 나를 위한 추천/개인화의 영역에서 말이죠.
고양이와 개의 구분과 같은 인간의 인식 능력을 학습하는 모형을 개발하는 일도 잠재적 활용가치가 매우 큽니다. 하지만 왜 수많은 기업이 이 보편적인 기술을 개발하는 데 매달리는지 모르겠습니다. 전자레인지나 오븐을 개발하는 Machine Learning Research 영역과 전자레인지나 오븐을 활용하여 맛있는 요리를 만드는 Applided Machine Learning 영역의 구분에 대한 이해가 명확하지 않은 것이 한 이유일 수 있어요.

© pixabay
기계학습이 적용되는 다른 하나의 영역이 바로 데이터 기반 의사결정입니다. 여기서 의사결정의 주체는 기계가 아닌 사람이죠. 기업의 활동이 연속된 의사결정들로 이루어져 있고 그 질이 기업의 성패를 좌우한다는 데 모두가 쉽게 동의할 수 있을 것입니다.
우리에게 의사결정 기준이 a. 진화의 산물인 본능 + b. 개인의 구체적 경험과 학습의 총체인 인식능력(Mental Model)에 있었다면 자그마치 4차 산업혁명 시대에 a. +b. 에 "c 데이터"를 더하여 더 좋은 의사결정을 내리자는 주장에 누가 반박할 수 있을까요?
기업의 모두가 본인의 역할에서 더 좋은 의사결정을 내린다면
회사는 무조건 더 잘 될 터인데 왜 데이터 기반 의사결정(데이터 분석)이 잘 안 될까요?
몇 가지 이유를 제시하겠습니다.
1) 쓸 만한 데이터가 없다.
"쓸만한 데이터가 없다"라는 말은, 사실 본인의 비즈니스(업무)가 데이터에 대한 의존도가 크지 않은, 혹은 가만히 두어도 알아서 굴러가는 비즈니스(업무)라는 말입니다. 위에서 언급한 a. + b. 만으로도 두루뭉실한 "이야기"를 팔면서 살 수 있었다는 것입니다.
‘전략적’이라는 말은 현상의 뒤에 숨은 질서를 파악하여 미래의 불확실성을 줄이는 행위를 포함합니다. a. + b.만으로는 전략적인 "제스처"를 취할 수는 있어도 전략적인 "행동"을 하기는 어렵습니다.
쓸만한 데이터가 없다는 이야기는 나 혹은 나의 사업이 전략적이지 못 했다는 고백과도 같습니다. 전략적이기 위해서는 운영의 과정에서 쌓인 데이터를 통해 내가 하는 일 속에 담진 질서를 파악하여 내가 하는 일에 대한 인식의 깊이와 정확도를 높여야 합니다. 이 과정을 통해 쓸만한 데이터가 뭔지도 자연스럽게 알게 됩니다.
자, 이제 "쓸만한 데이터가 없다"는 말은 "우리한테 A, B, C의 데이터가 필요한데 아직은 없다"고 할 수 있을 때까지는 하지 않기로 해요!
2) 분석 결과가 의미 없다.
2)의 ‘의미 없다’라는 건 '덧없다', '부질없다'와 같은 존재론적 함의를 포함하는 표현이기보다 쓸모, 유용성, 완결성 등의 부족함에 대한, 실용성에 대한 의견일 것입니다. 혹은 최초 본인이 취했던 "우리나라에서 그게 되겠어?"라는 회의적인 입장을 고수하여 자의적 판단 대신 확률적 판단을 요구하는 데이터 분석 학문의 본질에 대한 조롱의 뜻일 것입니다.
세상의 불가해함과 부조리함을 이유로 a. + b. 에 c.를 보태는 것에 거부감을 느끼는 사람들의 불가지론적 태도에 대해서는 강산이 변하길 기다리는 등의 다른 방식의 대처가 필요할 것입니다. 여기서는 분석 결과의 실용성 부족 측면에서의 '쓸모없음'을 따져보겠습니다.
분석 결과는 결국 질문에 대한 답입니다. 여기서 질문이란 분석 주제를 의미해요. 좋은 질문을 하면 답을 찾지 못해도 찾아가는 과정에서 문제 영역에 대한 인식 수준이 부쩍 성장할 수 있지만 좋지 못한 질문(뻔하거나 정답을 염두에 둔)은 그 정답을 찾아도 결국 제자리에서 나아가지 못하게 되죠.
모든 기업에게는 고객이 있을 터이고, 고객이 경쟁사 대신 해당 기업을 선택한 이유가 존재합니다. 그 이유를 발견하고 키워나가는 일에 부서와 역할의 구분이 있을 리가 없습니다.
좋은 질문이란 곧 그 질문의 끝이 고객을 향하고 있어야 합니다. 그 답을 데이터에서 찾는 일은 그 과정을 통해서 고객과 자신이 하는 일에 대해 더 깊고 정확히 알게 되고 나의 무지의 장막이 드러난다는 점 자체로 의미가 있는 일입니다.
3) 바쁘고 어렵다.
일단은 인정하는 바입니다.
2편에서 이어지는 내용을 다뤄보겠습니다.