머신러닝을 활용한 웹 최적화(2021.06.07)
이미지는 생각보다 큰 영향을 준다. 넷플릭스에서도 볼 만한 영상을 고를 때 내가 좋아하는 구도가 있다는 걸 넷플릭스의 영상 커버가 바뀌는 걸 눈치챈 뒤에 알았다. 사람들에게 무의식적인 취향을 노출하여 그들의 선택을 얻어내는 것은 비즈니스적으로도 매우 중요하다. 미국인가 어디에서 이제는 저명한 대학교 심리학과 등의 출신 교수를 모아 잠을 자면서도 특정 회사가 판매하는 물건에 대한 인지를 높여서 사고싶게 만드는 실험이 진행되었다는 소식을 들은 적이 있다. 그야말로 인셉션의 훌륭한 비즈니스적 적용이 아닌가.
사실 인간은 요즘세대는 특히 더 그런 것 같은데 자기만의 취향보다는 남의 취향을 자신의 취향으로 끌어들이고 함께 하는 것에 좀 더 재미를 느끼는 듯하다. 그렇게 되면 인플루언서나 노출되는 이미지, 노출되는 사람 등이 인간의 선택에 특히 더 중요해지고 인터넷 입소문 등의 효과도 클 것이다.
A/B테스트 또한 사람들의 클릭률을 높일 수 있는 최적의 조합을 찾아서 비즈니스적으로 활용하고자 하는 시도이다. 나같아도 넷플릭스 등 앱에서 보고 싶은 혹은 사고싶은 상품의 대표 이미지가 무엇이냐에 따라서 최초 클릭 여부가 갈린다. 사실 블로그를 조금만 해봤다면 커버 이미지를 고심해서 골랐던 적이 있을 거다. 그런 것도 모두 효과적인 클릭률을 위한 것이 아니었나 생각한다.
책은 A/B테스트를 소개하면서 여기에 들어간 각종 확률 분포, 덧셈정리, 곱셈정리, 이항 분포 등에 대해 차근차근 설명이 들어간다. 통계 쪽을 좀 알고 있다면 무난히 넘어갈 수 있지만 만약 그런 부분들을 보충해야 된다면 기초 단계부터 설명이 들어가므로 따라가면 충분히 이해할 수 있다.
이후 2장에서는 확률적 프로그래밍을 좀 더 쉽게 하기 위한 PyMC3를 소개한다.
3장에서는 3개 이상의 선택지가 조합으로 묶일 때 어떻게 테스트할지에 대한 내용이다. A/B테스트는 2가지 경우에 대해서만 집중했기 때문에 현실에서는 주로 더 많은 선택 조합이 나올 가능성이 높다.
사실 개인적으로는 사용자 편의성이 모든 상황에서 우선적으로 고려되진 않는다고 생각한다. 그게 회사의 이익과 연결되어 있는 화면이라면 더더욱. 예를 들면 가장 기본적인 최저가 정렬의 경우 대부분은 최저가 정렬이 허용된다. 그것이 더 많은 클릭률을 유도하고 매출을 높인다면 당연히 장려해야 할 기능일 것이다. 하지만 만약 그 반대라면? 반대의 경우가 있나 라고 생각할 수도 있지만 있다.... 즉.. 이벤트성으로 풀리는 행사 혹은 클리어런스의 경우는 굳이 고객의 편의성을 극대화할 필요가 없는 것 같다. 여러 가지 커머스 앱을 사용해보면 이런 특정 이슈가 있는 화면이나 기간의 경우는 최저가 정렬은 구현되지 않는다... 입맛을 다시며 무한 스크롤링을 하는 나는 일반 평민이고 이런 경우에 도가 튼 도인들의 경우는 정렬 기능 없이도 최저가를 참 잘 찾는다...
암튼 3장에서는 여러 가지 다양한 조합을 찾고 교호 작용에 대해서도 소개를 한다. 여기까지 읽었을 때 책의 비중이 주로 통계적 스킬에 대부분을 할애하고 있다는 것을 알았으니 참고하면 좋겠다.
4장에서는 메타휴리스틱 방법을 소개한다. 어떤 통계적 모델을 사용하기보다는 일반적으로 좋다고 알려진 지식을 휴리스틱적으로 풀어가는 것을 말한다. 답이 딱히 정해지지 않았는데 문제를 풀어야 되는 상황에서 이런 메타휴리스틱적 방법은 충분히 고려해볼 만하다. 언덕 오르기 알고리즘이 코드로도 제시되어 있으므로 한번 연습하는 것도 좋겠다.
이밖에 슬롯머신 알고리즘, 조합 슬롯머신 등 실제 비즈니스에서 최적화를 위한 여정을 이어갈 때 일어날 수 있는 상황을 앞에 도입 부분에서 상황 설명을 하고 이를 각 해결방법으로 설명한 뒤 이론이나 더 알면 좋을 이론 내용으로 부가설명하는 것이 이 책의 공통적인 부분이다. 전반적으로 통계쪽 내용의 비중이 높으니 참고하면 좋겠다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."