Tiny Bunny
한빛미디어

실무로 통하는 인과추론 with 파이썬

talstory

목차

실무로 통하는 인과추론 with 파이썬



"연관관계는 인과관계가 아니다." 는 말은 맞지만, 연관관계는 때로는 인과관계가 될 수도 있다.

 

통계학을 공부한 사람이면,  '연관관계는 인과관계가 아니다.'를 배운 적이 있을 것이다. 그럼에도 불구하고, 사람들은 연관관계를 통해 인과관계를 추론하게 된다. 이 책에서는 주식 투자자가 주가가 급등하기 직전에 매수했거나 폭락하기 전에 매도 했던 경험을 예시로 들어, 시장 타이밍을 맞출 수 있다고 착각하는 경우가 있다고 말한다. 많은 사람들은 자기 직관이 불규칙한 주가의 움직임과 인과적으로 연결되어 있다고 생각하면서, 잘못된 믿음을 더 위험한 베팅으로 이끌고 결국에는 투자자산을 잃게 된다. 


즉, 연관관계는 2개의 수치와 확률변수가 같이 움직이는 것이며, 인과관계는 한 변수의 변화가 다른 변수의 변화를 일으키는 것을 의미한다. 예를 들어, 한 국가의 노벨상 수상자 수를 1인당 초콜릿 소비량과 연관시킬 수 있고, 두 변수가 같이 움직일 수 있지만 한 변수가 다른 변수의 원인이라고 생각하는 것은 어리석다는 것이다. 이 말에서 이책에서 말하는 인과 추론이 무엇인지, 연관관계와의 차이가 무엇일지 이해할 수 있었다. 


실무로 통하는 인과추론 with 파이썬


  인과 추론에서 시작해, 머신러닝, 연관관계와 인과관계의 차이, 인과추론의 근본적인 문제, 인과 모델까지 스토리를 통한 설명이 되어 있어서, 통계학을 아예 모르는 사람이라도 책을 술술 읽으면서 '인과추론'에 대해 깊이있게 배워갈 수 있을 것이다. 특히, 인과추론을 학습할 때, 시뮬레이션 데이터를 통해 학습하는 것이 좋은데, 이는 아래와 같은 이유 때문이다. 

이 책에서는 고객 데이터를 통해 인과 효과를 추정하는 과정을 통해, 이메일을 받지 않은 그룹, 긴 이메일과 짧은 이메일을 받은 그룹간의 전환율을 나타내어, 어떤 이메일을 보냈을 때 더 효과적인지 분석하는 과정을 보여준다. 실제로 마케팅에서도 이런 방법이 자주 사용되는 것으로 알고 있는데, 가설을 설정하고 실험을 하는 것을 자주 해볼 수록 도움이 될 것이다. 


실무로 통하는 인과추론 with 파이썬
각 그룹을 평가하는 다양한 방법 중에서 간단하게 실험 대상 집단 사이의 정규화 차이를 계산해서 평가하는 방법을 택하는데, 공식이 이해되지 않아도 걱정하지 말라는 말과 함께, 결과표를 어떻게 해석해야 제대로 추론을 할 수 있는지 알려준다. 
설명 속에 다양한 통계학의 원리들이 자연스럽게 녹아 있어서, 이 책을 읽기 위해 통게학을 따로 공부하지는 않아도 될 것이다. 수학적 공식이 이해가 되지 않는 경우도 있는데, 그림이나 도표 등을 통해 직관적으로 이해할 수 있도록 되어있었다. 

 

인과추론을 업무에 활용하고 싶지만, 방법을 모르는 독자들이 읽으면 큰 도움이 되는 책이라고 생각한다. 복잡하게 생각하지 않고, 이 책에서 설명하는 주제를 순서대로 따라가다 보면, 실무에서의 인과 추론은 더 이상 어려운 일이 아닐 것이다.




 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

댓글