"연관관계는 인과관계가 아니다." 는 말은 맞지만, 연관관계는 때로는 인과관계가 될 수도 있다.
통계학을 공부한 사람이면, '연관관계는 인과관계가 아니다.'를 배운 적이 있을 것이다. 그럼에도 불구하고, 사람들은 연관관계를 통해 인과관계를 추론하게 된다. 이 책에서는 주식 투자자가 주가가 급등하기 직전에 매수했거나 폭락하기 전에 매도 했던 경험을 예시로 들어, 시장 타이밍을 맞출 수 있다고 착각하는 경우가 있다고 말한다. 많은 사람들은 자기 직관이 불규칙한 주가의 움직임과 인과적으로 연결되어 있다고 생각하면서, 잘못된 믿음을 더 위험한 베팅으로 이끌고 결국에는 투자자산을 잃게 된다.
즉, 연관관계는 2개의 수치와 확률변수가 같이 움직이는 것이며, 인과관계는 한 변수의 변화가 다른 변수의 변화를 일으키는 것을 의미한다. 예를 들어, 한 국가의 노벨상 수상자 수를 1인당 초콜릿 소비량과 연관시킬 수 있고, 두 변수가 같이 움직일 수 있지만 한 변수가 다른 변수의 원인이라고 생각하는 것은 어리석다는 것이다. 이 말에서 이책에서 말하는 인과 추론이 무엇인지, 연관관계와의 차이가 무엇일지 이해할 수 있었다.
인과 추론에서 시작해, 머신러닝, 연관관계와 인과관계의 차이, 인과추론의 근본적인 문제, 인과 모델까지 스토리를 통한 설명이 되어 있어서, 통계학을 아예 모르는 사람이라도 책을 술술 읽으면서 '인과추론'에 대해 깊이있게 배워갈 수 있을 것이다. 특히, 인과추론을 학습할 때, 시뮬레이션 데이터를 통해 학습하는 것이 좋은데, 이는 아래와 같은 이유 때문이다.
이 책에서는 고객 데이터를 통해 인과 효과를 추정하는 과정을 통해, 이메일을 받지 않은 그룹, 긴 이메일과 짧은 이메일을 받은 그룹간의 전환율을 나타내어, 어떤 이메일을 보냈을 때 더 효과적인지 분석하는 과정을 보여준다. 실제로 마케팅에서도 이런 방법이 자주 사용되는 것으로 알고 있는데, 가설을 설정하고 실험을 하는 것을 자주 해볼 수록 도움이 될 것이다.
즉, 연관관계는 2개의 수치와 확률변수가 같이 움직이는 것이며, 인과관계는 한 변수의 변화가 다른 변수의 변화를 일으키는 것을 의미한다. 예를 들어, 한 국가의 노벨상 수상자 수를 1인당 초콜릿 소비량과 연관시킬 수 있고, 두 변수가 같이 움직일 수 있지만 한 변수가 다른 변수의 원인이라고 생각하는 것은 어리석다는 것이다. 이 말에서 이책에서 말하는 인과 추론이 무엇인지, 연관관계와의 차이가 무엇일지 이해할 수 있었다.
인과 추론에서 시작해, 머신러닝, 연관관계와 인과관계의 차이, 인과추론의 근본적인 문제, 인과 모델까지 스토리를 통한 설명이 되어 있어서, 통계학을 아예 모르는 사람이라도 책을 술술 읽으면서 '인과추론'에 대해 깊이있게 배워갈 수 있을 것이다. 특히, 인과추론을 학습할 때, 시뮬레이션 데이터를 통해 학습하는 것이 좋은데, 이는 아래와 같은 이유 때문이다.
이 책에서는 고객 데이터를 통해 인과 효과를 추정하는 과정을 통해, 이메일을 받지 않은 그룹, 긴 이메일과 짧은 이메일을 받은 그룹간의 전환율을 나타내어, 어떤 이메일을 보냈을 때 더 효과적인지 분석하는 과정을 보여준다. 실제로 마케팅에서도 이런 방법이 자주 사용되는 것으로 알고 있는데, 가설을 설정하고 실험을 하는 것을 자주 해볼 수록 도움이 될 것이다.
각 그룹을 평가하는 다양한 방법 중에서 간단하게 실험 대상 집단 사이의 정규화 차이를 계산해서 평가하는 방법을 택하는데, 공식이 이해되지 않아도 걱정하지 말라는 말과 함께, 결과표를 어떻게 해석해야 제대로 추론을 할 수 있는지 알려준다.
설명 속에 다양한 통계학의 원리들이 자연스럽게 녹아 있어서, 이 책을 읽기 위해 통게학을 따로 공부하지는 않아도 될 것이다. 수학적 공식이 이해가 되지 않는 경우도 있는데, 그림이나 도표 등을 통해 직관적으로 이해할 수 있도록 되어있었다.
설명 속에 다양한 통계학의 원리들이 자연스럽게 녹아 있어서, 이 책을 읽기 위해 통게학을 따로 공부하지는 않아도 될 것이다. 수학적 공식이 이해가 되지 않는 경우도 있는데, 그림이나 도표 등을 통해 직관적으로 이해할 수 있도록 되어있었다.
인과추론을 업무에 활용하고 싶지만, 방법을 모르는 독자들이 읽으면 큰 도움이 되는 책이라고 생각한다. 복잡하게 생각하지 않고, 이 책에서 설명하는 주제를 순서대로 따라가다 보면, 실무에서의 인과 추론은 더 이상 어려운 일이 아닐 것이다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
'한빛미디어' 카테고리의 다른 글
데이터로 말한다! CRM 마케팅 (0) | 2024.07.17 |
---|---|
러닝 깃허브 액션 (0) | 2024.06.06 |
개발자를 위한 커리어 관리 핸드북 (1) | 2024.05.13 |
개발자 기술면접 노트 (1) | 2024.04.05 |
밑바닥부터 시작하는 딥러닝 4 (0) | 2024.02.25 |
댓글