Allen B. Downey의 책 Think Bayes 중 1장 확률(probability) 부분을 학습하고 정리한 내용입니다.
베이즈 통계학(Bayesian statistics)의 근간은 베이즈 이론(Bayes's Theorem)이고, 베이즈 이론의 바탕은 조건부 확률(conditional probability)입니다.
조건부 확률을 이용해 베이즈 정리를 유도할 수 있으며, 베이즈 이론을 이용해 조건부 확률과 관련된 문제를 풀 수 있습니다.
결합 오류(Conjunction fallacy = Linda theBanker)
결합 오류라고 알려진 유명한 실험을 이용해 조건부 확률을 설명해 본다. 이 유명한 실험은 아래와 같다.
린다(Linda)는 31살의 싱글이며, 거침없이 말을 하는 매우 밝은 성격의 소유자이다. 그녀는 철학을 전공했다. 학생일 때 그녀는 차별과 정의에 관한 문제에 관심이 많았으며, 반핵(anti-nuclear) 시위에 참여하기도 했다. 아래 두 가지 중 확률이 높은 것은?
1. 린다는 은행원이다.
2. 린다는 은행원이고, 페미니스트 운동가이다.
2번이 설명과 더 일치하는 것처럼 보이기 때문에 대부분의 사람들은 2번을 고른다. 하지만 2번은 확률이 더 높을수(more probable) 없다. 가령 린다에 대한 설명과 맞는 1000명의 사람 중 10명이 은행원이라 치자. 이 10명 중 몇 명이 페미니스트일까? 많아봤자 10명이다. 결국 2번은 확률이 더 낮다.
확률(Probability)
확률의 예를 들어보자. 1000명의 사람을 조사해 봤더니 그 중 20명이 은행원이다. 그러면 이를 분수로 표기하면 20/1000, 즉 0.02, 2%가 은행원이란 말이다. 동일한 모집단(population)에서 무작위로 한명 골랐을 때 은행원일 확률은 2%이다. 여기서 무작위(at random)란 데이터세트에 있는 모든 사람이 선택될 기회가 같다는 말이다.
결론적으로 확률을 정의하기 어렵지만, 결국 확률은 유한한 집합 중 일부를 분수로 나타낸 것이다.
조건부 확률(Conditional Probability)
조건부 확률은 특정한 조건에 의존하는 확률이다. 예를 들자면, 은행원 중에 여자일 확률은? 자유주의자 중에 민주당을 선호할 확률은?
결합 확률은 교환 법칙이 성립하지만, 조건부 확률은 교환 법칙이 성립하지 않는다.
댓글