생활정보

베이즈 정리가 뭘까? 총정리 확률과 통계 세특 작성

알 수 없는 사용자 2022. 1. 23.

베이즈 정리가 뭘까? 총정리

확률과 통계 세특 작성

 

안녕하세요~ 오늘은 베이즈 정리에 대해 알아보려 합니다. 요즘 학생들이 고등학교 때부터 확률과 통계에 대해 배우다 보니 생기부 용으로 베이즈 정리에 대한 조사를 많이 하더라고요. 사실 확률보다는 통계 쪽에 흥미로운 내용들이 많기 때문인 것 같습니다.  베이즈 정리는 대학 수학에서 배우는 통계 관련 정리인데요. 학생들이 벌써부터 베이즈 정리에 대한 조사를 해보려 한다니 굉장히 기특합니다~ 베이즈 정리는 또한 실생활에서도 많이 쓰이고 있다고 해서 제가 오늘 한번 파헤쳐보려고 가져와봤습니다. 그럼 함께 베이즈 정리에 대해 알아볼까요?

 

조건부 확률과 베이즈 정리

베이즈 정리에 대해 알기 위해선 먼저 조건부 확률에 대한 이해가 필요합니다. 조건부 확률이란 어떤 사건이 일어난 조건하에서 다른 사건이 일어날 확률을 뜻하며 사건 A가 일어났을 때 사건 B의 조건부 확률을 P(B|A)라고 표시합니다. 조건부 확률은 고등학교 교육과정 <확률과 통계>에서 배우며 확률 단원에 위치합니다. 조건부 확률에 대해 알고 있다면 베이즈 정리를 이해하는데 조금 도움이 되지 않을까 싶습니다.

조건부 확률에 대해 알아봤으니 본격적으로 베이즈 정리에 대해 알아보겠습니다.

베이즈 정리란 확률변수의 조건부 확률분포와 주변부 확률분포를 연관 짓는 확률이론입니다. 주어진 조건에서 어떠한 현상이 실제로 나타날 확률을 구하는 방법이며 해석적인 측면에서는 새로운 증거에 기반을 두어 과거의 정보를 향상하거나 개선한다고 할 수 있다고 하네요. 불확실성 하에서 의사결정 문제를 수학적으로 다룰 때 중요하게 이용하기 때문에 실생활에 많이 쓰인다고 합니다.

정리하자면 조건부 확률은 어떤 사건 B가 일어났을 때 사건 A가 일어날 확률이며 베이즈 정리는 사전확률과 사후 확률 사이의 관계를 나타내는 정리입니다. 즉, 조건부 확률은 표본 공간을 조건으로 인해 축소시키는 것이며, 베이즈 정리는 결과는 이미 발견되었고 그 결과에 대한 원인을 찾는 것입니다. 전통적인 확률이 연역적 추론에 기반을 두고 있다면 베이즈 정리는 확률임에도 귀납적, 경험적인 추론을 사용한다고 하네요.

 

 

베이즈 정리의 실생활에서의 활용

S씨는 10여 년 전 어느 날 가슴에서 작은 덩어리가 만져지는 것 같은 느낌이 들었다. 며칠간 불면의 밤을 보내다 용기를 내 병원을 찾았고 유방암 검사를 했다. 당시 의사는 검사 정확도가 90%라고 알려줬다. 검사 결과 양성으로 나왔다. 자신이 유방암일 확률이 90%라는데 충격받은 S 씨는 그 자리에 주저앉았다. 하지만 의사 말에 따르면 유방암에 걸린 여성은 성인 여성의 1% 수준이고 검사 정확도가 90%이므로 정상인데도 검사에서 유방암에 걸린 것으로 나올 확률은 10%이다. 따라서 설사 검사에서 양성으로 나왔더라도 진짜 유방암에 걸렸을 확률은 8%에 불과하다는 것이다. S 씨는 이 내용이 무슨 말인지 전혀 알아듣지 못했다. 이것이 바로 베이즈 정리로 확률을 얻는 것이다.

양성 반응을 보이는 사건을 A, 실제 유방암에 걸린 사건을 B라 하면 제시문의 조건에 의하여 P(B)=0.01입니다. 이때, 검사 정확도가 90%라는 의미는 유방암에 걸린 사람을 유방암에 걸렸다고 진단할 확률이 90%이고 유방암에 걸린 사람을 걸리지 않았다고 진단할 확률이 10%라는 의미입니다. 이후 베이즈 정리에 입각한 계산을 해보면 결국 암 판정이 나왔을 때 진짜로 암일 확률은 8%! 결론적으로 확률에 대한 정확한 생각을 가지지 못하면 속을 수 있고, 확률에 입각한 생각이 현실에서 좀 더 유용하다는 것이네요.

 

베이즈 정리의 한계점

하지만 이러한 베이즈 정리에도 한계점이 존재하는데요. 사후분포를 사람의 손으로는 계산하기 쉽지 않은 케이스들이 많습니다. 현실에서 발생하는 데이터들은 항상 이렇게 사전 분포와 가능도가 잘 맞지 않는 경우가 대부분이기 때문인데요. 이런 경우에는 사람의 손으로 직접 사후 분포를 계산하기에는 어려움이 너무 커서 베이즈 통계학을 현실에서 활용하기에 많은 무리가 따른다고 합니다. 베이즈 정리가 조금 더 발전해서 실생활에서 아주 유용하게 쓰였으면 합니다. 그럼 오늘 포스팅은 여기서 마무리 짓도록 하겠습니다.

 

베이즈 정리는 대학때 배우는 내용이라 고등학생이 배우기 어려울 수도 있는데 고등학생 여러분들은 그냥 세탁을 위해서 쓰시고 싶으신 마음 잘 압니다. 하지만 이 내용을 완벽히 숙지하지 않는 다면 다소 이해가 어려운 부분이 많습니다. 그래서 여러분들을 위해 오늘 이 포스팅을 작성한 것입니다. 베이즈 정리에 대해서는 대학에 가서 더 자세하게 배우고 오늘 이 포스팅으로는 주요 내용만 집어서 가시길 바랍니다. 확률과 통계에서는 제 생각엔 통계 부분이 실생활에 유용한 것 같기 때문에 이 부분을 위주로 세특을 작성하시면 도움이 될 겁니다. 많은 도움이 되었길 바라며 오늘 포스팅 여기서 마치겠습니다. 다음에는 좀 더 재미있고 유익한 내용으로 돌아오겠습니다.

댓글

💲 추천 글