SlideShare uma empresa Scribd logo
1 de 78
의사들의 통계맹
Statistically Illiteracy in Doctors



  LEMS Colloquium 2013/3/20
            황 승 식
 인하대학교 의학전문대학원 사회의학교실
  cyberdoc@inha.ac.kr, @cyberdoc73
Statistical Illiteracy in Doctors
                 • Better Doctors, Better
                   Patients, Better
                   Decisions: Envisioning
                   Health Care 2020 중 9
                   장
                    – Odette Wegwarth와
                      Gerd Gigerenzer가 집필




                                            2
게르트 기거렌처
                             (1947~
                             막스플랑크연구소




                  • 수학맹의 특징
                   1.   확실성에 대한 환상
                   2.   위험에 대한 무지
                   3.   잘못된 위험 소통
                   4.   흐릿한 사고
『계산된 위험』(전현
우, 황승식 옮김, 도서출
판 살림, 2013년 근간)
                                        3
차례
1.   들어가며
2.   의사는 선별검사의 득실을 아는가?
3.   의사는 5년 생존율을 이해하는가?
4.   의사는 비교 위험 감소를 이해하는가?
5.   의사는 검사의 민감도와 특이도를 혼동하
     는가?
6.   의사는 확실성의 환상을 만들어내는가?
7.   원인
8.   대책
9.   의료에서 통계맹: 민주적 이상
                             4
들어가며
• 약 28만명의 여성에 대한 유방촬영술 선별검사
  무작위 시험 4건 결과(Nyström 등 1996)
  – 10년 간 선별검사에 참여한 여성 천 명 당 3명이, 선
    별검사에 참여하지 않은 여성 천 명 당 4명이 유방
    암으로 사망
• 약 50만명 여성이 참여한 무작위 시험을 포함
  한 코크란 리뷰 결과 절대 위험 감소(absolute
  risk reduction)는 미미 (Gøtzche와 Nielsen 2006)
  – 유방촬영술은 유방암으로 사망할 2천명의 여성 중
    1명을 구한다는 결과 추정
  – 10명의 여성이 선별검사 결과로 과잉치료를 받음.
                                                5
들어가며
• 유방촬영술의 득실에 대한 부인과 전문의의
  지식을 확인하는 연구 수행(Wegwarth와
  Gigerenzer 2010a)
 – 제 어머니께서 최근 유방촬영술을 받으라는 권
   고를 받았습니다. 어머니 연세는 55세고, 가족
   중에 유방암 환자는 없었으며, 유방암을 시사하
   는 어떤 증상도 없었습니다. 어머니는 선별검사
   가 효과적일지 의문을 갖고 계십니다. 하지만
   저는 어머니 연령대에 유방촬영술을 받는 편이
   바람직하다고 생각하는데 유방촬영술의 득실
   에 대해 알고 싶습니다.
                            6
들어가며
• 면담에 참여한 20명의 부인과 전문의 중 17
  명이 유방촬영술은 안전하고 과학적으로 잘
  정립된 개입이라며 강력히 권고
• 단 7명의 부인과 전문의만 이익을 숫자로 표
  현했고, 범위는 20%~50%로 다양
 – 유방촬영술의 유방암 사망 절대 위험 감소는 1
   천 명 당 5명에서 4명으로 1명 감소이고, 이를
   비교 위험 감소로 표현하면 20%임(Nyström 등
   2002)

                                   7
들어가며
• 부인과 전문의 누구도 유방촬영술 선별검사로
  인한 과잉진단과 과잉치료의 위해를 언급하지
  않음.
 – 유방촬영술의 잠재적 위해를 “무시할만한
   (negligible)” 정도라고 설명.
 – 20명 중 단 3명만 특정 위해를 숫자로 제공했으나,
   그나마 두 명은 정보가 잘못됐음.
• 9개 유럽 국가에서 수행된 연구 결과 의사의 지
  식 부족이 바로 환자의 지식을 약화(Gigerenzer
  등 2009)
 – 잦은 의사 방문이 선별검사의 이득에 대한 환자의
   이해를 높이지 않으며 오히려 약간 과장
                                   8
의사는 선별검사의 득실을 아는가?
• 전립샘암 PSA 선별검사 사례
 – 60세 남자 의사가 베를린의 135명 비뇨기과 전문의
   중 20명을 무작위 추출하여 PSA 선별검사에 대한
   조언을 구함(Stiftung Warentest 2004)
 – 가이드라인에 따르면 검사 전에 철저하고 체계적
   인 상담이 필요
 – 20명 중 단 두 명이 적절한 정보를 알았고 환자의 질
   문에 답할 수 있었음.
 – 다른 4명은 어느 정도 정보를 알았지만, 대다수인
   14명은 환자의 질문 대부분에 답을 못하거나, PSA
   선별검사가 생명을 연장한다고 과학적으로 입증됐
   다는 잘못된 주장을 했고, 불이익은 관심도 없었음.
                                 9
인포그래픽: 전립샘암 PSA 선별
검사의 득실
출처: US PSTF, NCI Cancer Bulletin 2012;9(23):12

55세부터 69세의 남자 1천 명이 매 1년부터 4년 간
격으로 10년 간 PSA 검사를 받을 경우
• 선별검사를 받은 1,000명 중
• 100~120명이 위양성 결과로 불안
  을 느끼고 조직검사 수행(조직검사로
   인한 부작용으로 심각한 감염, 통증, 출혈 등)
• 110명이 전립샘암 진단
    – 최소 50명이 합병증(감염, 성기능 장
      애, 방광이나 장 조절 문제 등) 치료
    – 4-5명이 전립샘암으로 사망(선별검
      사를 안받은 남자 중 5명이 사망)
    – 0~1명이 전립샘암으로 인한 사망 예
      방 가능
                                                 10
의사가 5년 생존율을 이해하는가?
• 선별검사 이득은 가끔 5년 생존율의 변화로
  표현
 – 더 높은 생존율이 항상 환자가 더 오래 생존함
   을 의미하지는 않음.
 – 5년 생존율의 변화와 사망률의 변화는 상관성
   이 없음(r=0.0)(Welch 등 2000)
 – 조기 발견 바이어스(lead-time bias)와 과잉진단
   바이어스(overdiagnosis bias)의 결과


                                      11
• 정기적인 선별검사를 받은 매 1천 명 당 얼
  마나 많은 사망을 예방할 수 있는지 질문
 – 5년 생존율을 제시한 경우
   • 평균 150명의 사망을 예방한다고 답변
   • 실제 SEER 사망 감소는 0명
 – 사망률을 제시한 경우
   • 한 명을 제외한 모든 의사가 사망 예방이 없음을 이
     해
   • 최종적으로 두 명의 의사만 조기 발견 바이어스의 개
     념을 이해했지만, 아무도 과잉진단 바이어스는 이해
     못했음.
                                12
• 독일에서 65명의 내과 전문의에게 전립샘암
  의 5년 생존율과 질병 특수 사망률을 제시한
  연구 결과
 – 5년 생존율을 제시한 경우
  • 66%가 선별검사를 보증하며 나중에 환자들에게 반
    드시 권고하겠다고 느꼈고, 79%가 선별검사는 효과
    적이라고 판정
 – 사망률을 제시한 경우
  • 같은 의사 중 단 8%만 선별검사를 권고하고, 5%만 효
    과적이라고 판정

                                  13
5년 생존율(5-year survival rate)
• 치료가 시작된 이후 또는 진단된 이후 5년간
  살아 있는 환자의 분율(%)

 – 5년이라는 수치에 특별한 의미 없음

 – 진단 이후 사망은 대부분 이 기간에 일어나므로
   암치료 성과에 대한 효과적 지표




                                 14
15
관찰 생존율(Observed survival)




                            16
17
18
19
20
21
22
23
조기 발견 바이어스
• 실제로 생존기간이 길어지지는 않았는데 단
  순히 진단이 빨라졌기 때문에 그만큼 더 오
  래 사는 것처럼 보이게 되는 바이어스.

• 어떤 암이 생긴 지 5년 만에 사망한다고 가
  정할 때 1년 만에 발견하면 4년의 생존기간
  으로 생각되고 4년째에 발견하면 1년의 생
  존기간으로 간주되는 경우

                             24
25
과잉진단 바이어스
• 집단검진의 열정으로 정상인데 위양성으로
  판단되어 질병이 있는 군으로 잘못 분류되
  는 경우 집단검진이 더 유효한 것으로 결과
  를 유도

• 집단검진이 아니었다면 평생 질병이 있는지
  도 모르고 지냈을 수 있었으나 집단검진으
  로 질병자로 구분되는 바이어스도 해당

                        26
27
의사가 비교 위험 감소를 이해하는가?
• 이득을 표현하는 방법
  – 비교 위험 감소(relative risk reduction, RRR)
  – 절대 위험 감소(absolute risk reduction, ARR)
  – 1명의 암사망을 예방하기 위해 치료(또는 선별검사)가
    필요한 사람의 숫자(the number of people needed to be
    treated, NNT)  1/ARR
• Lipitor의 뇌졸중 예방 효과 사례
  – RRR: Lipitor는 뇌졸중으로 고통받을 가능성을 약 48% 줄
    인다.
  – ARR: Lipitor는 뇌졸중으로 고통받을 가능성을 1천명당
    약 28명에서 약 15명으로 줄인다(1천명당 13명 또는
    1.3%)
  – NNT: 1명의 뇌졸중을 예방하기 위해, 77명에게 Lipitor를
    처방할 필요가 있다.
                                                   28
• 스위스 병원에서 15명의 부인과 전문의에게
  유방촬영술의 RRR 25%(1천명 당 4명에서 3
  명)의 의미를 질문
 – RRR 25%를 한 명은 1천명 당 2.5명으로, 나머지
   는 25명으로 이해. 1명에서 750명까지 매우 다
   양하게 답변.




                                     29
• 독일에서 150명의 부인과 전문의에게 RRR
  25%의 의미를 질문
 – 유방촬영술 선별검사는 유방암 사망을 약 25%
   감소시킨다. 40세 이상 1천 명의 여성이 유방촬
   영술을 받았다고 가정하자. 유방암으로 사망할
   가능성은 몇 명이나 줄어들 것인가?
   1
    25
    100
    250
                             30
• 3분의 2인 66%가 1명이라고 이해했고, 16%는 1천 명
  당 25명이라고 응답했으며, 심지어 15%는 250명이
  나 줄어든다고 응답. 교육 후에도 끝까지 한 명은
  250명이라고 고집.
  – 이득을 RRR로 표현하면 의료인이나 관리자가 자주 과
    대추정하는 오류

• 내과적 중재술의 효과
  ① RRR은 급성 심근경색증 34% 감소
  ② ARR은 급성 심근경색증 1.4% 감소
  ③ 급성 심근경색증의 AR이 3.9%에서 2.5%로 감소
  ④ NNT는 77명
  – 네 가지 지표를 제시한 결과 140명의 리뷰어 중 3명만
    같음을 인지
                                      31
와파린 예제
•       치료로 얻는 편익(benefit)
    –    다양한 연구를 통해 심방 세동이 있는 환자에게 와파
         린을 장기간 투약하면 뇌졸중을 예방한다고 알려져
         있음.
    –    와파린 미투약시 평균 뇌졸중 발생률 = 100 인-년당
         5.1명 = 연간 0.051명
    –    와파린 투약시 평균 뇌졸중 발생률 = 100 인-년당 1.8
         명 = 연간 0.018명
•       치료로 겪는 위해(harm)
    –    심방 세동 환자에서 와파린 투약으로 인한 심각한 부
         작용은 100 인-년당 1명 = 연간 0.01명으로 추정(가상
         자료)

                                          32
치료로 얻는 편익의 측정 지표
• 위험 차이(Risk difference)
  = Risk (노출군) – Risk (비노출군)
  = 5.1 – 1.8 = 100인-년당 3.3명
• 절대 위험 감소(Absolute risk reduction, ARR)
  = Risk (노출군) – Risk (비노출군)
  = 0.051 – 0.018 = 0.033
• 비교 위험 감소(Relative risk reduction, RRR)
  = [Risk (노출군) – Risk (비노출군)] / Risk (노출군)
  = (0.051 – 0.018) / 0.051 = 0.65 = 65%


                                              33
치료로 겪는 위해
• 절대 위험도 증가(Absolute risk increase, ARI)
  = Risk (노출군) – Risk (비노출군)
  = 0.01




                                       34
치료 필요 환자수와 부작용 발생수의 계산

• 치료 필요 환자수(Numbers needed to treat,
  NNT)
  – 연간 한 명의 뇌졸중 환자를 예방하기 위해 와파린
    투여가 필요한 심방세동 환자수
  NNT = 1/ARR = 1/0.033 = 30.3 = 약 31명
• 부작용 발생수(Numbers need to harm, NNH)
  – 연간 와파린 치료를 받아 심각한 후유증이 발생한
    심방세동 환자수
  NNH = 1/ARI = 1/0.01 = 100명
  *ARR/ARI=3.3, NNH/NNT=3.3  편익이 발생한 환자
    수가 부작용 발생 환자수보다 3배 크다는 뜻.
                                           35
theNNT.com
http://www.thennt.com




                        36
theNNT.com
http://www.thennt.com




                        37
의사가 검사의 민감도와 특이도를
     혼동하는가?
• 어떤 지역에서 유방촬영술을 이용해 유방암
  검진을 수행한다고 가정하자. 이 지역에서
  여성에 대한 정보는 다음과 같다.
 – 어떤 여성이 유방암이 있을 확률(유병률)은 1%
 – 어떤 여성이 유방암이 있다면, 검사 결과가 양
   성이 확률(민감도)은 90%
 – 어떤 여성이 유방암이 없는데도, 검사 결과가
   양성일 확률(위양성률)은 9%


                                38
• 어떤 여성의 유방촬영술 결과가 양성이었다
  . 이 여성은 자신이 분명히 유방암이 있는지,
  아니면 우연의 결과인지 알기를 원한다. 가
  장 올바른 답은?
 A. 여성이 유방암이 있을 확률은 약 81%다.
 B. 유방촬영술 양성인 여성 10명 중 약 9명이 유
    방암이 있다.
 C. 유방촬영술 양성인 여성 10명 중 약 1명이 유
    방암이 있다.
 D. 여성이 유방암이 있을 확률은 약 1%다.
                                 39
유방암 검진: 자연 빈도 이용




                   40
• 대부분의 의사가 검사의 양성 예측도의 개
  념을 모르고 판정을 못내림.
 – 연구 참여 의사 중 18%만 확률 정보로 양성 예
   측도를 추론(Casscells 등 1978)
 – 100명의 의사 중 95명이 유방촬영술 양성 이후
   유방암 확률을 과대추정(Eddy 1982)
 – 산과 전문의 21명 중 단 1명만 다운 증후군 검사
   양성 이후 실제 확률 추정 가능


                              41
급성 흉통 환자
• 두 명의 환자가 급성 흉통(acute substernal pain)으
  로 응급실을 방문했다.
  – 환자 A: 34세 여자, 비흡연자, 과거력 없음.
  – 환자 B: 55세 남자, 고혈압, 당뇨, 이상지질혈증, 25갑년
    흡연


• 급성 심근경색증 감별을 위해 실시할 검사는?
  – 심전도, 심근 효소(CK-MB, Myoglobulin, Troponin)


• 양성 예측도(검사 결과 양성일 때 질환을 갖고 있
  을 확률)는 어느 쪽이 높을까? 그 이유는?
                                               42
진단검사법의 타당도 기준
                                    질병 상태
               검사 결과          있음            없음     전체
               양성              a            b      a+b
               음성              c            d       c+d
               전체             a+c           b+d   a+b+c+d

•   민감도(감수성, sensitivity)=a/(a+c)
•   특이도(특이성, specificity)=d/(b+d)
•   위양성(의양성, false-positive rate)=b/(b+d)
•   위음성(의음성, false-negative rate)=c/(a+c)
•   유병률(prevalence)=(a+c)/(a+b+c+d)
•   양성 예측도(positive predictive value)=a/(a+b)
•   음성 예측도(negative predictive value)=d/(c+d)

• 양성 가능도 비(likelihood ratio positive, LR+)=[a/(a+c)]/[b/(b+d)]
• 음성 가능도 비(likelihood ratio negative, LR-)=[c/(a+c)]/[d/(b+d)]   43
1. 민감도(sensitivity)
  – 질병이 있는 환자가 양성인 검사 결과 확률
  – 확률(진단결과 양성 환자 | 질병이 있는 환자)
  – Pr(T+∩D+|D+) = a/(a+c)


2. 특이도(specificity)
  – 질병이 없는 사람이 음성인 검사 결과 확률
  – 확률(진단결과 음성 사람 | 질병이 없는 사람)
  – Pr(T-∩D-|D-) = d/(b+d)
                                 44
3. 위음성률(false-negative rate), 위양성률
   (false-positive rate)
 – 위음성률
   •   질병이 있는 사람이 검사 결과 음성 확률
   •   Pr(T-∩D+|D+) = c/(a+c)
 – 위양성률
   •   질병이 없는 사람이 검사 결과 양성 확률
   •   Pr(T+∩D-|D-) = b/(b+d)



                                     45
4. 양성예측도(positive predictive value)와 음성예
   측도(negative predictive value)
 –   민감도와 특이도는 검사법의 정확도 평가 방법의
     하나로, 특정 검사법의 고유한 성질
 –   검사결과가 질병 진단 효용성(usefullness)은 양성
     및 음성 예측도 이용 평가
 –   양성예측도
     •   확률(진단결과 양성인 환자 | 진단결과 양성인 사람)
     •   Pr(T+∩D+|T+) = a/(a+b)
 – 음성예측도
     •   확률(진단결과 음성인 사람 | 진단결과 음성인 사람)
     •   Pr(T+∩D+|T+) = a/(a+b)
                                         46
• 예측도는 검사법의 민감도, 특이도에 의해
  결정되기도 하지만, 인구집단의 유병률에
  의해 달라짐.

• 일반적으로 해당 질병의 유병률이 높은 집
  단에서는 양성 예측도가 높고, 음성 예측도
  는 낮은 경향.


                            47
48
Thomas Bayes (1702-1761)       Charlie Sheen (1965 - present)
                           The Movie: “Return of Thomas Bayes”
                                                          49
유병률, 민감도, 특이도와 예측도 관계

                  민감도x유병률
 양성예측도=
          (민감도x유병률)+(1-특이도)x(1-유병률)




                  특이도x유병률
 음성예측도=
          (1-민감도)x유병률)+(특이도)x(1-유병률)




                                       50
바이러스 감염 사례
• 바이러스 감염 진단 혈청 검사법이 병원에
  새로 도입
• 검사법의 민감도와 특이도는 각각 90%와
  95%
• 이전 임상 연구 결과 최종적으로 장염 확진
  비율은 20%
• 새로운 검사법으로 환자를 검사해서 검사결
  과가 양성으로 나왔을 때, 바이러스 감염 환
  자일 확률(양성예측도)은?
                         51
공식 이용

               0.90x0.20
양성예측도=                             = 0.82
         0.90x0.20+(1-0.95)x0.80




               0.95x0.20
음성예측도=                             = 0.97
         (1-0.90)x0.20+0.95x0.80




                                            52
자연 빈도 이용
           1,000명


   200명             800명
    감염               정상


180명      20명   40명    760명
 양성       음성    양성      음성


   p(감염|양성)=180/(180+40)

                              53
가능도비(likelihood ratio) 이용
1. 검사전 오즈(pretest odds)
  = 검사전 확률 / (1 – 검사전 확률)


2. 검사후 오즈(posttest odds)
  = 검사전 오즈 X 가능도 비(likelihood ratio)


3. 검사후 확률(posttest probability)
  = 검사후 오즈 / (1 + 검사후 오즈)

                                       54
가능도비
• 양성 가능도비(LR+)
 = 질병이 있는 사람에서 검사 결과 양성 확률 / 질
   병이 없는 사람에서 검사 결과 양성 확률
 = 민감도 / (1 - 특이도)

 * LR+>1  검사 결과가 양성인 환자에서 질병이
   있을 확률이 증가 의미

• 음성 가능도비
 = (1 – 특이도) / 민감도
                                 55
가능도비 이용
1. 검사전 오즈
 = 유병률/(1 - 유병률) = 0.2/0.8 = 0.25
 – 가능도 비
   = 민감도/(1 - 특이도) = 0.90/0.05 = 18
2. 검사후 오즈
 = 검사전 오즈 X 양성 가능도비 = 0.25X18 = 4.5
3. 검사후 확률(양성 예측도)
 = 검사후 오즈/(1+검사후 오즈)
 = 4.5/5.5 = 82%
                                      56
소아 중이염 사례
• 4세 소아가 귀의 통증을 주소로 외래 방문
 – 이 연령대 소아에서 급성 중이염 유병률 약 20%
   로 추정
• 이경(otoscope)으로 아이의 귀를 검사한 결
  과 고막 색깔이 흐림(cloudy).

• 이 아이가 중이염을 갖고 있을 확률은 얼마
  나 되는가?

                                57
Table. Likelihood ratios for three major signs of otitis media

Signs of otitis media                           Likelihood ratio (95% CI)
Color
 Cloudy                                         34(28—42)
 Distinctly red                                 8.4(6.7—11)
 Slightly red                                   1.4(1.1—1.8)
 Normal                                         0.2(0.19—0.21)
Position
 Bulging                                        51(36—73)
 Retracted                                      3.5(2.9—4.2)
 Normal                                         0.5(0.49—0.51)
Mobility
 Distinctly impaired                            31(26—37)
 Slightly impaired                              4.0(3.4—4.7)
 Normal                                         0.2(0.19—0.21)
From Rothman, R., Owens, T., Simel, D.L. Does this child have acute otitis media? J Am Med   58
Assoc 2003; 290: 1633-40
중이염: 가능도비 이용
1. 검사전 오즈 = 0.20/0.80 = 0.25
  – 양성 가능도 비 = 34  Table.
2. 검사후 오즈 = 0.25x34 = 8.5
3. 검사후 확률 = 8.5/9.5 = 89%

• 4세 소아가 귀 통증이 있을 때, 이경 검사에
  서 고막이 흐리면 급성 중이염 확률 89%이
  므로 항생제 처방
                               59
Chest 2007;132:959-965




                         60
의사가 확실성의 환상을 만드는가?
• 1987년에 열린 AIDS 학술회의에서 전직 플
  로리다 중 상원의원 Lawton Chiles는 플로리
  다에서 헌혈 혈액 ELISA 검사 결과 양성 반응
  을 보인 22명의 헌혈자 중 7명이 자살했다는
  충격적 결과 발표
• ELISA와 Western blot은 모두 민감도와 특이
  도가 약 99.99%로 매우 높음.
• 1만 명의 저위험 행동 동성애 남자에서 HIV
  유병률은 1명  선별검사 양성인 남자에서
  실제 HIV 감염 확률은 50%가 되지 않음.
                                61
자연 빈도 이용
            10,000명 남자


     1명              9,999명
     HIV+              정상


1명          0명     1명      9,998명
양성          음성     양성        음성


     p(HIV+|검사+)=1/(1+1)

                                    62
• 의료 전문가의 확실성에 대한 환상과 보건
  의료 통계에 대한 몰이해는 분명히 경고할
  만한 상황

• 그렇다면 왜 그렇게 많은 의료 전문가가 통
  계맹인가?



                            63
원인
• 기초 계산능(Basic Numeracy)
  – 단순 스케일에 대한 검사로 기초 계산능 평가
    • 백분율을 숫자로 환산
    • 숫자를 백분율로 환산
    • 우연에 의한 결과에 익숙한 정도
  – 72%의 의사만 세 질문에 정확하게 답변
  – 가장 어려워 한 작업은 1천 명 당 1명을 백분율
    로 변환하는 과정으로, 4명 중 1명이 틀림.


                                  64
65
원인
• 의학 저널과 의사 유인물
 – 의학 저널이 연구 결과를 발표할 때 RRR과 같은 불
   투명한 보건의료 통계를 사용
 – Nuovo, Melnikow, Chang 2002
   • Ann Intern Med, BMJ, JAMA, The Lancet, NEJM에 실린 359
     편의 무작위 시험 논문 분석 결과
   • 단 25편만 ARR을 보고, 25편 중 14편만 NNT를 포함
   • 약 7%의 논문만 투명한 방식으로 결과를 보고
 – Sedrakyan과 Shih 2007
   • BMJ, JAMA, The Lancet 2004~2006년 논문 분석 결과
   • 약 절반이 절대 위험이나 투명한 빈도 데이터를 보고하지
     않음.
                                                       66
원인
• 불일치 프레이밍(mismatching framing)
  – 이득은 큰 숫자로(RRR), 위해는 작은 숫자로(절
    대 위험 증가)
  – USPSTF 2002
    • 이득: “S자 결장경 선별검사가 범위 내 발생한 암으
      로 인한 사망의 59%를 감소시켰다.”
    • 위해: “천공은 S자 결장경 검진을 받은 1,000명에서
      10,000명 당 약 1명에서 발생했다.”
  – Sedrakyan과 Shih 2007
    • 대부분 경우 이득은 비교 위험으로, 위해는 절대 빈
      도로 제시
                                        67
원인
• 의학 교육
 – Gigerenzer 2007
   • 미국의학교육학회에 의과대학 교육에서 통계맹 문
     제 해결을 위한 교육 계획 문의  없음.
 – Odette Wegwarth
   • 미국내과학회와 135개 의과대학에 의학 통계학과 위
     험 소통 과정에 대한 시험이 있는지 이메일 문의 
     3%만 임상 역학 과정 있고 위험 소통은 전무
 – 미네소타 의대
   • 2010/11 생물통계학과 위험 관리에 대한 과정 전환

                                      68
대책
• 의과대학생과 의사가 의학 통계를 이해하도
  록 교육
 – 문제 해결 방식으로 통계학 교육

 – 통합 교육
  • 시드니 대학교(PEARLS program)
  • 맨체스터 대학교(BestBets)




                              69
대책
• 의과대학생과 의사에게 위험 소통 기법을 교육
 – 절대 위험과 비교 위험
  • Lipitor는 뇌졸중 빈도를 1,000명 당 28명에서 15명으로 감
    소
  • 절대 위험 감소: 1,000명 당 13명(1.3%)
  • 비교 위험 감소: (28-15)/28*100=48%  많은 사람들이 비
    교 위험 감소가 48%라는 표현을 들으면 처방 받은 1,000
    명 중 평균 480명의 뇌졸중을 예방한다고 이해
  • NNT: 77명
 – 오해를 피하기 위해 모든 의사와 의과대학생은 절
   대 위험과 비교 위험의 차이를 알아야 함.

                                           70
대책
• 의과대학생과 의사에게 위험 소통 기법을
  교육
 – 빈도 기술과 단일 사건 확률

 – 대장암 유병률 0.3%
 – FOBT 민감도 50%, 위양성률 3%
 – FOBT 양성일 때 대장암 확률?



                           71
자연 빈도 이용
       10,000명 남자


  30명            9,970명
  대장암              정상


15명     15명   299명    9,671명
양성      음성     양성       음성


p(대장암|FOBT 양성)=15/(15+299)

                               72
대책
• 의과대학생과 의사에게 위험 소통 기법을
  교육
 – 빈도 기술 대 단일 사건 확률
 – “당신이 Prozac을 먹으면, 30%~50%에서 조루나
   성욕 감퇴 등 성기능 문제가 생길 수 있습니다.”
 – 많은 환자는 자신의 성활동의 30%~50%에서 성
   기능 문제가 생길 수 있다고 생각
 – 실제는 “Prozac을 먹는 환자 10명 중 3~5명에서
   성기능 문제가 생길 수 있다.”로 해석

                                 73
의료의 통계맹: 민주적 이상
• 물리학과 생물학과 같은 다양한 분야의 과
  학과 같이 통계적 사고의 혁명적 확산이 모
  든 의사에 이르고 있지는 않음.
• 의사의 통계맹은 주로 환경의 문제로 마인
  드의 문제는 아님.
• 통계능의 꿈은 환자-의사 간 의사 소통뿐 아
  니라 민주주의 기능 강화에도 근본적.


                         74
75
참고문헌
1.   Gigerenzer G. (2002). Calculated Risks: How to Know When
     Numbers Deceive You. New York: Simon & Schuster
2.   Gigerenzer G, Gaissmaier W, Kurz-Mileke E, Schwartz LM,
     Woloshin S. (2008). Helping Doctors and Patients Make Sense of
     Health Statistics. Psychological Science in the Public Interest, 8(2),
     53-96.
3.   Gigerenzer G, Muir Gray JA. (2012). Better Doctors, Better
     Patients, Better Decisions: Envisioning Health Care 2020.
     Cambridge, MA: MIT Press
4.   Gordis L. (2008). Epidemiology, 4th ed. Philadelphia, PA: Saunders
     Elsevier
5.   Katz D, Elmore JG, Wild DMG, Lucan SC. (2013) Jekel’s
     Epidemiology, Biostatistics, Preventive Medicine, and Public
     Health, 4th ed. Philadelphia, PA: Saunders Elsevier
6.   Katz MH. (2006) Study Design and Statistical Analysis: A Practical
     Guide for Clinicians. New York: Cambridge University Press
                                                                          76
인문학과 기술의 융합처럼, 진료와 연구의 융합에는 통계가 있다.
수고했습니다.

Mais conteúdo relacionado

Mais procurados

Carcinoma cervix management : 2022 nccn guidelines
Carcinoma cervix management : 2022 nccn guidelinesCarcinoma cervix management : 2022 nccn guidelines
Carcinoma cervix management : 2022 nccn guidelinesDr. Naina Kumar Agarwal
 
Logistic regression (blyth 2006) (simplified)
Logistic regression (blyth 2006) (simplified)Logistic regression (blyth 2006) (simplified)
Logistic regression (blyth 2006) (simplified)MikeBlyth
 
Mutiple linear regression project
Mutiple linear regression projectMutiple linear regression project
Mutiple linear regression projectJAPAN SHAH
 
Randomization: Too Important to Gamble with.
Randomization: Too Important to Gamble with.Randomization: Too Important to Gamble with.
Randomization: Too Important to Gamble with.Dennis Sweitzer
 
Calculating a two sample z test by hand
Calculating a two sample z test by handCalculating a two sample z test by hand
Calculating a two sample z test by handKen Plummer
 
Kappa statistics
Kappa statisticsKappa statistics
Kappa statisticsAmeyDhatrak
 
Colorectal Cancer Detection: Fact vs Fiction
Colorectal Cancer Detection: Fact vs FictionColorectal Cancer Detection: Fact vs Fiction
Colorectal Cancer Detection: Fact vs FictionJarrod Lee
 

Mais procurados (10)

Carcinoma cervix management : 2022 nccn guidelines
Carcinoma cervix management : 2022 nccn guidelinesCarcinoma cervix management : 2022 nccn guidelines
Carcinoma cervix management : 2022 nccn guidelines
 
Logistic regression (blyth 2006) (simplified)
Logistic regression (blyth 2006) (simplified)Logistic regression (blyth 2006) (simplified)
Logistic regression (blyth 2006) (simplified)
 
Mutiple linear regression project
Mutiple linear regression projectMutiple linear regression project
Mutiple linear regression project
 
Randomization: Too Important to Gamble with.
Randomization: Too Important to Gamble with.Randomization: Too Important to Gamble with.
Randomization: Too Important to Gamble with.
 
Logistic regression sage
Logistic regression sageLogistic regression sage
Logistic regression sage
 
Calculating a two sample z test by hand
Calculating a two sample z test by handCalculating a two sample z test by hand
Calculating a two sample z test by hand
 
Breast screening pallavi
Breast screening pallaviBreast screening pallavi
Breast screening pallavi
 
Kappa statistics
Kappa statisticsKappa statistics
Kappa statistics
 
Colorectal Cancer Detection: Fact vs Fiction
Colorectal Cancer Detection: Fact vs FictionColorectal Cancer Detection: Fact vs Fiction
Colorectal Cancer Detection: Fact vs Fiction
 
The odds ratio
The odds ratioThe odds ratio
The odds ratio
 

Semelhante a 의사들의 통계맹(Statistically Illiteracy in Doctors)

유밤암 조기검진 받을까,말까 (2015)
유밤암 조기검진 받을까,말까 (2015)유밤암 조기검진 받을까,말까 (2015)
유밤암 조기검진 받을까,말까 (2015)여성환경연대
 
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건Yoon Sup Choi
 
Healthcare worker and patient safety(jaeholee)
Healthcare worker and patient safety(jaeholee)Healthcare worker and patient safety(jaeholee)
Healthcare worker and patient safety(jaeholee)JaeHo Lee
 
중간평가 진짜 리얼 최최종 Hpv조
중간평가 진짜 리얼 최최종 Hpv조중간평가 진짜 리얼 최최종 Hpv조
중간평가 진짜 리얼 최최종 Hpv조hongyena97
 
Choice, transparency, coordination, and quality among direct to-consumer tele...
Choice, transparency, coordination, and quality among direct to-consumer tele...Choice, transparency, coordination, and quality among direct to-consumer tele...
Choice, transparency, coordination, and quality among direct to-consumer tele...Nuri Na
 
유전자 분석시장 개요 및 동향 2013년 4월
유전자 분석시장 개요 및 동향 2013년 4월유전자 분석시장 개요 및 동향 2013년 4월
유전자 분석시장 개요 및 동향 2013년 4월민영 김
 
Cancer 101 Lung Cancer 폐암
Cancer 101 Lung Cancer 폐암Cancer 101 Lung Cancer 폐암
Cancer 101 Lung Cancer 폐암ssuseracd5ac
 
Otis 2014.09.30
Otis 2014.09.30Otis 2014.09.30
Otis 2014.09.30mothersafe
 
자궁경부암 리서치, Q&A
자궁경부암 리서치, Q&A자궁경부암 리서치, Q&A
자궁경부암 리서치, Q&Ahongyena97
 
SBS 8시 뉴스 과잉평가기준의 문제..
SBS 8시 뉴스 과잉평가기준의 문제..SBS 8시 뉴스 과잉평가기준의 문제..
SBS 8시 뉴스 과잉평가기준의 문제..기세 남
 
20120924서강대발표 암의 이해
20120924서강대발표 암의 이해20120924서강대발표 암의 이해
20120924서강대발표 암의 이해SG Choi
 
12 역학
12 역학12 역학
12 역학Nam-young Lee
 
Compassionate use of remdesivir for patients with severe covid 19
Compassionate use of remdesivir  for patients with severe covid 19Compassionate use of remdesivir  for patients with severe covid 19
Compassionate use of remdesivir for patients with severe covid 19Youngwhan Hong
 
Endometrium cancer 101
Endometrium cancer 101Endometrium cancer 101
Endometrium cancer 101ssuseracd5ac
 
데이터_공모전_데사드림팀.pptx
데이터_공모전_데사드림팀.pptx데이터_공모전_데사드림팀.pptx
데이터_공모전_데사드림팀.pptxssuserefcaed
 
유방암과 환경요인 2차연구 보고서
유방암과 환경요인 2차연구 보고서유방암과 환경요인 2차연구 보고서
유방암과 환경요인 2차연구 보고서여성환경연대
 
리더스헬스케어
리더스헬스케어리더스헬스케어
리더스헬스케어rotcbiz
 
[4] 신종인플루엔자 h1 n1 20091116
[4] 신종인플루엔자 h1 n1 20091116[4] 신종인플루엔자 h1 n1 20091116
[4] 신종인플루엔자 h1 n1 20091116Changhwa Lee
 

Semelhante a 의사들의 통계맹(Statistically Illiteracy in Doctors) (20)

유밤암 조기검진 받을까,말까 (2015)
유밤암 조기검진 받을까,말까 (2015)유밤암 조기검진 받을까,말까 (2015)
유밤암 조기검진 받을까,말까 (2015)
 
Epidemiology
EpidemiologyEpidemiology
Epidemiology
 
역학 정리
역학 정리역학 정리
역학 정리
 
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건
웨어러블 디바이스 Zeo의 실패에서 배우는: 성공적인 헬스케어 서비스의 조건
 
Healthcare worker and patient safety(jaeholee)
Healthcare worker and patient safety(jaeholee)Healthcare worker and patient safety(jaeholee)
Healthcare worker and patient safety(jaeholee)
 
중간평가 진짜 리얼 최최종 Hpv조
중간평가 진짜 리얼 최최종 Hpv조중간평가 진짜 리얼 최최종 Hpv조
중간평가 진짜 리얼 최최종 Hpv조
 
Choice, transparency, coordination, and quality among direct to-consumer tele...
Choice, transparency, coordination, and quality among direct to-consumer tele...Choice, transparency, coordination, and quality among direct to-consumer tele...
Choice, transparency, coordination, and quality among direct to-consumer tele...
 
유전자 분석시장 개요 및 동향 2013년 4월
유전자 분석시장 개요 및 동향 2013년 4월유전자 분석시장 개요 및 동향 2013년 4월
유전자 분석시장 개요 및 동향 2013년 4월
 
Cancer 101 Lung Cancer 폐암
Cancer 101 Lung Cancer 폐암Cancer 101 Lung Cancer 폐암
Cancer 101 Lung Cancer 폐암
 
Otis 2014.09.30
Otis 2014.09.30Otis 2014.09.30
Otis 2014.09.30
 
자궁경부암 리서치, Q&A
자궁경부암 리서치, Q&A자궁경부암 리서치, Q&A
자궁경부암 리서치, Q&A
 
SBS 8시 뉴스 과잉평가기준의 문제..
SBS 8시 뉴스 과잉평가기준의 문제..SBS 8시 뉴스 과잉평가기준의 문제..
SBS 8시 뉴스 과잉평가기준의 문제..
 
20120924서강대발표 암의 이해
20120924서강대발표 암의 이해20120924서강대발표 암의 이해
20120924서강대발표 암의 이해
 
12 역학
12 역학12 역학
12 역학
 
Compassionate use of remdesivir for patients with severe covid 19
Compassionate use of remdesivir  for patients with severe covid 19Compassionate use of remdesivir  for patients with severe covid 19
Compassionate use of remdesivir for patients with severe covid 19
 
Endometrium cancer 101
Endometrium cancer 101Endometrium cancer 101
Endometrium cancer 101
 
데이터_공모전_데사드림팀.pptx
데이터_공모전_데사드림팀.pptx데이터_공모전_데사드림팀.pptx
데이터_공모전_데사드림팀.pptx
 
유방암과 환경요인 2차연구 보고서
유방암과 환경요인 2차연구 보고서유방암과 환경요인 2차연구 보고서
유방암과 환경요인 2차연구 보고서
 
리더스헬스케어
리더스헬스케어리더스헬스케어
리더스헬스케어
 
[4] 신종인플루엔자 h1 n1 20091116
[4] 신종인플루엔자 h1 n1 20091116[4] 신종인플루엔자 h1 n1 20091116
[4] 신종인플루엔자 h1 n1 20091116
 

의사들의 통계맹(Statistically Illiteracy in Doctors)

  • 1. 의사들의 통계맹 Statistically Illiteracy in Doctors LEMS Colloquium 2013/3/20 황 승 식 인하대학교 의학전문대학원 사회의학교실 cyberdoc@inha.ac.kr, @cyberdoc73
  • 2. Statistical Illiteracy in Doctors • Better Doctors, Better Patients, Better Decisions: Envisioning Health Care 2020 중 9 장 – Odette Wegwarth와 Gerd Gigerenzer가 집필 2
  • 3. 게르트 기거렌처 (1947~ 막스플랑크연구소 • 수학맹의 특징 1. 확실성에 대한 환상 2. 위험에 대한 무지 3. 잘못된 위험 소통 4. 흐릿한 사고 『계산된 위험』(전현 우, 황승식 옮김, 도서출 판 살림, 2013년 근간) 3
  • 4. 차례 1. 들어가며 2. 의사는 선별검사의 득실을 아는가? 3. 의사는 5년 생존율을 이해하는가? 4. 의사는 비교 위험 감소를 이해하는가? 5. 의사는 검사의 민감도와 특이도를 혼동하 는가? 6. 의사는 확실성의 환상을 만들어내는가? 7. 원인 8. 대책 9. 의료에서 통계맹: 민주적 이상 4
  • 5. 들어가며 • 약 28만명의 여성에 대한 유방촬영술 선별검사 무작위 시험 4건 결과(Nyström 등 1996) – 10년 간 선별검사에 참여한 여성 천 명 당 3명이, 선 별검사에 참여하지 않은 여성 천 명 당 4명이 유방 암으로 사망 • 약 50만명 여성이 참여한 무작위 시험을 포함 한 코크란 리뷰 결과 절대 위험 감소(absolute risk reduction)는 미미 (Gøtzche와 Nielsen 2006) – 유방촬영술은 유방암으로 사망할 2천명의 여성 중 1명을 구한다는 결과 추정 – 10명의 여성이 선별검사 결과로 과잉치료를 받음. 5
  • 6. 들어가며 • 유방촬영술의 득실에 대한 부인과 전문의의 지식을 확인하는 연구 수행(Wegwarth와 Gigerenzer 2010a) – 제 어머니께서 최근 유방촬영술을 받으라는 권 고를 받았습니다. 어머니 연세는 55세고, 가족 중에 유방암 환자는 없었으며, 유방암을 시사하 는 어떤 증상도 없었습니다. 어머니는 선별검사 가 효과적일지 의문을 갖고 계십니다. 하지만 저는 어머니 연령대에 유방촬영술을 받는 편이 바람직하다고 생각하는데 유방촬영술의 득실 에 대해 알고 싶습니다. 6
  • 7. 들어가며 • 면담에 참여한 20명의 부인과 전문의 중 17 명이 유방촬영술은 안전하고 과학적으로 잘 정립된 개입이라며 강력히 권고 • 단 7명의 부인과 전문의만 이익을 숫자로 표 현했고, 범위는 20%~50%로 다양 – 유방촬영술의 유방암 사망 절대 위험 감소는 1 천 명 당 5명에서 4명으로 1명 감소이고, 이를 비교 위험 감소로 표현하면 20%임(Nyström 등 2002) 7
  • 8. 들어가며 • 부인과 전문의 누구도 유방촬영술 선별검사로 인한 과잉진단과 과잉치료의 위해를 언급하지 않음. – 유방촬영술의 잠재적 위해를 “무시할만한 (negligible)” 정도라고 설명. – 20명 중 단 3명만 특정 위해를 숫자로 제공했으나, 그나마 두 명은 정보가 잘못됐음. • 9개 유럽 국가에서 수행된 연구 결과 의사의 지 식 부족이 바로 환자의 지식을 약화(Gigerenzer 등 2009) – 잦은 의사 방문이 선별검사의 이득에 대한 환자의 이해를 높이지 않으며 오히려 약간 과장 8
  • 9. 의사는 선별검사의 득실을 아는가? • 전립샘암 PSA 선별검사 사례 – 60세 남자 의사가 베를린의 135명 비뇨기과 전문의 중 20명을 무작위 추출하여 PSA 선별검사에 대한 조언을 구함(Stiftung Warentest 2004) – 가이드라인에 따르면 검사 전에 철저하고 체계적 인 상담이 필요 – 20명 중 단 두 명이 적절한 정보를 알았고 환자의 질 문에 답할 수 있었음. – 다른 4명은 어느 정도 정보를 알았지만, 대다수인 14명은 환자의 질문 대부분에 답을 못하거나, PSA 선별검사가 생명을 연장한다고 과학적으로 입증됐 다는 잘못된 주장을 했고, 불이익은 관심도 없었음. 9
  • 10. 인포그래픽: 전립샘암 PSA 선별 검사의 득실 출처: US PSTF, NCI Cancer Bulletin 2012;9(23):12 55세부터 69세의 남자 1천 명이 매 1년부터 4년 간 격으로 10년 간 PSA 검사를 받을 경우 • 선별검사를 받은 1,000명 중 • 100~120명이 위양성 결과로 불안 을 느끼고 조직검사 수행(조직검사로 인한 부작용으로 심각한 감염, 통증, 출혈 등) • 110명이 전립샘암 진단 – 최소 50명이 합병증(감염, 성기능 장 애, 방광이나 장 조절 문제 등) 치료 – 4-5명이 전립샘암으로 사망(선별검 사를 안받은 남자 중 5명이 사망) – 0~1명이 전립샘암으로 인한 사망 예 방 가능 10
  • 11. 의사가 5년 생존율을 이해하는가? • 선별검사 이득은 가끔 5년 생존율의 변화로 표현 – 더 높은 생존율이 항상 환자가 더 오래 생존함 을 의미하지는 않음. – 5년 생존율의 변화와 사망률의 변화는 상관성 이 없음(r=0.0)(Welch 등 2000) – 조기 발견 바이어스(lead-time bias)와 과잉진단 바이어스(overdiagnosis bias)의 결과 11
  • 12. • 정기적인 선별검사를 받은 매 1천 명 당 얼 마나 많은 사망을 예방할 수 있는지 질문 – 5년 생존율을 제시한 경우 • 평균 150명의 사망을 예방한다고 답변 • 실제 SEER 사망 감소는 0명 – 사망률을 제시한 경우 • 한 명을 제외한 모든 의사가 사망 예방이 없음을 이 해 • 최종적으로 두 명의 의사만 조기 발견 바이어스의 개 념을 이해했지만, 아무도 과잉진단 바이어스는 이해 못했음. 12
  • 13. • 독일에서 65명의 내과 전문의에게 전립샘암 의 5년 생존율과 질병 특수 사망률을 제시한 연구 결과 – 5년 생존율을 제시한 경우 • 66%가 선별검사를 보증하며 나중에 환자들에게 반 드시 권고하겠다고 느꼈고, 79%가 선별검사는 효과 적이라고 판정 – 사망률을 제시한 경우 • 같은 의사 중 단 8%만 선별검사를 권고하고, 5%만 효 과적이라고 판정 13
  • 14. 5년 생존율(5-year survival rate) • 치료가 시작된 이후 또는 진단된 이후 5년간 살아 있는 환자의 분율(%) – 5년이라는 수치에 특별한 의미 없음 – 진단 이후 사망은 대부분 이 기간에 일어나므로 암치료 성과에 대한 효과적 지표 14
  • 15. 15
  • 17. 17
  • 18. 18
  • 19. 19
  • 20. 20
  • 21. 21
  • 22. 22
  • 23. 23
  • 24. 조기 발견 바이어스 • 실제로 생존기간이 길어지지는 않았는데 단 순히 진단이 빨라졌기 때문에 그만큼 더 오 래 사는 것처럼 보이게 되는 바이어스. • 어떤 암이 생긴 지 5년 만에 사망한다고 가 정할 때 1년 만에 발견하면 4년의 생존기간 으로 생각되고 4년째에 발견하면 1년의 생 존기간으로 간주되는 경우 24
  • 25. 25
  • 26. 과잉진단 바이어스 • 집단검진의 열정으로 정상인데 위양성으로 판단되어 질병이 있는 군으로 잘못 분류되 는 경우 집단검진이 더 유효한 것으로 결과 를 유도 • 집단검진이 아니었다면 평생 질병이 있는지 도 모르고 지냈을 수 있었으나 집단검진으 로 질병자로 구분되는 바이어스도 해당 26
  • 27. 27
  • 28. 의사가 비교 위험 감소를 이해하는가? • 이득을 표현하는 방법 – 비교 위험 감소(relative risk reduction, RRR) – 절대 위험 감소(absolute risk reduction, ARR) – 1명의 암사망을 예방하기 위해 치료(또는 선별검사)가 필요한 사람의 숫자(the number of people needed to be treated, NNT)  1/ARR • Lipitor의 뇌졸중 예방 효과 사례 – RRR: Lipitor는 뇌졸중으로 고통받을 가능성을 약 48% 줄 인다. – ARR: Lipitor는 뇌졸중으로 고통받을 가능성을 1천명당 약 28명에서 약 15명으로 줄인다(1천명당 13명 또는 1.3%) – NNT: 1명의 뇌졸중을 예방하기 위해, 77명에게 Lipitor를 처방할 필요가 있다. 28
  • 29. • 스위스 병원에서 15명의 부인과 전문의에게 유방촬영술의 RRR 25%(1천명 당 4명에서 3 명)의 의미를 질문 – RRR 25%를 한 명은 1천명 당 2.5명으로, 나머지 는 25명으로 이해. 1명에서 750명까지 매우 다 양하게 답변. 29
  • 30. • 독일에서 150명의 부인과 전문의에게 RRR 25%의 의미를 질문 – 유방촬영술 선별검사는 유방암 사망을 약 25% 감소시킨다. 40세 이상 1천 명의 여성이 유방촬 영술을 받았다고 가정하자. 유방암으로 사망할 가능성은 몇 명이나 줄어들 것인가? 1  25  100  250 30
  • 31. • 3분의 2인 66%가 1명이라고 이해했고, 16%는 1천 명 당 25명이라고 응답했으며, 심지어 15%는 250명이 나 줄어든다고 응답. 교육 후에도 끝까지 한 명은 250명이라고 고집. – 이득을 RRR로 표현하면 의료인이나 관리자가 자주 과 대추정하는 오류 • 내과적 중재술의 효과 ① RRR은 급성 심근경색증 34% 감소 ② ARR은 급성 심근경색증 1.4% 감소 ③ 급성 심근경색증의 AR이 3.9%에서 2.5%로 감소 ④ NNT는 77명 – 네 가지 지표를 제시한 결과 140명의 리뷰어 중 3명만 같음을 인지 31
  • 32. 와파린 예제 • 치료로 얻는 편익(benefit) – 다양한 연구를 통해 심방 세동이 있는 환자에게 와파 린을 장기간 투약하면 뇌졸중을 예방한다고 알려져 있음. – 와파린 미투약시 평균 뇌졸중 발생률 = 100 인-년당 5.1명 = 연간 0.051명 – 와파린 투약시 평균 뇌졸중 발생률 = 100 인-년당 1.8 명 = 연간 0.018명 • 치료로 겪는 위해(harm) – 심방 세동 환자에서 와파린 투약으로 인한 심각한 부 작용은 100 인-년당 1명 = 연간 0.01명으로 추정(가상 자료) 32
  • 33. 치료로 얻는 편익의 측정 지표 • 위험 차이(Risk difference) = Risk (노출군) – Risk (비노출군) = 5.1 – 1.8 = 100인-년당 3.3명 • 절대 위험 감소(Absolute risk reduction, ARR) = Risk (노출군) – Risk (비노출군) = 0.051 – 0.018 = 0.033 • 비교 위험 감소(Relative risk reduction, RRR) = [Risk (노출군) – Risk (비노출군)] / Risk (노출군) = (0.051 – 0.018) / 0.051 = 0.65 = 65% 33
  • 34. 치료로 겪는 위해 • 절대 위험도 증가(Absolute risk increase, ARI) = Risk (노출군) – Risk (비노출군) = 0.01 34
  • 35. 치료 필요 환자수와 부작용 발생수의 계산 • 치료 필요 환자수(Numbers needed to treat, NNT) – 연간 한 명의 뇌졸중 환자를 예방하기 위해 와파린 투여가 필요한 심방세동 환자수 NNT = 1/ARR = 1/0.033 = 30.3 = 약 31명 • 부작용 발생수(Numbers need to harm, NNH) – 연간 와파린 치료를 받아 심각한 후유증이 발생한 심방세동 환자수 NNH = 1/ARI = 1/0.01 = 100명 *ARR/ARI=3.3, NNH/NNT=3.3  편익이 발생한 환자 수가 부작용 발생 환자수보다 3배 크다는 뜻. 35
  • 38. 의사가 검사의 민감도와 특이도를 혼동하는가? • 어떤 지역에서 유방촬영술을 이용해 유방암 검진을 수행한다고 가정하자. 이 지역에서 여성에 대한 정보는 다음과 같다. – 어떤 여성이 유방암이 있을 확률(유병률)은 1% – 어떤 여성이 유방암이 있다면, 검사 결과가 양 성이 확률(민감도)은 90% – 어떤 여성이 유방암이 없는데도, 검사 결과가 양성일 확률(위양성률)은 9% 38
  • 39. • 어떤 여성의 유방촬영술 결과가 양성이었다 . 이 여성은 자신이 분명히 유방암이 있는지, 아니면 우연의 결과인지 알기를 원한다. 가 장 올바른 답은? A. 여성이 유방암이 있을 확률은 약 81%다. B. 유방촬영술 양성인 여성 10명 중 약 9명이 유 방암이 있다. C. 유방촬영술 양성인 여성 10명 중 약 1명이 유 방암이 있다. D. 여성이 유방암이 있을 확률은 약 1%다. 39
  • 40. 유방암 검진: 자연 빈도 이용 40
  • 41. • 대부분의 의사가 검사의 양성 예측도의 개 념을 모르고 판정을 못내림. – 연구 참여 의사 중 18%만 확률 정보로 양성 예 측도를 추론(Casscells 등 1978) – 100명의 의사 중 95명이 유방촬영술 양성 이후 유방암 확률을 과대추정(Eddy 1982) – 산과 전문의 21명 중 단 1명만 다운 증후군 검사 양성 이후 실제 확률 추정 가능 41
  • 42. 급성 흉통 환자 • 두 명의 환자가 급성 흉통(acute substernal pain)으 로 응급실을 방문했다. – 환자 A: 34세 여자, 비흡연자, 과거력 없음. – 환자 B: 55세 남자, 고혈압, 당뇨, 이상지질혈증, 25갑년 흡연 • 급성 심근경색증 감별을 위해 실시할 검사는? – 심전도, 심근 효소(CK-MB, Myoglobulin, Troponin) • 양성 예측도(검사 결과 양성일 때 질환을 갖고 있 을 확률)는 어느 쪽이 높을까? 그 이유는? 42
  • 43. 진단검사법의 타당도 기준 질병 상태 검사 결과 있음 없음 전체 양성 a b a+b 음성 c d c+d 전체 a+c b+d a+b+c+d • 민감도(감수성, sensitivity)=a/(a+c) • 특이도(특이성, specificity)=d/(b+d) • 위양성(의양성, false-positive rate)=b/(b+d) • 위음성(의음성, false-negative rate)=c/(a+c) • 유병률(prevalence)=(a+c)/(a+b+c+d) • 양성 예측도(positive predictive value)=a/(a+b) • 음성 예측도(negative predictive value)=d/(c+d) • 양성 가능도 비(likelihood ratio positive, LR+)=[a/(a+c)]/[b/(b+d)] • 음성 가능도 비(likelihood ratio negative, LR-)=[c/(a+c)]/[d/(b+d)] 43
  • 44. 1. 민감도(sensitivity) – 질병이 있는 환자가 양성인 검사 결과 확률 – 확률(진단결과 양성 환자 | 질병이 있는 환자) – Pr(T+∩D+|D+) = a/(a+c) 2. 특이도(specificity) – 질병이 없는 사람이 음성인 검사 결과 확률 – 확률(진단결과 음성 사람 | 질병이 없는 사람) – Pr(T-∩D-|D-) = d/(b+d) 44
  • 45. 3. 위음성률(false-negative rate), 위양성률 (false-positive rate) – 위음성률 • 질병이 있는 사람이 검사 결과 음성 확률 • Pr(T-∩D+|D+) = c/(a+c) – 위양성률 • 질병이 없는 사람이 검사 결과 양성 확률 • Pr(T+∩D-|D-) = b/(b+d) 45
  • 46. 4. 양성예측도(positive predictive value)와 음성예 측도(negative predictive value) – 민감도와 특이도는 검사법의 정확도 평가 방법의 하나로, 특정 검사법의 고유한 성질 – 검사결과가 질병 진단 효용성(usefullness)은 양성 및 음성 예측도 이용 평가 – 양성예측도 • 확률(진단결과 양성인 환자 | 진단결과 양성인 사람) • Pr(T+∩D+|T+) = a/(a+b) – 음성예측도 • 확률(진단결과 음성인 사람 | 진단결과 음성인 사람) • Pr(T+∩D+|T+) = a/(a+b) 46
  • 47. • 예측도는 검사법의 민감도, 특이도에 의해 결정되기도 하지만, 인구집단의 유병률에 의해 달라짐. • 일반적으로 해당 질병의 유병률이 높은 집 단에서는 양성 예측도가 높고, 음성 예측도 는 낮은 경향. 47
  • 48. 48
  • 49. Thomas Bayes (1702-1761) Charlie Sheen (1965 - present) The Movie: “Return of Thomas Bayes” 49
  • 50. 유병률, 민감도, 특이도와 예측도 관계 민감도x유병률 양성예측도= (민감도x유병률)+(1-특이도)x(1-유병률) 특이도x유병률 음성예측도= (1-민감도)x유병률)+(특이도)x(1-유병률) 50
  • 51. 바이러스 감염 사례 • 바이러스 감염 진단 혈청 검사법이 병원에 새로 도입 • 검사법의 민감도와 특이도는 각각 90%와 95% • 이전 임상 연구 결과 최종적으로 장염 확진 비율은 20% • 새로운 검사법으로 환자를 검사해서 검사결 과가 양성으로 나왔을 때, 바이러스 감염 환 자일 확률(양성예측도)은? 51
  • 52. 공식 이용 0.90x0.20 양성예측도= = 0.82 0.90x0.20+(1-0.95)x0.80 0.95x0.20 음성예측도= = 0.97 (1-0.90)x0.20+0.95x0.80 52
  • 53. 자연 빈도 이용 1,000명 200명 800명 감염 정상 180명 20명 40명 760명 양성 음성 양성 음성 p(감염|양성)=180/(180+40) 53
  • 54. 가능도비(likelihood ratio) 이용 1. 검사전 오즈(pretest odds) = 검사전 확률 / (1 – 검사전 확률) 2. 검사후 오즈(posttest odds) = 검사전 오즈 X 가능도 비(likelihood ratio) 3. 검사후 확률(posttest probability) = 검사후 오즈 / (1 + 검사후 오즈) 54
  • 55. 가능도비 • 양성 가능도비(LR+) = 질병이 있는 사람에서 검사 결과 양성 확률 / 질 병이 없는 사람에서 검사 결과 양성 확률 = 민감도 / (1 - 특이도) * LR+>1  검사 결과가 양성인 환자에서 질병이 있을 확률이 증가 의미 • 음성 가능도비 = (1 – 특이도) / 민감도 55
  • 56. 가능도비 이용 1. 검사전 오즈 = 유병률/(1 - 유병률) = 0.2/0.8 = 0.25 – 가능도 비 = 민감도/(1 - 특이도) = 0.90/0.05 = 18 2. 검사후 오즈 = 검사전 오즈 X 양성 가능도비 = 0.25X18 = 4.5 3. 검사후 확률(양성 예측도) = 검사후 오즈/(1+검사후 오즈) = 4.5/5.5 = 82% 56
  • 57. 소아 중이염 사례 • 4세 소아가 귀의 통증을 주소로 외래 방문 – 이 연령대 소아에서 급성 중이염 유병률 약 20% 로 추정 • 이경(otoscope)으로 아이의 귀를 검사한 결 과 고막 색깔이 흐림(cloudy). • 이 아이가 중이염을 갖고 있을 확률은 얼마 나 되는가? 57
  • 58. Table. Likelihood ratios for three major signs of otitis media Signs of otitis media Likelihood ratio (95% CI) Color Cloudy 34(28—42) Distinctly red 8.4(6.7—11) Slightly red 1.4(1.1—1.8) Normal 0.2(0.19—0.21) Position Bulging 51(36—73) Retracted 3.5(2.9—4.2) Normal 0.5(0.49—0.51) Mobility Distinctly impaired 31(26—37) Slightly impaired 4.0(3.4—4.7) Normal 0.2(0.19—0.21) From Rothman, R., Owens, T., Simel, D.L. Does this child have acute otitis media? J Am Med 58 Assoc 2003; 290: 1633-40
  • 59. 중이염: 가능도비 이용 1. 검사전 오즈 = 0.20/0.80 = 0.25 – 양성 가능도 비 = 34  Table. 2. 검사후 오즈 = 0.25x34 = 8.5 3. 검사후 확률 = 8.5/9.5 = 89% • 4세 소아가 귀 통증이 있을 때, 이경 검사에 서 고막이 흐리면 급성 중이염 확률 89%이 므로 항생제 처방 59
  • 61. 의사가 확실성의 환상을 만드는가? • 1987년에 열린 AIDS 학술회의에서 전직 플 로리다 중 상원의원 Lawton Chiles는 플로리 다에서 헌혈 혈액 ELISA 검사 결과 양성 반응 을 보인 22명의 헌혈자 중 7명이 자살했다는 충격적 결과 발표 • ELISA와 Western blot은 모두 민감도와 특이 도가 약 99.99%로 매우 높음. • 1만 명의 저위험 행동 동성애 남자에서 HIV 유병률은 1명  선별검사 양성인 남자에서 실제 HIV 감염 확률은 50%가 되지 않음. 61
  • 62. 자연 빈도 이용 10,000명 남자 1명 9,999명 HIV+ 정상 1명 0명 1명 9,998명 양성 음성 양성 음성 p(HIV+|검사+)=1/(1+1) 62
  • 63. • 의료 전문가의 확실성에 대한 환상과 보건 의료 통계에 대한 몰이해는 분명히 경고할 만한 상황 • 그렇다면 왜 그렇게 많은 의료 전문가가 통 계맹인가? 63
  • 64. 원인 • 기초 계산능(Basic Numeracy) – 단순 스케일에 대한 검사로 기초 계산능 평가 • 백분율을 숫자로 환산 • 숫자를 백분율로 환산 • 우연에 의한 결과에 익숙한 정도 – 72%의 의사만 세 질문에 정확하게 답변 – 가장 어려워 한 작업은 1천 명 당 1명을 백분율 로 변환하는 과정으로, 4명 중 1명이 틀림. 64
  • 65. 65
  • 66. 원인 • 의학 저널과 의사 유인물 – 의학 저널이 연구 결과를 발표할 때 RRR과 같은 불 투명한 보건의료 통계를 사용 – Nuovo, Melnikow, Chang 2002 • Ann Intern Med, BMJ, JAMA, The Lancet, NEJM에 실린 359 편의 무작위 시험 논문 분석 결과 • 단 25편만 ARR을 보고, 25편 중 14편만 NNT를 포함 • 약 7%의 논문만 투명한 방식으로 결과를 보고 – Sedrakyan과 Shih 2007 • BMJ, JAMA, The Lancet 2004~2006년 논문 분석 결과 • 약 절반이 절대 위험이나 투명한 빈도 데이터를 보고하지 않음. 66
  • 67. 원인 • 불일치 프레이밍(mismatching framing) – 이득은 큰 숫자로(RRR), 위해는 작은 숫자로(절 대 위험 증가) – USPSTF 2002 • 이득: “S자 결장경 선별검사가 범위 내 발생한 암으 로 인한 사망의 59%를 감소시켰다.” • 위해: “천공은 S자 결장경 검진을 받은 1,000명에서 10,000명 당 약 1명에서 발생했다.” – Sedrakyan과 Shih 2007 • 대부분 경우 이득은 비교 위험으로, 위해는 절대 빈 도로 제시 67
  • 68. 원인 • 의학 교육 – Gigerenzer 2007 • 미국의학교육학회에 의과대학 교육에서 통계맹 문 제 해결을 위한 교육 계획 문의  없음. – Odette Wegwarth • 미국내과학회와 135개 의과대학에 의학 통계학과 위 험 소통 과정에 대한 시험이 있는지 이메일 문의  3%만 임상 역학 과정 있고 위험 소통은 전무 – 미네소타 의대 • 2010/11 생물통계학과 위험 관리에 대한 과정 전환 68
  • 69. 대책 • 의과대학생과 의사가 의학 통계를 이해하도 록 교육 – 문제 해결 방식으로 통계학 교육 – 통합 교육 • 시드니 대학교(PEARLS program) • 맨체스터 대학교(BestBets) 69
  • 70. 대책 • 의과대학생과 의사에게 위험 소통 기법을 교육 – 절대 위험과 비교 위험 • Lipitor는 뇌졸중 빈도를 1,000명 당 28명에서 15명으로 감 소 • 절대 위험 감소: 1,000명 당 13명(1.3%) • 비교 위험 감소: (28-15)/28*100=48%  많은 사람들이 비 교 위험 감소가 48%라는 표현을 들으면 처방 받은 1,000 명 중 평균 480명의 뇌졸중을 예방한다고 이해 • NNT: 77명 – 오해를 피하기 위해 모든 의사와 의과대학생은 절 대 위험과 비교 위험의 차이를 알아야 함. 70
  • 71. 대책 • 의과대학생과 의사에게 위험 소통 기법을 교육 – 빈도 기술과 단일 사건 확률 – 대장암 유병률 0.3% – FOBT 민감도 50%, 위양성률 3% – FOBT 양성일 때 대장암 확률? 71
  • 72. 자연 빈도 이용 10,000명 남자 30명 9,970명 대장암 정상 15명 15명 299명 9,671명 양성 음성 양성 음성 p(대장암|FOBT 양성)=15/(15+299) 72
  • 73. 대책 • 의과대학생과 의사에게 위험 소통 기법을 교육 – 빈도 기술 대 단일 사건 확률 – “당신이 Prozac을 먹으면, 30%~50%에서 조루나 성욕 감퇴 등 성기능 문제가 생길 수 있습니다.” – 많은 환자는 자신의 성활동의 30%~50%에서 성 기능 문제가 생길 수 있다고 생각 – 실제는 “Prozac을 먹는 환자 10명 중 3~5명에서 성기능 문제가 생길 수 있다.”로 해석 73
  • 74. 의료의 통계맹: 민주적 이상 • 물리학과 생물학과 같은 다양한 분야의 과 학과 같이 통계적 사고의 혁명적 확산이 모 든 의사에 이르고 있지는 않음. • 의사의 통계맹은 주로 환경의 문제로 마인 드의 문제는 아님. • 통계능의 꿈은 환자-의사 간 의사 소통뿐 아 니라 민주주의 기능 강화에도 근본적. 74
  • 75. 75
  • 76. 참고문헌 1. Gigerenzer G. (2002). Calculated Risks: How to Know When Numbers Deceive You. New York: Simon & Schuster 2. Gigerenzer G, Gaissmaier W, Kurz-Mileke E, Schwartz LM, Woloshin S. (2008). Helping Doctors and Patients Make Sense of Health Statistics. Psychological Science in the Public Interest, 8(2), 53-96. 3. Gigerenzer G, Muir Gray JA. (2012). Better Doctors, Better Patients, Better Decisions: Envisioning Health Care 2020. Cambridge, MA: MIT Press 4. Gordis L. (2008). Epidemiology, 4th ed. Philadelphia, PA: Saunders Elsevier 5. Katz D, Elmore JG, Wild DMG, Lucan SC. (2013) Jekel’s Epidemiology, Biostatistics, Preventive Medicine, and Public Health, 4th ed. Philadelphia, PA: Saunders Elsevier 6. Katz MH. (2006) Study Design and Statistical Analysis: A Practical Guide for Clinicians. New York: Cambridge University Press 76
  • 77. 인문학과 기술의 융합처럼, 진료와 연구의 융합에는 통계가 있다.