체계적문헌고찰 완벽 정리

연구를 시작할 때 가장 막막한 순간을 꼽자면 단연 문헌고찰입니다. 특히 체계적문헌고찰은 절차가 까다롭고 알려진 정보도 많지 않아 논문 작성에 어려움을 겪는 분들이 많습니다. 하지만 방법만 알면 생각보다 훨씬 수월하게 해낼 수 있습니다. 이 글에서는 체계적문헌고찰이 무엇인지부터 실제 연구에서 어떻게 적용하는지, 그리고 연구자들이 가장 많이 막히는 지점과 그 돌파구를 낱낱이 공개합니다.

체계적문헌고찰과 일반 문헌고찰 차이

구분일반 문헌고찰체계적문헌고찰
방법주관적 선택과 정리사전 등록된 프로토콜에 따른 객관적 절차
검색몇 개의 데이터베이스 임의 검색복수 DB, 미리 설계된 검색식, Boolean 연산자
선별연구자 단독 판단2명 이상 독립 선별, 일치도 검증
비뚤림 평가생략 또는 간단한 코멘트표준화된 도구(RoB, NOS, CASP) 사용
결과 종합서술적 요약질적 통합 또는 메타분석, 이질성 검토
보고자유 형식PRISMA 2020 체크리스트 27항목 준수

일반 문헌고찰은 연구자의 경험과 직관에 의존하는 반면, 체계적문헌고찰은 재현 가능한 절차와 편향 최소화가 핵심입니다. 근거 중심 연구가 중요해지면서 보건·의학·심리학·사회복지 등 다양한 분야의 석·박사 논문과 KCI 등재지에서 체계적문헌고찰 방법론을 채택하는 비율이 꾸준히 증가하고 있습니다. 특히 PROSPERO에 연구 계획을 먼저 등록하면 이후 모든 과정이 투명하게 기록되어 논문의 신뢰도를 크게 높일 수 있습니다.

체계적문헌고찰이 낯설게 느껴진다면, 실제 적용된 예시를 살펴보는 것도 좋은 방법입니다. 아래 자료에서 자폐 스펙트럼 장애 아동의 구강 문제에 관한 체계적문헌고찰 논문을 확인해 보세요.

체계적문헌고찰 6단계 과정

체계적문헌고찰은 크게 6단계로 이루어집니다. 각 단계를 차근차근 따라가면 복잡해 보이던 전체 그림이 선명해집니다.

1단계: PICO(S) 설정

연구의 뼈대를 세우는 첫 단계입니다. Population(대상), Intervention(중재), Comparison(비교), Outcome(결과)을 명확히 규정하고, 필요한 경우 Study design(연구 유형)을 추가해 PICOS로 확장합니다. PICO가 명확하지 않으면 이후 검색식 설계가 흔들리고, 포함·배제 기준도 모호해집니다. 예를 들어 ‘자폐 아동의 구강 건강’이라는 주제라면 대상은 ‘ASD 아동’, 중재는 ‘작업치료와 치과 협력 중재’, 비교는 ‘일반 치과 치료’, 결과는 ‘치료 협조도 및 구강 건강 지표’로 구체화해야 합니다.

2단계: 문헌 검색 전략 수립

PubMed, CINAHL, RISS, KISS, EMBASE 등 복수의 데이터베이스를 선정하고, MeSH 용어와 Boolean 연산자(AND, OR, NOT)를 결합한 검색식을 만듭니다. 검색 전략 자체가 방법론 섹션에 상세히 기술되어야 하며, 심사자들이 가장 집중적으로 검토하는 부분입니다. 이 단계에서 많은 연구자가 ‘너무 많이 나온다’ 또는 ‘너무 적게 나온다’는 문제를 겪습니다. 검색식 로그를 논문에 첨부해야 한다는 사실을 모르는 경우도 많으니, 처음부터 검색 결과를 기록해 두는 습관이 중요합니다.

3단계: 문헌 선별 및 PRISMA 흐름도 작성

두 명 이상의 연구자가 독립적으로 포함·배제 기준을 적용해 문헌을 선별합니다. 연구자 간 일치도(Cohen’s Kappa)를 산출하고 불일치 항목은 논의를 통해 해결합니다. PRISMA 흐름도는 검색된 문헌 수, 중복 제거 후, 1차 선별, 2차 선별, 최종 포함까지의 과정을 시각화합니다. 이 흐름도가 없으면 논문이 체계적문헌고찰로서 인정받기 어렵습니다.

체계적문헌고찰 6단계 과정을 나타내는 인포그래픽

4단계: 자료 추출 및 질 평가

표준화된 추출 양식을 활용해 각 연구의 핵심 변수(연구 설계, 대상자 수, 중재 방법, 결과 측정 도구, 주요 결과 등)를 수집합니다. 연구 설계에 따라 질 평가 도구가 달라집니다. 무작위 대조군 연구는 RoB 2.0, 관찰 연구는 NOS(뉴캐슬-오타와 척도), 질적 연구는 CASP 체크리스트 등을 사용합니다. 어떤 도구를 써야 할지 판단하는 것이 까다롭기 때문에, 사전에 프로토콜에 질 평가 계획을 명시하는 것이 좋습니다.

5단계: 데이터 통합

결과를 종합하는 단계입니다. 질적 통합(서술적 합성)은 연구 간 이질성이 크거나 연구 설계가 다양할 때 사용합니다. 양적 통합(메타분석)은 효과 크기를 통계적으로 합산합니다. 이때 I² 통계량으로 이질성을 확인하고, 고정 효과 모형 또는 랜덤 효과 모형을 선택합니다. 메타분석은 RevMan, R(meta 패키지), Stata 등 전문 소프트웨어가 필요하며, 통계 비전공자에게는 높은 장벽으로 느껴질 수 있습니다. 하지만 포함된 연구의 질이 높고 이질성이 낮다면 반드시 메타분석을 해야 하는 것은 아닙니다. 서술적 합성만으로도 완성도 높은 체계적문헌고찰 논문이 가능합니다.

6단계: 결과 보고 (PRISMA 2020)

PRISMA 2020 보고 기준에 따라 27개 체크리스트 항목을 충족하는 방식으로 논문을 작성합니다. 학술지 투고 시 PRISMA 체크리스트를 보충 자료로 제출해야 하는 경우가 많습니다. 국내 학술지의 저자 지침에서 체계적문헌고찰 관련 특이 요건(페이지 수 제한, 보충 자료 허용 여부 등)을 꼭 확인해야 합니다. Scopus, ESCI 등재지를 목표로 한다면 PROSPERO 등록 번호 기재가 거의 필수입니다.

연구자들이 가장 많이 막히는 4가지 지점

체계적문헌고찰을 처음 수행하는 연구자들이 공통적으로 어려움을 호소하는 구간이 있습니다. 미리 알고 준비하면 큰 도움이 됩니다.

첫째, 검색식 구성입니다. MeSH 용어를 정확히 파악하지 못하거나 Boolean 연산자 적용에 오류가 생기면 검색 결과의 재현성이 떨어집니다. ‘너무 많이 나온다’ 혹은 ‘너무 적게 나온다’는 양쪽 문제가 모두 발생하며, 검색식 로그를 논문에 첨부해야 한다는 사실 자체를 모르는 경우도 많습니다. 해결 방법은 사서나 정보 전문가의 도움을 받거나, 유사 주제의 체계적문헌고찰 논문에서 검색식을 참고하는 것입니다.

둘째, 연구자 간 일치도 산출입니다. 혼자 논문을 쓰는 대학원생의 경우 두 번째 독립 평가자를 구하는 것 자체가 난제입니다. 지도 교수나 동료 연구자에게 협조를 구하고, Kappa 계수 산출을 위한 소프트웨어(예: SPSS, R) 사용법을 익혀야 합니다. 불일치 항목을 해결하는 절차를 논문에 어떻게 기술하는지도 자주 막히는 부분입니다. 미리 프로토콜에 불일치 해결 방안을 적어 두는 것이 좋습니다.

셋째, 비뚤림 위험 평가(질 평가)입니다. 연구 설계(RCT, 코호트, 단면 연구, 질적 연구 등)에 따라 적용 도구가 다릅니다. 어떤 도구를 써야 하는지 판단하는 것 자체가 어렵고, 점수 해석 기준도 학술지마다 달라 혼란이 생깁니다. 최근에는 학술지에서 특정 도구를 요구하기도 하므로, 투고할 저널의 가이드라인을 먼저 확인하는 것이 전략적입니다.

넷째, 메타분석 통계 처리입니다. 이 단계가 체계적문헌고찰 수행 과정에서 압도적으로 많이 막히는 구간입니다. RevMan, R, Stata 등 소프트웨어 사용법, 이질성이 높을 때의 대처(하위집단 분석, 민감도 분석), 깔때기 그림(funnel plot) 해석까지 배워야 할 것이 한꺼번에 쏟아집니다. 통계 비전공자에게는 특히 높은 장벽입니다. 하지만 앞서 말씀드린 것처럼 메타분석이 필수는 아닙니다. 이질성이 크거나 연구 수가 적다면 서술적 합성만으로도 훌륭한 논문을 완성할 수 있습니다. 복잡한 통계에 얽매이기보다는 연구의 질과 의미 있는 결과 도출에 집중하세요.

이러한 막힘을 줄이는 방법을 더 알고 싶다면 아래 자료를 참고하세요. 논문 작성에 실질적인 도움을 주는 정보가 가득합니다.

체계적문헌고찰 막힘을 줄이는 3가지 전략

어려움을 최소화하기 위해 현실에서 바로 적용할 수 있는 전략을 세 가지 소개합니다.

첫째, 프로토콜 먼저 등록하세요

PROSPERO에 프로토콜을 등록하면 논문 방법론의 신뢰도가 올라갈 뿐 아니라, 스스로 연구 설계를 정교화하는 효과가 있습니다. 등록 과정에서 PICO, 검색 전략, 포함·배제 기준, 질 평가 방법, 데이터 통합 계획을 모두 명확히 해야 하므로, 이후 단계에서 헤매는 일이 줄어듭니다. 또한 등록 번호는 학술지 투고 시 큰 플러스 요인이 됩니다.

둘째, PRISMA 체크리스트를 처음부터 옆에 두세요

마지막에 맞추려 하면 빠진 정보를 소급하기 어렵습니다. 27개 항목을 보면서 각 단계를 진행하면 리포트가 자연스럽게 완성됩니다. 체크리스트를 출력해 연구실 벽에 붙여 두거나, 전자 문서에 탭으로 고정해 두고 수시로 확인하세요. 특히 검색식, 데이터베이스 목록, 선별 과정, 질 평가 결과 등은 중간중간 기록해 두어야 나중에 누락되지 않습니다.

셋째, 메타분석이 필수가 아님을 인지하세요

포함 연구의 이질성이 높거나 연구 설계가 다양하면, 메타분석 없이 서술적 합성만으로도 완성도 높은 체계적문헌고찰 논문이 가능합니다. 메타분석은 통계적으로 유의미한 효과 크기를 산출하는 데 유용하지만, 연구 간 차이가 크면 오히려 의미 없는 결과를 낼 수 있습니다. 서술적 합성은 각 연구의 맥락과 질을 충실히 반영할 수 있다는 장점이 있습니다. 자신의 연구 상황에 맞는 통합 방법을 선택하는 지혜가 필요합니다.

학위 논문과 학술지 투고 시 주의점

학위 논문의 경우 지도 교수마다 체계적문헌고찰 방법론에 대한 이해 수준이 다를 수 있어 심의 단계에서 예상치 못한 수정 요구가 발생하기도 합니다. 사전에 PRISMA 2020 원문과 한국어 번역본을 지도 교수와 공유하고 기대치를 맞추는 것이 실질적으로 도움이 됩니다. KCI 등재지 투고 시에는 국내 학술지의 저자 지침에서 체계적문헌고찰 관련 특이 요건(페이지 수 제한, 보충 자료 허용 여부 등)을 꼭 확인해야 합니다. 해외 저널을 목표로 한다면 PROSPERO 등록 번호 기재가 거의 필수이며, 최근에는 연구 데이터 공개를 요구하는 학술지도 늘고 있습니다.

실제로 해외 저널에 게재된 체계적문헌고찰 메타분석 논문을 살펴보면, 슬픔과 애도에 관한 대규모 연구에서도 체계적 절차를 어떻게 적용하는지 확인할 수 있습니다. 아래 논문을 통해 구체적인 방법을 참고해 보세요.

마치며

체계적문헌고찰은 절차가 복잡해 보이지만, 각 단계의 목적을 이해하고 체크리스트를 따르면 충분히 완수할 수 있는 연구 방법입니다. PICO 설정에서부터 PRISMA 보고까지, 하나씩 차근차근 진행하면 어느새 완성된 논문을 마주하게 될 것입니다. 특히 검색식과 질 평가, 메타분석에서 막힌다면 혼자 끙끙대지 말고 전문가의 도움을 받거나 동료 연구자와 협력하는 것도 좋은 전략입니다. 이 글이 여러분의 논문 작성에 실질적인 도움이 되길 바랍니다. 더 궁금한 점이 있다면 아래 FAQ를 확인해 보세요.

자주 묻는 질문

Q1. 체계적문헌고찰과 일반 문헌고찰 중 어떤 것을 선택해야 하나요?

연구 목적에 따라 다릅니다. 특정 중재의 효과를 객관적으로 증명하거나, 근거를 종합해 정책적 함의를 도출하려면 체계적문헌고찰이 적합합니다. 반면, 개념 정리나 연구 동향 파악이 목적이라면 일반 문헌고찰로도 충분합니다. 석·박사 학위 논문의 경우 최근에는 체계적문헌고찰을 선호하는 추세입니다.

Q2. 메타분석을 하지 않아도 체계적문헌고찰이라고 할 수 있나요?

네, 메타분석은 체계적문헌고찰의 선택적인 단계입니다. 포함된 연구의 이질성이 크거나, 연구 수가 적거나, 연구 설계가 다양할 때는 서술적 합성만으로도 충분히 가치 있는 체계적문헌고찰이 됩니다. PRISMA 보고 기준에도 메타분석 여부와 관계없이 모든 항목을 적용할 수 있습니다.

Q3. 혼자서 체계적문헌고찰을 수행할 수 있나요?

가능합니다. 다만 문헌 선별과 질 평가 시 두 명의 독립 평가자가 필요합니다. 대학원생의 경우 지도 교수나 동료 연구자에게 협조를 구하거나, 연구실 내 다른 학생과 함께 진행하는 방법이 있습니다. 불일치 항목 해결 과정을 투명하게 기술하면 학술지에서도 인정해 줍니다.

Q4. PRISMA 체크리스트는 어디서 구할 수 있나요?

PRISMA 공식 웹사이트(prisma-statement.org)에서 무료로 다운로드할 수 있습니다. 2020년 버전의 체크리스트와 설명 문헌을 함께 제공하며, 한국어 번역본도 일부 학회에서 배포하고 있습니다. 논문 작성 시작 단계부터 체크리스트를 옆에 두고 진행하는 것을 추천합니다.

Q5. 질 평가 도구는 어떻게 선택하나요?

포함된 연구의 설계에 따라 선택합니다. 무작위 대조군 연구는 Cochrane의 RoB 2.0, 관찰 연구는 NOS(뉴캐슬-오타와 척도), 진단 연구는 QUADAS-2, 질적 연구는 CASP 체크리스트 등이 대표적입니다. 만약 다양한 설계의 연구가 혼합되어 있다면, 각 연구 설계에 맞는 도구를 각각 적용하고 결과를 별도로 보고해야 합니다.

댓글 남기기