갑상선 결절(thyroid nodule)은 성인의 절반 이상에서 초음파 검사 시 우연히 발견될 만큼 흔한 소견입니다. 대부분의 결절은 양성이지만, 어느 주기로 관찰해야 하는지, 언제 조직검사를 받아야 하는지에 대한 정보가 부족해 막연한 불안을 느끼는 경우가 많습니다. 이 글은 최신 국내외 임상 가이드라인과 연구 결과를 바탕으로, 갑상선 결절의 추적 관찰 주기와 조직검사 시점에 관한 기준을 체계적으로 정리합니다.

갑상선 결절은 갑상선 조직 안에 생기는 덩어리로, 고형 결절, 낭성 결절, 혼합형 결절로 나뉩니다. 초음파 기술이 발전하면서 과거에는 발견되지 않았을 작은 결절도 쉽게 검출됩니다. 문제는 모든 결절이 동일한 임상적 의미를 갖지 않는다는 점입니다.
임상에서 결절이 발견되면 가장 먼저 이루어지는 절차는 초음파를 통한 형태 평가입니다. 결절의 에코 양상(echogenicity), 모양, 경계, 석회화 유무, 혈류 분포 등이 종합적으로 평가되며, 이 특성들을 점수화한 분류 체계가 추적 관찰과 조직검사 여부를 결정하는 기준이 됩니다. 초음파 특징 중 저에코(hypoechogenicity), 세로형 배열, 미세석회화(microcalcification), 불규칙한 경계는 악성 위험도를 높이는 요소로 알려져 있습니다 [2].
40대 초반의 A씨는 건강검진 초음파에서 좌엽에 0.8 cm 크기의 결절이 발견되었습니다. 주치의는 결절의 경계가 매끄럽고 에코 양상이 등에코(isoechoic)여서 저위험군으로 분류하였으며, 즉각적인 조직검사 대신 1년 후 초음파 추적 관찰을 권하였습니다. 이처럼 모든 결절이 즉시 정밀 검사를 요하지는 않습니다.
결절이 발견된 이후의 진료 흐름은 크게 세 단계로 구성됩니다. 첫째는 초음파 위험도 분류, 둘째는 해당 등급에 따른 조직검사 여부 판단, 셋째는 양성 판정 이후의 추적 관찰 주기 설정입니다. 각 단계는 독립적이지 않으며, 이전 단계의 결과가 다음 결정을 좌우합니다. 따라서 초음파 결과지에 기재된 등급이 무엇을 의미하는지 이해하는 것이 중요합니다.
결절 크기 자체는 단독 판단 기준으로 충분하지 않습니다. 같은 1.5 cm 결절이라도 초음파 위험 특성에 따라 즉각적인 미세침 흡인 세포검사(fine needle aspiration, FNA)가 필요한 경우가 있는가 하면, 수년 간의 경과 관찰로 충분한 경우도 있습니다. 이 판단을 체계화한 것이 TI-RADS 계열의 분류 시스템입니다.

갑상선 초음파 보고 및 데이터 시스템(Thyroid Imaging Reporting and Data System, TI-RADS)은 결절의 초음파 특성을 점수화하여 악성 위험도를 등급으로 분류하는 체계입니다. 현재 국내외에서 가장 많이 사용되는 시스템은 미국방사선학회(American College of Radiology, ACR)의 ACR TI-RADS와, 대한갑상선영상의학회가 제정한 K-TIRADS입니다.
ACR TI-RADS는 결절의 구성(composition), 에코 양상, 모양, 경계, 석회화 5가지 항목에 점수를 부여하고 합산하여 TR1부터 TR5까지 5단계로 분류합니다 [4]. TR1(양성)과 TR2(양성 가능성 높음)는 추가 추적 관찰이 불필요합니다. TR3(저위험)는 결절이 2.5 cm 이상일 때 조직검사를 고려하며, TR4(중등도 위험)는 1.5 cm 이상, TR5(고위험)는 1.0 cm 이상에서 조직검사가 권고됩니다 [4].
K-TIRADS는 국내 의료 환경과 갑상선암 유병 특성을 반영하여 설계된 시스템입니다 [5]. K-TIRADS 3 등급에서는 결절 크기가 1.5 cm 이상일 때 세포검사(FNA)가 권장되며, K-TIRADS 4와 5 등급은 1.0 cm 이상이면 조직검사 기준에 해당합니다. 또한 결절 크기가 기준 미만이더라도 갑상선암 가족력, 방사선 피폭 병력, 경부 림프절 이상 등의 위험 요인이 있다면 더 적극적인 평가가 이루어집니다 [5].
두 시스템을 비교한 연구에서 ACR TI-RADS는 특이도(specificity)와 불필요한 조직검사 감소 측면에서 우수한 성적을 보였습니다 [6]. 동일 코호트를 대상으로 한 분석에서 불필요 조직검사 건수는 ATA(미국갑상선학회) 가이드라인 기준 301건, EU-TIRADS 기준 222건, ACR TI-RADS 기준 143건으로 집계되었습니다 [7]. 반면 민감도(sensitivity)는 ATA 기준이 82.22%로 ACR(48.89%)보다 높았습니다 [7]. 이는 두 시스템이 서로 다른 임상 목표, 즉 과진단 방지 대 조기 발견 사이에서 균형점을 달리 설정하고 있음을 보여줍니다.
유럽갑상선학회(European Thyroid Association, ETA)가 2023년에 발표한 임상 가이드라인에서는 EU-TIRADS 5 등급의 경우 10 mm 이상이거나 위험 요인이 동반된 5~10 mm 결절에 대해 FNA를 권고합니다 [3]. 저위험 결절에 대해서는 3~5년 주기의 재평가를 제안하고 있어, 불필요한 단기 추적 관찰을 줄이는 방향으로 권고가 이루어지고 있습니다.
가이드라인 간의 기준 차이로 인해 같은 결절이라도 어느 시스템을 적용하느냐에 따라 권고 사항이 달라질 수 있습니다. 국내 진료에서는 K-TIRADS가 주로 사용되며, 대형 병원에서는 ACR TI-RADS를 병행하는 경우도 있습니다. 결과지에 기재된 등급을 확인하고 담당 의료진과 의미를 함께 검토하는 것이 중요합니다.

갑상선 결절의 조직검사, 특히 미세침 흡인 세포검사(FNA)는 결절의 세포 성격을 직접 확인하는 가장 표준적인 방법입니다. 그러나 모든 결절에 FNA가 필요한 것은 아니며, 과도한 조직검사는 불필요한 불안과 비용, 신체적 불편을 초래할 수 있습니다 [7].
FNA의 위음성률(false-negative rate)은 전체적으로 2.6~3.2% 수준으로 보고됩니다 [8]. 이는 세포검사 결과가 양성으로 나왔더라도 100건 중 약 3건은 실제로 악성일 가능성이 있다는 의미입니다. 특히 ACR TR5 또는 ATA 고위험 의심 결절에서는 양성 세포검사 결과 이후에도 악성률이 >5%를 초과할 수 있어 [8], 이 경우 단순 세포검사 결과만으로 추적 종료를 결정하기 어렵습니다.
30대 후반의 B씨는 K-TIRADS 4 등급, 크기 1.2 cm의 결절로 FNA를 시행하였고 결과는 양성(Bethesda II)으로 나왔습니다. 담당 의사는 위음성 가능성을 고려하여 6개월 후 초음파 추적 관찰을 계획하였습니다. B씨의 사례는 양성 판정 이후에도 일정 기간 경과를 확인해야 하는 이유를 잘 보여줍니다.
초음파 특성 중 저에코 양상은 악성 예측에서 교차비(odds ratio, OR) 9.37로 강력한 예측 인자로 알려져 있습니다 [6]. 미세석회화, 세로 방향 성장, 불규칙한 경계도 악성 가능성을 높이는 인자입니다. 반면 결절의 크기 증가 단독으로는 악성 예측력이 낮습니다. 메타분석 결과 결절 성장의 악성 예측 진단 OR은 0.58(95% CI 0.26~1.3)에 불과하여, 성장만으로 즉각적인 재조직검사를 결정하는 것은 임상적으로 뒷받침되기 어렵습니다 [2].
조직검사가 필요한 시점을 정리하면 다음과 같습니다. ACR TI-RADS 기준으로는 TR3 등급이 2.5 cm 이상, TR4가 1.5 cm 이상, TR5가 1.0 cm 이상일 때 FNA가 권고됩니다 [4]. K-TIRADS 기준으로는 3등급이 1.5 cm 이상, 4등급과 5등급이 1.0 cm 이상에서 FNA가 필요하며, 위험 요인이 동반된 경우에는 기준 이하 크기에서도 검사가 이루어질 수 있습니다 [5]. 초음파 유도 하 FNA는 일반적으로 외래에서 시행 가능한 간단한 시술이지만, 담당 의료진과 충분한 논의 이후 결정하는 것이 바람직합니다.

추적 관찰 주기는 결절의 위험 등급과 크기, 세포검사 결과, 환자의 개별적 위험 요인에 따라 결정됩니다. 주기가 너무 짧으면 불필요한 의료 자원 소모와 환자 불안을 야기하고, 너무 길면 초기 발견되지 않을 악성 병변을 놓칠 우려가 있습니다.
2023년 Thyroid 저널에 게재된 스코핑 리뷰(scoping review)에 따르면, 양성 결절의 첫 추적 초음파를 1~2년 후에 실시하는 것과 4년 이상 뒤에 실시하는 것 사이에 악성 발견율의 유의미한 차이는 없었습니다(0.3% 대 0.4%) [1]. 오히려 장기 추적에서 결절 성장이 트리거가 되어 불필요한 수술로 이어지는 사례가 증가하는 경향이 관찰되었습니다 [1]. 이는 결절 성장 자체가 악성의 증거라기보다 양성 결절의 자연 경과일 수 있음을 시사합니다.
ACR TI-RADS 가이드라인에서 제시하는 추적 주기는 다음과 같습니다 [4]. TR1과 TR2 등급은 추가 초음파 추적 관찰이 필요하지 않습니다. TR3와 TR4 등급에서 FNA 기준 미만의 결절은 1년 후 초음파 검사를 시행하고, 이후 3년과 5년 시점에 추가 평가를 진행합니다. TR5 등급에서 1.0 cm 미만의 결절은 1년 후 추적 관찰을 권고하며, 1.0 cm 이상이면 즉각 FNA 대상이 됩니다.
ETA 2023 가이드라인은 저위험 결절에 대해 3~5년 재평가 주기를 제안하여 [3], 불필요한 단기 추적의 부담을 줄이는 방향을 취하고 있습니다. 이는 앞서 언급한 스코핑 리뷰의 결과와도 일맥상통합니다. 반면 고위험 특성이 있는 결절이나 FNA 결과가 중간 단계(Bethesda III~IV)인 경우는 더 짧은 주기의 집중 추적이 권고됩니다.
갑상선 결절 추적 관찰에 대한 더 넓은 맥락을 살펴보려면 갑상선암 조기 발견과 과잉 진단 논의 글도 참고할 수 있습니다.
양성 세포검사 이후의 추적 주기는 결절의 초음파 위험도에 따라 달라집니다. 저위험 결절에서 양성 판정이 나온 경우, 일반적으로 1~2년 이내의 단기 추적보다 3년 이상의 중장기 추적으로도 충분하다는 근거가 축적되고 있습니다 [1]. 반면 FNA 후에도 TR5 등급이거나 임상적 고위험 소견이 지속된다면, 6개월~1년 주기의 집중 추적이 유지될 수 있습니다 [8]. 최종 추적 주기는 초음파 결과, 세포검사 결과, 환자의 임상 상황을 종합하여 담당 의료진이 판단합니다.
Q1. 갑상선 결절이 커지면 반드시 조직검사를 받아야 합니까?
결절의 크기 증가 단독으로는 악성을 예측하는 데 통계적 신뢰도가 높지 않습니다. 메타분석에서 성장의 진단 교차비는 0.58로 나타났으며 [2], 이는 성장 여부만으로 즉각적인 재조직검사를 결정하기에는 근거가 부족하다는 의미입니다. 크기 증가와 함께 초음파 위험 특성(저에코, 미세석회화 등)이 새롭게 관찰되거나 등급이 상향될 경우에 한해 조직검사 여부를 재검토하는 것이 일반적입니다.
Q2. ACR TI-RADS TR2 판정을 받았는데 추적 관찰이 정말 필요 없습니까?
ACR TI-RADS TR1과 TR2 등급은 악성 가능성이 매우 낮은 양성 결절로 분류됩니다. 공식 가이드라인에서는 이 등급에 대한 추가 초음파 추적 관찰을 권고하지 않습니다 [4]. 다만 방사선 피폭 병력, 갑상선암 가족력 등 개인적 위험 요인이 있다면 담당 의사와 함께 개별 판단이 이루어질 수 있습니다.
Q3. 양성 판정을 받은 이후에도 악성으로 밝혀지는 경우가 있습니까?
있습니다. FNA의 위음성률은 전체적으로 2.6~3.2%로 보고됩니다 [8]. 특히 ACR TR5 또는 ATA 기준 고위험 의심 결절에서는 양성 판정 이후에도 악성률이 >5%를 넘을 수 있습니다 [8]. 이 때문에 고위험 등급 결절에서 양성 판정이 나온 경우에도 일정 기간 추적 관찰을 유지합니다.
Q4. 세포검사 없이 초음파만으로 추적 관찰을 계속해도 됩니까?
저위험 등급(TR1~TR3)이고 크기가 FNA 기준 미만이라면, 초음파 추적 관찰만으로 임상적으로 적절한 관리가 가능합니다. 스코핑 리뷰 결과에서도 1~2년 대 4년 이상 추적 주기 간 악성 발견율 차이가 유의미하지 않았습니다 [1]. 다만 추적 중 초음파 특성이 변화하거나 크기가 FNA 기준에 도달하면 조직검사를 검토합니다.
Q5. 갑상선 결절 추적 관찰은 언제 종료할 수 있습니까?
추적 종료 기준은 가이드라인마다 차이가 있습니다. ACR TI-RADS에서는 TR3~TR4 등급 결절이 5년 추적 관찰 기간 동안 크기나 특성 변화 없이 안정적으로 유지된 경우 추적 종료를 고려할 수 있습니다 [4]. ETA 가이드라인도 저위험 결절의 경우 3~5년 관찰 후 재평가를 권고합니다 [3]. 최종 종료 여부는 환자의 전반적 임상 상황을 고려하여 결정됩니다.
[1] Chou R et al., "Ultrasound Follow-Up of Benign Thyroid Nodules: A Scoping Review," Thyroid, 2023. DOI: 10.1089/thy.2022.0692. PMID: 36800900.
[2] Singh Ospina N et al., "Diagnostic accuracy of thyroid nodule growth to predict malignancy in thyroid nodules with benign cytology: systematic review and meta-analysis," Clinical Endocrinology (Oxford), 2016. DOI: 10.1111/cen.12975. PMID: 26562828.
[3] Durante C et al., "2023 European Thyroid Association Clinical Practice Guidelines for thyroid nodule management," European Thyroid Journal, 2023. DOI: 10.1530/ETJ-23-0067. PMID: 37358008.
[4] Tessler FN et al., "ACR Thyroid Imaging, Reporting and Data System (TI-RADS): White Paper of the ACR TI-RADS Committee," Journal of the American College of Radiology, 2017. DOI: 10.1016/j.jacr.2017.01.046. PMID: 28372962.
[5] Kim PH et al., "2021 Korean Thyroid Imaging Reporting and Data System and Imaging-Based Management of Thyroid Nodules," Korean Journal of Radiology, 2021. DOI: 10.3348/kjr.2021.0713. PMID: 34719893.
[6] Zhang WB et al., "Comparisons of ACR TI-RADS, ATA guidelines, Kwak TI-RADS, and KTA/KSThR guidelines in malignancy risk stratification of thyroid nodules," Clinical Hemorheology and Microcirculation, 2020. DOI: 10.3233/CH-190778. PMID: 31929154.
[7] Koc AM et al., "Comparison of diagnostic accuracy of ACR-TIRADS, ATA, and EU-TIRADS guidelines in detecting thyroid malignancy," European Journal of Radiology, 2020. DOI: 10.1016/j.ejrad.2020.109390. PMID: 33181485.
[8] Yoon JH et al., "Follow-Up Strategies for Thyroid Nodules with Benign Cytology on Ultrasound-Guided Fine Needle Aspiration," Thyroid, 2019. DOI: 10.1089/thy.2018.0769. PMID: 31359839.
본 콘텐츠는 학술 논문과 공개된 연구 자료를 바탕으로 작성된 정보성 글이며, 의학적 진단이나 치료를 대체하지 않습니다. 건강 관련 결정은 반드시 담당 의료진과 상담하시기 바랍니다.