ÖZ
Amaç
Panoramik radyolojik görüntülerde mental foramenlerin hassas bir şekilde tespit edilmesi, diş hekimliğinde çok sayıda klinik ve teşhis uygulaması için büyük önem taşımaktadır.
Yöntemler
Bu çalışmada, YOLO ailesinin birden fazla versiyonu (YOLOv5, YOLOv8, YOLOv9, YOLOv10, YOLOv11 ve YOLO World) ile RT-DETR mimarisi dahil olmak üzere gelişmiş derin öğrenme tabanlı nesne algılama modellerinin, mental foramenlerin tanımlanması ve lokalizasyonundaki performansları araştırılmıştır. Model eğitimi ve değerlendirmesi için ağız, diş ve çene cerrahisi uzmanları tarafından manuel olarak belirlenmiş 100 anonimleştirilmiş panoramik radyolojik görüntüden oluşan bir veri kümesi kullanılmıştır.
Bulgular
Modeller, kesinlik, duyarlılık ve mAP50 gibi standart ölçütler kullanılarak değerlendirilmiş ve RT-DETR-x mimarisi, %89,0 kesinlik, %85,0 duyarlılık ve %85,6 mAP50 ile en yüksek performansı elde etmiştir. Özellikle YOLO World-s ve YOLOv9e, tespit doğruluğu ve hesaplama verimliliğini etkili bir şekilde dengeleyerek rekabetçi sonuçlar sunmuştur. Elde edilen bulgular, yapay zeka tabanlı tespit sistemlerinin diş teşhisini otomatikleştirme ve kolaylaştırma konusundaki klinik uygulanabilirliğini vurgulamakta, aynı zamanda derin öğrenme modellerinin karmaşık anatomik varyasyonları ve görüntüleme zorluklarını ele almada ne kadar sağlam olduğunu göstermektedir.
Sonuç
Bu araştırma, model genellemesini ve doğruluğunu daha da artırmak için veri setinin genişletilmesi ve gelişmiş topluluk tekniklerinin entegre edilmesi önerileriyle, otomatik diş teşhisinde gelecekteki ilerlemelere sağlam bir temel sunmaktadır.
GİRİŞ
İnsan vücudundaki çeşitli anatomik yapılar, hem tıp alanında hem de teknolojik gelişmelerde giderek artan bir ilgi odağı haline gelmektedir. Bu yapılardan biri olan foramen mentale, ağız ve çene cerrahisi, diş hekimliği ve nöroanatomi gibi disiplinlerde önemli bir anatomik işaret noktası olarak öne çıkmaktadır. Mental sinir, nervus alveolaris inferiorun bir dalı olarak alt çene kemiğindeki mental foramen aracılığıyla yumuşak dokuya çıkar ve küçük azı dişlerini, alt dudağı, bukkal diş etini ve mukozayı innerve eder (1). Mental sinirin, nervus alveolaris inferiordan ayrıldıktan sonra yumuşak dokuya geçişi mental foramen yoluyla gerçekleşmektedir (2).
Mental foramen bölgesine yönelik cerrahi veya endodontik tedavilerde, mental sinirin zarar görmesi çeşitli komplikasyonlara yol açabilir. Özellikle sinir hasarı sonrası gelişen parestezi, mental sinir bölgesinde sıkça karşılaşılan bir komplikasyondur (3). Bazı durumlarda, periapikal enfeksiyonlar dahi mental sinirde paresteziye neden olabilir (4). Tedavi sırasında meydana gelebilecek sinir hasarı, klinik olarak çeşitli nörolojik sorunlarla kendini gösterebilir (5). Bu tür komplikasyonların önlenmesi için hekimin, anatomik yapıların konumunu radyolojik görüntülerde doğru bir şekilde tespit etmesi büyük önem taşımaktadır.
Foramen mentale, premolar dişler bölgesinde yer almakta olup, radyolojik görüntülerde yuvarlak veya oval, tek ya da çok sayıda, bilateral bir radyolusensi olarak izlenmektedir (6). Anatomik yapıların ve varyasyonlarının tedavi öncesinde radyolojik olarak belirlenmesi, diş hekimliği pratiğinde gerçekleştirilecek işlemlerin başarısını doğrudan etkileyen kritik bir faktördür (7). Mental foramenin konumunun doğru bir şekilde tespit edilmesi ve bu anatomik varyasyonların anlaşılması, tedavi güvenliğini ve başarısını artırmada önemli bir rol oynamaktadır (8).
Yapay zeka algoritmalarının sağlık alanında kullanımı, özellikle görüntü işleme teknolojilerinde, insan gözünden kaçabilecek detayları yakalayarak tedavi güvenliğini artırmayı hedeflemektedir (9). Son yıllarda, yapay zeka tabanlı sistemler, özellikle tıbbi görüntü analizi alanında devrim niteliğinde ilerlemeler kaydetmiştir (10-20). Bu gelişmeler, sağlık sektöründe tanı ve tedavi süreçlerini dönüştürmüş, daha hızlı ve doğru analizlerin yapılmasını mümkün kılmıştır. Dental radyografilerde yapay zeka destekli otomatik analiz sistemleri, tanı süreçlerini hızlandırmak, hata oranlarını azaltmak ve uzmanlık gereksinimini minimize etmek amacıyla yaygın şekilde uygulanmaya başlanmıştır. Özellikle derin öğrenme teknikleri, üstün modelleme kabiliyetleri sayesinde daha yüksek doğruluk oranlarına ulaşarak diş radyolojisi başta olmak üzere birçok alanda önemli katkılar sağlamaktadır.
Dental radyografiler üzerine yapılan çalışmalar incelendiğinde, literatürün genellikle panoramik görüntülere dayalı çürük tespiti (11-14), gömülü diş tespiti (15-19), diş ve çene kırıklarının (20-22) ve anatomik yapıların belirlenmesi (23-26) gibi farklı odak alanlarında yoğunlaştığı görülmektedir. Bu çalışmalarda, bölgesel (region-based) ve piksel tabanlı (pixel-based) derin öğrenme segmentasyon yöntemlerinin sıklıkla tercih edildiği dikkat çekmektedir. Söz konusu yöntemler, dental radyografilerde yüksek çözünürlüklü detayların hassas bir şekilde analiz edilmesine olanak tanımakta; böylelikle hem klinik doğruluğu artırmakta hem de manuel işleme olan bağımlılığı önemli ölçüde azaltmaktadır. Ancak, literatürde mental foramenin otomatik ve hassas bir şekilde tespiti üzerine yapılan çalışmalar oldukça sınırlıdır. Mevcut çalışmalarda (27, 28), genellikle piksel tabanlı segmentasyon yöntemlerine dayanan UNet mimarisi gibi modellerin kullanıldığı görülmektedir. Bununla birlikte, mental foramen gibi küçük ve hassas anatomik yapıların tespiti, özellikle dental cerrahi ve tanı süreçlerinde büyük önem taşımaktadır. Bölgesel tespit yöntemleri, bu tür yapıların doğru lokalizasyonunu sağlayarak klinik süreçlerde daha hızlı ve etkili çözümler sunmaktadır. Bu eksiklik, mental foramenin bölgesel tabanlı derin öğrenme yöntemleriyle tespit edilmesine yönelik araştırmaların gerekliliğini açıkça ortaya koymaktadır. Bölgesel tespit yöntemleri, yalnızca hız ve doğruluk avantajı sunmakla kalmayıp aynı zamanda dental radyografilerin analizi sırasında kullanıcı dostu sistemlerin geliştirilmesine de olanak tanımaktadır. Mental foramenin bölgesel tabanlı tespitine yönelik bu çalışma, literatürdeki önemli bir boşluğu doldurmayı hedeflemekte ve dental radyoloji alanında yapay zeka destekli çözümlerin potansiyelini bir adım öteye taşımaktadır.
Bu çalışmada, panoramik dental görüntülerde yapay zeka tabanlı bir sistem geliştirilerek foramen mentalenin bölgesel tabanlı olarak doğru ve otomatik bir şekilde tespit edilmesi hedeflenmiştir. Önerilen sistemin, tanı süreçlerini hızlandırarak klinik verimliliği artırması ve diş hekimlerinin iş yükünü hafifletmesi beklenmektedir. Ayrıca, önerilen modelin yüksek doğruluk oranı ile manuel işlemlere olan bağımlılığı azaltarak, dental cerrahi ve tanı süreçlerinde güvenilirliği artıracağı öngörülmektedir. Bu bağlamda, çalışma hem literatürdeki önemli bir boşluğu doldurmakta hem de dental radyoloji alanında yapay zeka tabanlı çözümlerin uygulanabilirliğini genişletmeyi hedeflemektedir. Çalışma kapsamında, you only look once (YOLO) ve real-time detection transformer (RT-DETR) gibi son teknoloji derin öğrenme modelleri kullanılarak mental foramenin otomatik tespiti gerçekleştirilmiş, bu modellerin performansları detaylı bir şekilde karşılaştırılmıştır. Bu analizler, dental görüntülerdeki zorlu anatomik yapıların tespitine yönelik güçlü algoritmalar geliştirilmesine katkı sunmayı amaçlamaktadır.
Bu çalışmanın ana katkıları şunlardır:
• Panoramik dental görüntülerde mental foramenin otomatik ve hassas bir şekilde tespitine yönelik, derin öğrenme tabanlı bölgesel tespit yöntemlerini kullanan ilk çalışmalardan biri olarak, literatürdeki önemli bir boşluğu doldurmaktadır.
• YOLO ve RT-DETR gibi son teknoloji derin öğrenme modelleri kullanılarak, dental radyografilerde mental foramen tespitine yönelik kapsamlı bir karşılaştırma yapılmış ve bu modellerin performansları detaylı metrikler (Precision, Recall, mAP50) üzerinden değerlendirilmiştir. Ayrıca, farklı modellerin avantajları ve sınırlılıkları detaylı olarak analiz edilmiştir.
• Kullanıcıların panoramik diş görüntülerini yükleyerek mental foramen bölgelerini anında tespit ve görselleştirme yapabildiği web tabanlı bir gerçek zamanlı sistem geliştirilmiştir. Bu sistem, diş hekimleri için pratik bir çözüm sunarak teşhis süreçlerini hızlandırmayı hedeflemektedir.
• Önerilen sistem, özellikle yoğun çalışma temposuna sahip diş hekimleri ve röntgen okuma konusunda deneyimsiz yeni mezunlar için kullanıcı dostu bir çözüm sunarak tanı süreçlerinde doğruluğu artırma ve manuel işlem süresini azaltma potansiyeline sahiptir.
• Çalışma, dental radyoloji alanında yapay zeka tabanlı çözümlerin uygulanabilirliğini genişleterek, tanı süreçlerini otomatikleştirmek için modern teknolojilerin nasıl kullanılabileceğini göstermektedir.
• Çalışmanın bulguları, mental foramen tespiti gibi zorlu anatomik yapıların daha geniş veri setleri, gelişmiş modeller ve çok modlu veri entegrasyonu ile nasıl daha iyi ele alınabileceğine dair öneriler sunarak, gelecekteki araştırmalar için bir temel oluşturmaktadır.
Bu katkılar, dental görüntüleme ve obje tespiti alanında yenilikçi yaklaşımların klinik ve teknolojik kullanımını desteklemektedir.
MATERYAL VE METOT
Bu çalışma Mersin Üniversitesi Klinik Araştırmalar Etik Kurulu’ndan (743/2024) onay alınmasını takiben gerçekleştirilmiştir. Ocak 2024 ve Temmuz 2024 tarihleri arası Mersin Üniversitesi Diş Hekimliği Fakültesi Hastanesi’ne tanı ve tedavi amacı ile başvuran hastalardan elde edilen 100 panoramik görüntüde mental foramenler değerlendirilmiştir. Panoramik görüntülerindeki mental foramenleri tespit etmedeki performanslarını değerlendirmek için çeşitli nesne algılama mimarileri kullanılmıştır. YOLOv11s, YOLOv10s, YOLOv8l, YOLOv5m, YOLOv9e ve YOLO World-s dahil olmak üzere son teknoloji YOLO modelleri, verimlilikleri ve gerçek zamanlı nesne algılama görevlerindeki yaygın uygulamaları nedeniyle kullanılmıştır. Ayrıca, uçtan uca algılama görevlerinde sağlam performansıyla bilinen yeni RT-DETR mimarisi de karşılaştırmalı bir analiz için deneylere dahil edilmiştir. Bu modeller, hedef bölgeleri tanımlamadaki etkinliklerini belirlemek için kesinlik, duyarlılık ve mAP50 gibi performans ölçütler kullanılarak değerlendirilmiştir. Önerilen çalışmanın genel gösterimi Şekil 1’de verilmiştir.
Önerilen modeli oluşturan temel mimariler alt başlıklarda daha ayrıntılı olarak açıklanmıştır.
A. YOLO Mimarisi
Nesne tespiti, bir görüntüdeki nesneleri sınırlayıcı kutuları ve sınıf etiketlerini aynı anda tahmin ederek tanımlamayı ve konumlandırmayı amaçlamaktadır. YOLO, nesne tespitini tek bir regresyon problemi olarak çerçeveleyen, hem yüksek hız hem de doğruluk sunan çığır açıcı bir yaklaşımdır (29). Geleneksel çok aşamalı yöntemlerin aksine YOLO, tespit işlemini ağın tek bir ileri geçişinde gerçekleştirerek işlem hattını önemli ölçüde basitleştirir ve gerçek zamanlı uygulamalar için oldukça verimli hale getirir.
YOLO’nun mimarisi, bir giriş görüntüsünü I ∈ ℝ H×W×C, her bir ızgara hücresinin sınırlayıcı kutular, nesne güven puanları ve sınıf olasılıklarını tahmin ettiği S × S boyutunda bir ızgaraya böler. Her ızgara hücresi, merkezi bu hücre içerisinde kalan nesneleri tespit etmekten sorumludur. Her hücre için B sınırlayıcı kutu tahmin edilir ve bu kutular b i = (x i, y i, w i, h i, c i) olarak ifade edilir. Burada (x i, y i), sınırlayıcı kutunun normalleştirilmiş merkez koordinatlarını; (w i, h i), genişlik ve yüksekliği; c i, güven puanını ifade eder. Ayrıca, her hücre K nesne sınıfı için sınıf olasılıklarını p = (p 1, p 2, … , p
K) olarak tahmin eder. Nihai çıktı tensörü, tüm görüntü için S × S × (B × 5 + K) boyutunda olup yerelleştirme, güven ve sınıflandırma tahminlerini bütünleştirir (29, 30).
YOLO’da sınırlayıcı kutuların yerelleştirme hassasiyetini artırmak için belirli bir parametrelendirmesi kullanılır. Merkez koordinatları (x i, y i), sigmoid aktivasyon fonksiyonu ile ızgara hücresine kısıtlanır:
(1)
Burada t x ve t y ham çıktıları, (c x, c y) ise ızgara hücresinin sol üst köşesini temsil eder. Sınırlayıcı kutunun boyutları (w i, h i), önceden tanımlanmış bağlantı kutusu boyutları (p w, p h) kullanılarak tahmin edilir:
(2)
Güven puanı c i, nesnenin var olma olasılığı ile yerelleştirme doğruluğunu birleştirir:
(3)
Burada Intersection over Union (IoU), tahmin edilen sınırlayıcı kutu ile gerçeğin kesişiminin birleşime oranını ölçer. YOLO’nun optimizasyonu, yerelleştirme, güven ve sınıflandırmayı dengelemek için çok parçalı bir kayıp fonksiyonu kullanılarak gerçekleştirilir:
Burada 1 ij obj ve 1 ij noobj , bir nesnenin varlığına veya yokluğuna işaret eden göstergelerdir. λ coord ve λ noobj yerelleştirme ve arka plan tahminlerinin önemini dengelemek için kullanılan katsayılardır.
YOLO’nun birleşik yaklaşımı, nesne tespitini tek bir regresyon problemine dönüştürerek hem verimli hem de doğru hale getirir. Izgara tabanlı gösterimi, sınırlayıcı kutu parametrelendirmesi ve sofistike kayıp fonksiyonu, gerçek zamanlı tespit uygulamaları için güçlü bir çözüm sunar. Zamanla YOLO mimarisi önemli gelişimlere uğramış ve performansını artıran yenilikçi özellikler kazanmıştır.
Bu çalışma kapsamında, YOLO mimarisine dayalı YOLOv5 (31), YOLOv8 (32), YOLOv9 (33), YOLOv10 (34), YOLOv11 (35) ve YOLO World (36) gibi son teknolojik mimariler kullanılmıştır. Bu YOLO tabanlı farklı versiyonları belirgin iyileştirmeler sunmaktadır. YOLOv5, CSPDarknet omurgası ve PANet boynuyla gerçek zamanlı hız ve yüksek doğruluk sağlarken, YOLOv8 omurga ve boyun mimarilerini optimize ederek bu performansı geliştirmiştir. YOLOv9, programatik gradyan bilgisi ve GELAN gibi yenilikler ile bilgi darboğazlarını azaltmayı başarmış; YOLOv10 ise maksimum olmayan bastırmayı (NMS) kaldırarak daha tutarlı çift taraflı eşleştirme sağlamıştır. YOLOv11, parametreleri azaltılmış optimize edilmiş bir omurga sunarken, YOLOWorld, açık kelime dağarcığı nesne tespiti özelliği ekleyerek kullanım alanını genişletmiştir. Bu gelişmeler, YOLO’nun modern tespit görevlerinde hala güçlü bir temel olduğunu ve gerçek zamanlı uygulamalarda etkili bir çözüm sunduğunu göstermektedir.
B. RT-DETR Mimarisi
RT-DETR, geleneksel özellik çıkarma tekniklerinin verimliliğini, Transformer mimarisinin güçlü küresel çıkarım yetenekleriyle birleştiren uçtan uca bir nesne tespit sistemidir. Gerçek zamanlı uygulamalar için optimize edilen RT-DETR, NMS gibi işlem sonrası tekniklere olan ihtiyacı ortadan kaldırarak, tespit işlemini doğrudan eşleştirme mekanizmasıyla gerçekleştiren bir yaklaşım sunmaktadır. Bu yöntem, yüksek doğruluk ve hızın bir arada sağlanmasını mümkün kılmaktadır (37).
Bir giriş görüntüsü I ∈ ℝ H×W×C, önce bir özellik çıkarıcı (örneğin, ResNet veya başka bir konvolüsyonel mimari) kullanılarak bir özellik haritasına F ∈ ℝ H f×W f×C f dönüştürülür. Burada H f, W f, ve C f, sırasıyla özellik haritasının yüksekliği, genişliği ve kanal sayısını temsil eder. Özellik haritası daha sonra F ′ ∈ ℝ N×C f şeklinde yeniden yapılandırılır, burada N = H f ⋅ W f, özelliklerin gömülü temsil sayısını ifade eder. Bu işlem, verilerin Transformer tabanlı işlemeye uygun hale getirilmesini sağlar (37-40).
RT-DETR’nin temelini oluşturan transformer mimarisi, bir kodlayıcı ve kod çözücü yapıdan oluşur. Kodlayıcı, özellik temsillerine öz dikkat (self-attention) uygulayarak görüntü genelinde küresel bağımlılıkları modellemektedir. Öz dikkat mekanizması, sorgu (Q), anahtar (K) ve değer (V) matrislerini kullanarak şu şekilde tanımlanır (37):
Attention(Q, K, V) = softmax(Q K ⊤ _ √ _ d k )V (5)
Burada d k, gömülü temsillerin boyutunu ifade eder. Kod çözücü, sabit bir nesne sorgusu kümesi (Q obj ∈ ℝ N q×d k) kullanarak her bir nesneyi modellemek için kodlayıcıdan gelen çıktılarla etkileşime girer. Bu sorgular, potansiyel nesnelerle ilgili bilgileri çıkarmak için kodlayıcı çıktılarıyla birleştirilir ve çözülmüş gömülü temsiller Z ∈ ℝ N q×d k elde edilir. Bu temsiller, tespit edilecek nesnelerin bilgilerini içerir.
Kod çözücü çıktıları her bir nesne sorgusu için iki temel tahmin gerçekleştirir: sınırlayıcı kutular ve sınıf olasılıkları. Sınırlayıcı kutular, ileri beslemeli bir ağ kullanılarak tahmin edilir ve şu şekilde ifade edilir:
b i = (x i, y i, w i, h i) (6)
Burada (x i, y i), sınırlayıcı kutunun normalleştirilmiş merkez koordinatlarını; (w i, h i) ise normalleştirilmiş genişlik ve yüksekliğini temsil eder. Sınıf olasılıkları ise softmax fonksiyonu kullanılarak tahmin edilir ve K sınıfı için p i = (p 1, p 2, … , p K) şeklinde tanımlanır.
RT-DETR’nin öğrenme süreci, tahmin edilen nesneleri temel gerçek etiketlerle hizalamak için Hungarian algoritması kullanılarak optimize edilen bir küme tabanlı kayıp fonksiyonuyla gerçekleştirilir. Toplam kayıp, sınıflandırma kaybı (ℒ cls) ve kutu regresyon kaybı (ℒ box) bileşenlerinden oluşur:
(7)
Kutu regresyon kaybı, 𝓁 1 kaybı ve genelleştirilmiş IoU (GIoU) kaybının bir birleşimini içerir:
(8)
RT-DETR, sonradan işleme ihtiyacını ortadan kaldırarak nesne tespiti sürecini büyük ölçüde basitleştirir. Transformer mimarisinden yararlanarak hem yüksek doğruluk hem de gerçek zamanlı çıkarım sağlayan RT-DETR, çeşitli uygulamalarda verimli ve ölçeklenebilir bir çözüm sunar. Bu özellikleri sayesinde RT-DETR, nesne tespiti için modern bir ilerlemeyi temsil etmektedir (37-40).
C. Veri Kümesi
Bu çalışmada kullanılan veri kümesi, Mersin Üniversitesi Diş Hekimliği Fakültesi’nde anonim olarak sağlanan 100 hastaya ait panoramik ağız görüntülerinden oluşmaktadır. Bu görüntüler, dental yapıları detaylı bir şekilde incelemek ve foramen mentale bölgesini belirlemek amacıyla özel olarak hazırlanmıştır. Diş hekimlerinin katkılarıyla, her bir görüntüde foramen mentale bölgesi manuel olarak etiketlenmiştir. Etiketleme süreci, foramen mentale gibi küçük ve önemli bir yapının doğru şekilde tespit edilmesine olanak tanıyacak hassasiyette gerçekleştirilmiştir. Elde edilen örnek etiketli görüntüler Şekil 2’de verilmiştir.
Panoramik görüntüler, YOLO modellerinin işlem gereksinimlerine uygun olacak şekilde 640x640 piksel olarak yeniden boyutlandırılmıştır. Monokrom formatta olan bu görüntüler, dental anatomik yapıları belirgin şekilde ayırt edebilmek için optimize edilmiştir. Bu veri kümesi, modelin foramen mentale tespit doğruluğunu değerlendirmek ve geliştirmek için temel bir kaynak oluşturmaktadır.
D. Uygulama Detayları
Deneysel çalışmalarda kullanılan modellerin eğitim süreci, optimal performans elde etmek amacıyla özenle tasarlanmış ve çeşitli parametreler üzerinde ince ayar yapılmıştır. Eğitimde, panoramik dental görüntülerden oluşturulan ve mental foramen bölgelerinin etiketlendiği bir veri seti kullanılmıştır. Veri seti, eğitim (%80) ve test (%20) olmak üzere ikiye ayrılmış, modelin genelleme kapasitesini artırmak için veri artırma yöntemleri uygulanmıştır.
Eğitim sürecinde, batch size değeri 16 olarak belirlenmiş ve toplamda 500 epoch boyunca eğitim gerçekleştirilmiştir. Öğrenme oranı başlangıçta 10−3 olarak ayarlanmış ve Cosine Annealing yöntemi ile dinamik olarak değiştirilmiştir. Optimizasyon algoritması olarak AdamW tercih edilmiş olup, moment hesaplamaları için β 1 = 0.9 ve β 2 = 0.9 değerleri atanmıştır. Ağırlık çürüme katsayısı 10−2 olarak belirlenmiştir. Model girdi boyutu 640x640 piksel olacak şekilde ayarlanmıştır. Eğitim sırasında obje varlığı için Binary Cross-Entropy Loss ve bounding box regresyonu için CIoU kaybı kullanılmıştır. Öğrenme oranı, eğitim süresince 3 epochluk bir ısınma periyodunda kademeli olarak artırılmıştır. Bu parametreler, tespit doğruluğunu ve bounding box koordinatlarının hassasiyetini en üst düzeye çıkarmak amacıyla optimize edilmiştir.
Eğitilen modellerin pratik uygulanabilirliğini göstermek amacıyla bir web tabanlı gerçek zamanlı tespit sistemi geliştirilmiştir. Bu sistem, kullanıcıların panoramik dental görüntüleri yüklemesine ve tespit edilen mental foramen bölgelerini anlık olarak görselleştirmesine olanak tanır. Sunucu tarafında, hızlı ve ölçeklenebilir bir API oluşturmak için FastAPI kullanılmıştır. FastAPI, modern Python tabanlı uygulamalar geliştirmek için sunduğu esnek yapısıyla tespit sisteminin performansını ve entegrasyonunu kolaylaştırmıştır. Kullanıcı arayüzü ise Next.js kullanılarak geliştirilmiş, bu sayede kullanıcı dostu ve modern bir web deneyimi sağlanmıştır. Next.js, hızlı yükleme süreleri ve dinamik sayfa oluşturma avantajlarıyla sistemin kullanılabilirliğini artırmıştır. Kullanıcılar, web arayüzü üzerinden panoramik görüntüleri yükleyebilir ve tespit edilen bölgeleri anlık olarak görselleştirebilir. Bu sistem, sadece yüksek doğruluk ve hız sağlamakla kalmaz, aynı zamanda tanı süresini kısaltmayı ve dental uzmanların iş yükünü hafifletmeyi hedefler.
E. Performans Metrikleri
Bu çalışmada, nesne algılama modellerinin performansı, temel performans ölçütleri olarak kesinlik (Precision), duyarlılık (Recall) ve mAP50 kullanılarak değerlendirilmiştir. Bu ölçütler, tespit sonuçlarının doğruluğu ve güvenilirliği hakkında fikir vermektedir. Bu performans metrikleri, Denklem 9-13’te verilmiştir.
Kesinlik (Precision) = DP _ DP + YP
(9)
Duyarlılık (Recall) = DP _ DP + YN
(10)
Bu denklem 9-10’da, DP, YP ve YN sırasıyla doğru pozitif sayısı, yanlış pozitif sayısı ve yanlış negatif sayısını temsil etmektedir. Diğer yandan, IoU, tahmin edilen bir sınırlayıcı kutu ile bir temel gerçek sınırlayıcı kutu arasındaki örtüşmeyi ölçmektedir. Bu metrik şu şekilde tanımlanır:
IoU = Örtüşme Alanı ___________ Birleşme Alanı
(11)
Bu denklemde, IoU ≥ 0,5 ise (mAP50 için) bir sınırlayıcı kutu gerçek pozitif olarak kabul edilir. mAP50, 0,5 IoU eşiğinde tüm sınıflar için hesaplanan ortalama hassasiyet (AP) değerlerinin ortalamasıdır. AP ise, kesinlik-hatırlama eğrisinin altındaki alan alınarak hesaplanır. Kesinlik-hatırlama eğrisi, tahminlerin güven eşiği değiştirilerek çizilir. AP ve mAP50 metrikleri Denklem 12-13’te tanımlanmıştır.
AP = ∫ 0 1 Precision(r) d r
(12)
mAP50 = 1 _ C ∑ c=1 C AP c
(13)
burada r ve Precision(r) sırasıyla duyarlılık (Recall) ve belirli bir duyarlılık seviyesinde enterpole edilmiş hassasiyetti temsil etmektedir. Ayrıca, C sınıf sayısını ve AP c ise IoU eşiği 0,5’te c sınıfı için ortalama hassasiyettir.
BULGULAR
Bu çalışmada kapsamlı deneysel çalışmalar, MSI RTX 4090 SUPRIM LIQUID X 24 G ekran kartına sahip yüksek performanslı bir bilgisayar sistemi üzerinde gerçekleştirilmiştir. Kullanılan sistem,Intel Core i9-14900K işlemciye ve 128 GB RAM’e sahip olup derin öğrenme modellerinin hızlı eğitimi ve test edilmesi için optimize edilmiştir. Çalışmada kullanılan veri kümesi, Mersin Üniversitesi Diş Hekimliği Fakültesi tarafından sağlanan ve diş hekimleri tarafından manuel olarak etiketlenen panoramik dental görüntülerden oluşmaktadır. Mental foramen bölgelerinin doğru şekilde işaretlendiği toplam 100 anonim görüntü içeren bu veri kümesi, %80 eğitim ve %20 test olacak şekilde ikiye ayrılmıştır. Bu ayrım, modellerin genelleme kapasitesini değerlendirmek ve performanslarını karşılaştırmak için standart bir yapı sağlamaktadır.
Deneysel çalışmalarda, YOLO mimarisine dayalı YOLOv5, YOLOv11, YOLOv10, YOLOv8, YOLOv9 ve YOLO World modelleri ile RT-DETR mimarisine ait tüm versiyonlar kullanılmıştır. Modellerin performansı, kesinlik, duyarlılık ve mAP50 gibi yaygın kullanılan değerlendirme metrikleri ile analiz edilmiştir. Yapılan analizler sonucunda, her modelin en iyi performansa sahip versiyonları belirlenmiş ve bu sonuçlar Tablo 1’de sunulmuştur. Bu kapsamda, Tablo 1 hem YOLO ailesinin farklı versiyonlarının hem de RT-DETR-x modelinin performansını detaylı bir şekilde karşılaştırmaktadır. Bu analizler, modellerin doğruluk, genelleme yeteneği ve verimlilik açısından güçlü ve zayıf yönlerini ortaya koyarak, mental foramen tespitinde hangi modelin daha uygun olabileceğine dair önemli sonuçlar sunmaktadır.
Tablo 1’de sunulan sonuçlar, her bir modelin en iyi performans gösteren versiyonlarını yansıtmaktadır. Tablo incelendiğinde, RT-DETR-x modeli, kesinlik (%89,0), duyarlılık (%85,0) ve mAP50 (%85,6) metriklerinde tüm modeller arasında en yüksek performansı sergileyerek dikkat çekmektedir. Bu sonuç, RT-DETR-x’in mental foramen bölgelerini yüksek doğrulukla ve minimum hata ile tespit edebildiğini göstermektedir. Özellikle yüksek duyarlılık değeri, modelin görüntülerdeki mental foramen bölgelerini kaçırmadan tespit etme yeteneğini vurgulamaktadır. Bu özellik, modelin genelleme kapasitesinin güçlü olduğunu ortaya koymaktadır.
YOLO modelleri arasında, YOLO World-s modeli, %77,5 kesinlik ve %80,5 mAP50 ile dengeli bir performans sunarak öne çıkmaktadır. Bu model, yüksek bir duyarlılık değerine sahip olmasıyla daha az hata yaparak doğru tespitler gerçekleştirmiştir. Öte yandan, YOLOv9e modeli, %80,5 mAP50 ile YOLO ailesi içinde en yüksek doğruluk oranına ulaşmış ve başarılı tespit kapasitesini göstermiştir. YOLOv11s modeli ise %86,2 kesinlik değeriyle özellikle yüksek doğruluk sağlarken, düşük duyarlılık değeri (%67,5) nedeniyle genelleme yeteneğinin sınırlı olduğu gözlemlenmiştir.
Bu sonuçlar, RT-DETR-x modelinin, karmaşık dental görüntü verilerinde mental foramen tespiti için etkili bir algoritma olduğunu kanıtlamaktadır. Model, doğruluk, kapsamlılık ve genel performans (mAP50) açısından üstün sonuçlar sunmuş ve yüksek doğruluk gerektiren durumlar için öncelikli tercih olabileceğini ortaya koymuştur. Bununla birlikte, YOLO modelleri, özellikle hız ve doğruluk dengesi açısından etkili alternatifler olarak öne çıkmıştır. YOLO World-s ve YOLOv9e modelleri, hem duyarlılık hem de mAP50 değerlerinde tatmin edici sonuçlar sunmuş, pratik uygulamalar için güçlü seçenekler olarak değerlendirilmiştir.
Bu analiz, derin öğrenme modellerinin mental foramen tespiti gibi karmaşık görevlerdeki potansiyelini ve klinik uygulamalara yönelik pratik değerini ortaya koymaktadır. RT-DETR-x, üstün performansı ile öne çıkarken, YOLO modelleri kullanım kolaylığı ve verimlilik açısından önemli alternatifler sunmaktadır.
Bu sayısal sonuçlarına ek olarak Şekil 3’te görsel tahmin sonuçları verilmiştir. Şekil 3’te, her bir sütun farklı bir olgu örneğini (Örnek 1-5) gösterirken, satırlar sırasıyla gerçek etiket, YOLOv5, YOLOv8, YOLOv9, YOLOv10, YOLOv11, YOLO-World ve RF-DETR modellerinin tespit sonuçlarını göstermektedir. Mavi kutular modeller tarafından tespit edilen ilgi alanlarını işaret etmektedir.
Şekil 3, panoramik diş röntgenlerinde mental foramen bölgesinin tespiti için kullanılan farklı nesne tespit modellerinin (YOLOv5, YOLOv8, YOLOv9, YOLOv10, YOLOv11, YOLO-World ve RT-DETR) görsel sonuçlarını karşılaştırmalı olarak sunmaktadır. Görsel analizler, her modelin dental görüntülerdeki tespit hassasiyetini ve doğruluk performansını değerlendirmek için önemli bir referans oluşturmaktadır. Genel olarak, RT-DETR modeli, tüm örneklerde mental foramen bölgesini doğru bir şekilde tespit etmiş ve diğer modellere kıyasla en yüksek doğruluk oranını sergilemiştir. Özellikle, Örnek 4 için yalnızca RT-DETR modeli mental foramen bölgesini doğru bir şekilde tespit edebilmiştir. Bu durum, RT-DETR’nin düşük kontrastlı ve karmaşık anatomik yapılar karşısında üstün performans gösterdiğini ortaya koymaktadır. Örnek 1, 3 ve 5’te RT-DETR modelinin yanı sıra YOLO-World modeli de mental foramen bölgelerini doğru bir şekilde tespit etmiştir. Ancak diğer modeller, bu örneklerde yalnızca sınırlı başarı göstermiş ve bazı mental foramen bölgelerini tespit edememiştir. Örnek 2 analizinde, YOLOv5 modeli her iki mental foramen bölgesini başarıyla tespit ederken, YOLOv10 ve YOLO-World modelleri yalnızca bir mental foramen bölgesini doğru bir şekilde tespit edebilmiştir. Aynı örnekte, YOLOv8, YOLOv9 ve YOLOv11 modelleri, mental foramen bölgelerini doğru bir şekilde tespit edememiştir. Bu sonuçlar, modeller arasındaki performans farklılıklarını net bir şekilde göstermekte ve bazı modellerin düşük kontrastlı veya anatomik açıdan karmaşık görüntülerde sınırlı bir başarı sergilediğini ortaya koymaktadır.
Sonuç olarak, RT-DETR modelinin, mental foramen tespiti için en tutarlı ve güvenilir model olduğunu açıkça ortaya koymaktadır. Model, tüm örneklerde yüksek doğruluk oranıyla dikkat çekmiş ve klinik uygulamalarda kullanıma uygun olduğunu göstermiştir. YOLO-World modeli, birçok durumda yüksek doğruluk sağlamakla birlikte, RT-DETR kadar tutarlı bir performans sergileyememiştir. Diğer YOLO modelleri arasında, YOLOv5, bazı örneklerde dikkate değer başarılar elde etmiştir ancak genel performans açısından diğer modellere kıyasla daha düşük kalmıştır.
Bu görsel sonuçlar, mental foramenin tespitinde derin öğrenme tabanlı modellerin güçlü ve zayıf yönlerini değerlendirmek için önemli bir çerçeve sunmaktadır. Özellikle RT-DETR’nin bu görev için üstün bir algoritma olduğunu gösteren bu sonuçlar, klinik uygulamalarda hangi modellerin daha uygun olduğunu belirlemek adına önemli bir rehber işlevi görmektedir. Bu çalışma, dental radyografilerde yapay zeka tabanlı nesne tespiti çözümlerinin potansiyelini ve modellerin bu alandaki pratik uygulamalara katkısını vurgulamaktadır.
TARTIŞMA
A. Literatürdeki Mevcut Çalışmalar ve Çalışmanın Katkıları
Bu çalışma, panoramik dental görüntülerde mental foramenin tespiti ve lokalizasyonuna odaklanmaktadır. Mevcut literatür incelendiğinde, mental foramenin derin öğrenme tabanlı nesne tespiti modelleri ile otomatik olarak tespitine yönelik spesifik bir çalışmaya rastlanmamıştır. Literatürdeki mevcut çalışmalar genellikle UNet gibi piksel tabanlı segmentasyon yöntemlerine dayanmakta ve mental foramenin sınırlarının detaylı analizine odaklanmaktadır. Ancak, bu yaklaşımlar bölgesel tespit yöntemlerinin sunduğu hız, doğruluk ve pratiklik avantajlarını sağlamaktan uzaktır. Bu bağlamda, önerilen çalışma, bölgesel tespit yöntemlerini ele alarak literatürdeki bu boşluğu gidermeyi ve bu alana önemli bir katkı sağlamayı hedeflemektedir.
Mental foramen gibi küçük ve hassas anatomik yapıların doğru bir şekilde tespit edilmesi, dental cerrahi operasyonlar ve tanı süreçleri açısından büyük bir öneme sahiptir. Önerilen RT-DETR ve YOLO tabanlı bölgesel tespit modelleri, manuel tespit sürecine olan bağımlılığı azaltarak hızlı ve etkili çözümler sunmaktadır. Çalışmada kullanılan modellerin karşılaştırmalı analizi, dental görüntüleme alanında hangi modellerin daha etkili olduğunu belirlemek için önemli bir rehber niteliği taşımaktadır.
Bu çalışma, panoramik dental görüntülerde mental foramen tespiti için bölgesel tespit modellerine dayalı ilk araştırmalardan biri olarak literatüre önemli bir katkı sunmaktadır. Önerilen yöntemlerin hem klinik iş akışlarını iyileştirme hem de akademik araştırmalara yeni bir yön verme potansiyeli bulunmaktadır. Gelecekte yapılacak çalışmaların daha büyük veri setleri, gelişmiş optimizasyon yöntemleri ve çok modlu veri entegrasyonuna odaklanarak bu alandaki ilerlemeyi daha da ileriye taşıması beklenmektedir.
B. Geliştirilen Gerçek Zamanlı Web Uygulaması
Çalışmanın bir diğer önemli katkısı, geliştirilen web tabanlı gerçek zamanlı tespit uygulamasıdır. Bu uygulama, kullanıcıların panoramik dental görüntüleri sisteme yükleyerek mental foramen bölgelerini hızlı bir şekilde tespit etmelerine ve görselleştirmelerine olanak tanımaktadır. Sistem, teşhis süreçlerinde manuel işleme olan bağımlılığı ortadan kaldırarak zaman tasarrufu sağlamaktadır. Ayrıca, doğru ve tutarlı sonuçlar üreterek teşhis doğruluğunu artırmayı hedeflemektedir.
Kullanıcı dostu arayüzü sayesinde, uygulama özellikle yoğun iş temposuna sahip diş hekimleri için pratik bir çözüm sunmaktadır. Bunun yanı sıra, röntgen okuma konusunda deneyimsiz yeni mezunlara süreç boyunca rehberlik ederek tanı koyma yeteneklerini geliştirmelerine destek olmaktadır. Bu özellikler, sistemin klinik ortamda etkin bir şekilde kullanılmasını ve teşhis süreçlerinin daha verimli hale getirilmesini sağlamaktadır.
Geliştirilen uygulamaya ait örnek bir ekran görüntüsü Şekil 4’te verilmiştir. Uygulamanın demo sürümüne https://muammerturkoglu.com/apps/foramen-mentale-detection adresinden erişilebilir. Bu sistem yalnızca tanı süreçlerini kolaylaştırmakla kalmamakta, aynı zamanda dental tedavilerde güvenilirliği artırarak hasta memnuniyetini iyileştirme potansiyeline sahiptir.
Çalışmanın Sınırlılıkları
Bu çalışma, panoramik dental görüntüler üzerinde gerçekleştirilmiş olup, kullanılan veri seti sınırlı sayıda görüntüden (100 panoramik dental görüntü) oluşmaktadır. Veri setinin sınırlı olması, modellerin genelleme kapasitelerinin tam anlamıyla değerlendirilememesine yol açmış olabilir. Daha geniş ve çeşitli bir veri setinin kullanılması, modellerin farklı yaş gruplarını, anatomik varyasyonları ve çeşitli görüntüleme koşullarını öğrenerek genelleme yeteneklerini artırabilir. Bunun yanı sıra, düşük kaliteli veya bozulmuş görüntülerde modellerin sınırlı başarı göstermesi, daha kapsamlı veri artırma (data augmentation) teknikleriyle iyileştirilebilir.
Önerilen modellerin hiperparametre optimizasyonu ve farklı eğitim stratejilerinin detaylı bir şekilde ele alınması, performanslarını daha da artırmak için önemli bir fırsat sunmaktadır. Panoramik görüntülere ek olarak, 3D görüntüleme verilerinin [örneğin; konik ışınlı bilgisayarlı tomografiler (KIBT) veya manyetik rezonans görüntüleme (MRG)] entegrasyonu, modellerin doğruluğunu ve güvenilirliğini artırabilir. Ayrıca, RT-DETR ve YOLO gibi güçlü modellerin avantajlarını birleştiren topluluk (ensemble) yöntemlerinin uygulanması, daha dengeli ve yüksek performanslı tespit sistemlerinin geliştirilmesine katkı sağlayabilir. Geliştirilen modellerin klinik ortamda daha kapsamlı testlerden geçirilmesi, bu sistemlerin gerçek dünya uygulamalarındaki başarısını değerlendirmek ve kullanıcı deneyimlerine göre optimize edilmesini sağlamak açısından kritik öneme sahiptir.
Gelecek Çalışmalar için Öneriler
Deneysel çalışmalardan elde edilen sonuçlara dayalı olarak modellerin genelleme kapasitelerini artırmak ve daha geniş bir kullanım alanı sağlamak için aşağıdaki geliştirmeler önerilmektedir:
• Daha büyük ve çeşitlendirilmiş veri setleri: Gelecekte farklı yaş gruplarını, anatomik varyasyonları ve görüntüleme koşullarını içeren daha büyük ve çeşitli veri setlerinin kullanılması, modellerin genelleme yeteneklerini artırabilir.
• Çok modlu veri entegrasyonu: Panoramik görüntülerle birlikte 3D görüntüleme verilerinin (örneğin; KIBT veya MRG) entegrasyonu, tespit doğruluğunu ve güvenilirliğini artırabilir.
• Topluluk (ensemble) modeller: RT-DETR ve YOLO gibi güçlü modellerin avantajlarını birleştiren topluluk yöntemlerinin uygulanması, daha dengeli ve yüksek performanslı tespit sistemlerinin geliştirilmesine olanak sağlayabilir.
• Klinik test ve optimizasyon: Geliştirilen modellerin klinik ortamda geniş kapsamlı testleri yapılmalı ve kullanıcı deneyimlerine göre optimize edilmelidir.
Bu öneriler, mental foramen tespiti gibi hassas anatomik yapıların tespitinde daha yüksek doğruluk ve güvenilirlik sağlayarak, yapay zeka tabanlı dental çözümlerin potansiyelini daha da artırabilir.
SONUÇ
Bu çalışmada, panoramik radyografi görüntülerinde mental foramenlerin tespiti ve lokalizasyonu, son teknoloji derin öğrenme tabanlı nesne tespit modelleri kullanılarak ele alınmıştır. YOLO ailesine ait modeller ve RT-DETR mimarisi kapsamlı bir şekilde karşılaştırılmış, performansları hassasiyet, geri çağırma ve mAP50 gibi metrikler kullanılarak değerlendirilmiştir. Değerlendirme sonuçları, RT-DETR-x mimarisinin genel olarak en yüksek performansı sergilediğini ve karmaşık dental görüntülerde mental foramen bölgelerini doğru ve güvenilir bir şekilde tespit edebildiğini ortaya koymuştur. Bunun yanı sıra, YOLO modellerinden YOLO-World-s ve YOLOv9e, tespit doğruluğu ile hesaplama verimliliği arasında dengeli bir performans sunarak dikkat çekici sonuçlar elde etmiştir.
Çalışmanın en önemli katkılarından biri, kullanıcıların panoramik radyolojik görüntüleri yükleyerek mental foramen bölgelerini anında görselleştirebildikleri web tabanlı gerçek zamanlı bir uygulamanın geliştirilmesidir. Bu uygulama, önerilen modellerin klinik iş akışlarına entegrasyonunu kolaylaştırarak diş hekimleri için kullanıcı dostu ve pratik bir çözüm sunmaktadır. Sistem, tespit sürecini otomatikleştirerek teşhis süresini önemli ölçüde azaltma ve dental görüntüleme analizindeki doğruluğu artırma potansiyeline sahiptir.
Elde edilen sonuçlar, derin öğrenme tabanlı nesne tespit modellerinin dental radyografilerdeki anatomik varyasyonlar ve görüntüleme zorlukları karşısındaki sağlamlığını ve esnekliğini vurgulamaktadır. Gelecekteki çalışmalar, modellerin genellenebilirliğini artırmak için daha geniş ve çeşitli bir veri kümesi kullanmayı hedefleyebilir. Ayrıca, gelişmiş topluluk yöntemlerinin entegrasyonu veya çok modlu görüntüleme verilerinin kullanımı, tespit doğruluğu ve güvenilirliği daha da artırabilir.
Genel olarak bu çalışma, dental görüntüleme alanında yapay zeka uygulamaları için önemli bir adım atarak, otomatik tespit sistemlerinin klinik sonuçları iyileştirme ve teşhis süreçlerini kolaylaştırma potansiyelini ortaya koymaktadır. Çalışmada sunulan bulgular ve metodolojiler, bu alanda yapılacak gelecekteki araştırmalar için sağlam bir temel oluşturabilir ve yapay zeka destekli dental teşhis sistemlerinde daha fazla ilerlemeyi teşvik edebilir.