W miarę rozwoju technologii, analiza obrazów rentgenowskich za pomocą algorytmów uczenia głębokiego (deep learning) oraz transfer learning staje się coraz bardziej zaawansowana i precyzyjna. Dzięki zastosowaniu tych technik, badania obrazowe mogą być przeprowadzone szybciej, z większą skutecznością i obiektywnością, co z kolei przekłada się na bardziej wiarygodne diagnozy.
Zadaniem, przed którym stanęliśmy, było analizowanie i klasyfikowanie obrazów rentgenowskich. Zbiór danych składał się z około 450 obrazów, reprezentujących trzy różne rodzaje prześwietleń klatki piersiowej: u osoby zdrowej, pokazujące obecność COVID-19, oraz ukazujące zapalenie płuc.
Praca z obrazami medycznymi, takimi jak zdjęcia rentgenowskie klatki piersiowej, przynosi pewne wyzwania. Proces przekształcania surowego obrazu w model predykcyjny zawiera trzy kluczowe kroki:
Augmentacja to jakby tworzenie "alternatywnego wszechświata" dla naszych obrazów. Przykładowo, jeśli mamy obraz płuc, augmentacja może stworzyć wiele różnych wersji tego obrazu przez jego obracanie, powiększanie czy przechylanie. Proces ten nie tylko zwiększa ilość danych treningowych, ale także pomaga modelowi lepiej zrozumieć różnorodność przypadków przez co model będzie lepiej generalizować.
Skalowanie to proces, który pozwala zmieniać wartości pikseli na obrazie, dostosowując je do określonego zakresu. Bardzo często, wartości te są zmniejszane do zakresu od 0 do 1. Dlaczego? Ponieważ małe, standaryzowane wartości są łatwiejsze do przetwarzania przez algorytmy uczenia maszynowego, pomagając modelom pracować sprawniej i dokładniej. Inaczej mówiąc, skalowanie pomaga modelom "rozumieć" obrazy bez zostawania przytłoczonym przez zbyt wysokie liczby reprezentujące kolory.
Następnie, obrazy przechodzą proces, który można porównać do tłumaczenia języka. Aby komputer był w stanie "rozumieć" i przetwarzać obrazy, zmieniamy je w specjalny format danych, nazywany tensorami. Można to sobie wyobrazić tak: obraz, który widzimy jako zestaw kolorów i kształtów, komputer widzi jako zestaw liczb. Każdy piksel obrazu to pewna liczba, która opisuje, jak intensywny jest kolor tego piksela. Przekształcamy obraz w tabelkę tych liczb, czyli w tensor, aby komputer mógł łatwo przetworzyć te informacje i nauczyć się rozpoznawania wzorów, które mu wskażemy.
W projektowanym rozwiązaniu do diagnozowania stanu płuc na obrazach RTG, przetestowaliśmy cztery modele głębokiego uczenia: ResNet, Inception, MobileNetV2 oraz VGG. Choć każda z architektur prezentuje unikatowe właściwości i mogą być odpowiednie w różnych kontekstach, to jednak MobileNetV2 wyróżnił się w naszych testach, osiągając najwyższą skuteczność w klasyfikacji obrazów na kategorie: zdrowe płuca, COVID-19 oraz zapalenie płuc. Benchmarking, czyli proces porównawczy, pozwolił nam obiektywnie ocenić wydajność każdego z modeli i wybrać najbardziej efektywną architekturę dla naszego zadania.
Nasz model diagnostyczny osiągnął ogólną dokładność 96%, prezentując solidne umiejętności w identyfikowaniu stanu płuc na obrazach rentgenowskich. W szczególności, zaimponował dokładnością 100% w wykrywaniu COVID-19 oraz zapalenia płuc. Chociaż model precyzyjnie identyfikował także zdrowe płuca w 14 z 16 przypadków, dwukrotnie popełnił błąd, fałszywie klasyfikując je jako normalne. Te nieliczne pomyłki są cenną lekcją i punktem wyjścia do dalszej optymalizacji modelu, zwiększając jego wartość i niezawodność w praktyce klinicznej.
- Przekątna od strony lewej górnej do prawej dolnej pokazuje poprawne prognozy
- Wartości poza przekątną pokazują błedne prognozy
Ten projekt pokazuje, jak technologie deep learning mogą być skutecznie wykorzystane do analizy danych medycznych i pomagać w diagnostyce chorób. Takie podejście może przynieść znaczne korzyści dla placówek medycznych, pacjentów i całego społeczeństwa, przyspieszając proces diagnostyki i zwiększając jej dokładność. Jeżeli jesteś zainteresowany, jak nasze rozwiązania oparte na AI mogą pomóc w Twojej działalności, skontaktuj się z nami!
Skontaktuj się i zacznij podejmować skuteczniejsze decyzje na podstawie analizy danych