Amaç: Tüm dünya Aralık 2019'dan bu yana SARS-CoV-2 virüsü ile başa çıkmaya çalışmaktadır. Hastalığın erken belirtileri, soğuk algınlığı ve grip gibi diğer yaygın durumlarla örtüştüğünden, hekimler için erken tanının önemi büyüktür. Bu çalışmada, genel kullanıma açık anonim bir veri seti kullanılarak, rutin kan testleri sonuçları üzerinden Yeni Koronavirüs Hastalığı (COVID-19) tanısının (pozitif/negatif) makine öğrenmesi algoritmaları yardımıyla tahmin edilmesine yönelik bir mobil uygulama geliştirilmesi amaçlanmaktadır.
Gereç ve Yöntem: Veri setinde yer alan, kayıp gözlem, sınıf dengesizliği, aykırı gözlem ve ilgisiz değişken problemleri giderildikten sonra makine öğrenmesi yöntemlerinin sınıflandırma performansları test edilmiş, ardından uygun değişkenlerle COVID-19 tanısı için lojistik regresyon modeli kurulmuştur. Bu model kullanılarak makine öğrenmesi tabanlı mobil uygulaması tasarlanmıştır.
Bulgular: Tanı koymada en iyi sonuç veren değişkenler, eozinofil, lökosit, trombosit, monosit, kırmızı kan hücresi, bazofildir. Veri ön işleme problemleri giderildikten sonra kullanılan algoritmaların sınıflandırma performansları, ham verideki performans değerlerine göre oldukça yükselmiştir.
Sonuç: Geliştirilen mobil uygulama ile rutin kan testi sonuçları kullanılarak, hızlı ve kolay bir şekilde Covid-19 tanısı tahmininde bulunulması mümkündür.
Covid-19 makine öğrenmesi yöntemleri rutin kan testi mobil uygulama tanı
Objective: The whole world has been dealing with the SARS-CoV-2 virus since December 2019. Early diagnosis is of great importance for physicians, as the early symptoms of the disease overlap with other common conditions such as cold and flu. In this study, we aimed to develop a mobile application to diagnose COVID-19 with machine learning algorithms that use anonymized publicly available routine blood tests results.
Materials and Methods: After eliminating the missing observation, class imbalance, outlier observation, and unrelated variable problems in the data set, the classification performances of machine learning methods were tested, and then a logistic regression model was established for the detection of COVID-19 with appropriate variables. Using this model, a machine learning-based mobile application has been designed.
Results: The variables that gave the best results in diagnosis were eosinophils, leukocytes, thrombocytes, monocytes, red blood cells, and basophils. After solving the data pre-processing problems, the classification performance of the algorithms used has increased considerably compared to the performance values in the raw data.
Conclusion: With the developed mobile application, it is possible to estimate the diagnosis of Covid-19 quickly and easily by using routine blood test results.
Covid-19 machine learning methods routine blood test mobile application diagnosis