الصوت التنفسي باستخدام التعلم العميق

تصنيف الأصوات التنفسية هو تطبيق مهم في مجال التشخيص الطبي. إن تحديد وتصنيف أنواع مختلفة من الأصوات التنفسية، مثل الصفير أو الطقطقة أو غيرها من أصوات الرئة غير الطبيعية، يمكن أن يساعد في تشخيص أمراض الجهاز التنفسي مثل الربو والالتهاب الرئوي ومرض الانسداد الرئوي المزمن (COPD). في هذا التقرير، نستكشف كل من أساليب التعلم العميق والتعلم الآلي لتصنيف الأصوات التنفسية تلقائيًا باستخدام مجموعة بيانات مُعلقة. الهدف الرئيسي من هذا المشروع هو بناء نماذج يمكنها تصنيف الأصوات بدقة إلى فئات مثل "طبيعية" أو "صفير" أو "طقطقة" أو "كلاهما" (صفير وطقطقة).
وصف البيانات
الأصوات التنفسية هي مؤشرات مهمة لصحة الجهاز التنفسي واضطراباته. الصوت الصادر عندما يتنفس الشخص يرتبط بشكل مباشر بحركة الهواء والتغيرات داخل أنسجة الرئة وموضع الإفرازات داخل الرئة. صوت الصفير، على سبيل المثال، هو علامة شائعة على أن المريض يعاني من مرض انسداد مجرى الهواء مثل الربو أو مرض الانسداد الرئوي المزمن (COPD). يمكن تسجيل هذه الأصوات باستخدام سماعة الطبيب الرقمية وتقنيات التسجيل الأخرى. تفتح هذه البيانات الرقمية إمكانية استخدام التعلم الآلي لتشخيص اضطرابات الجهاز التنفسي تلقائيًا مثل الربو والالتهاب الرئوي والتهاب القصيبات الهوائية، على سبيل المثال لا الحصر. تم إنشاء قاعدة بيانات الأصوات التنفسية بواسطة فريقين بحثيين في البرتغال واليونان. وهي تتضمن 920 تسجيلاً معلقًا بأطوال مختلفة - من 10 ثوانٍ إلى 90 ثانية. تم أخذ هذه التسجيلات من 126 مريضًا. يوجد إجمالي 5.5 ساعة من التسجيلات التي تحتوي على 6898 دورة تنفسية - 1864 تحتوي على أصوات طقطقة، و886 تحتوي على أصوات صفير و506 تحتوي على أصوات طقطقة وأزيز. تتضمن البيانات أصوات تنفسية نظيفة بالإضافة إلى تسجيلات صاخبة تحاكي ظروف الحياة الواقعية. يشمل المرضى جميع الفئات العمرية - الأطفال والبالغين وكبار السن. تتضمن مجموعة بيانات Kaggle هذه: 920 ملف صوتي بصيغة wav 920 ملف توضيحي بصيغة txt ملف نصي يسرد التشخيص لكل مريض ملف نصي يشرح تنسيق تسمية الملف ملف نصي يسرد 91 اسمًا (filename_differences.txt) ملف نصي يحتوي على معلومات ديموغرافية لكل مريض
النتائج
تُظهِر النتائج فعالية نماذج التعلم العميق، وخاصة CNN، لتصنيف الأصوات التنفسية. من خلال تحسين المعلمات الفائقة باستخدام Spider Wasp Optimization (SWO) وImproved Spider Wasp Optimization (ISWO)، تحسن أداء النموذج بشكل كبير، وحقق نتائج تصنيف شبه مثالية. دقة CNN الأولية: 94% بعد تحسين SWO: 97% بعد تحسين ISWO: 100%