דרמטופתולוגיה ובינה מלאכותית 2026: כשהמיקרוסקופ פוגש למידה עמוקה
מסריקת שקופית מלאה ועד מודלי יסוד: סקירה של המאמרים המאומתים בשטח, עם דגש על הסיפור הישראלי של חברת Ibex Medical Analytics
AI in Dermatopathology 2026: From Whole Slide Imaging to Foundation Models
🎯 בקצרה: על מה מדובר?
💡 מה חייבים לזכור מהמאמר הזה
🖥️ WSI: התשתית הטכנולוגית
מאז 2017 מעבדות פתולוגיה גדולות בעולם עברו לעבודה דיגיטלית מלאה, ביניהן Memorial Sloan Kettering, Mayo Clinic ו-Mass General Brigham. בישראל, מעבדות פתולוגיה גדולות כמו מכבי ואסותא אשדוד הטמיעו סריקה דיגיטלית כסטנדרט.
ה-WSI הוא יותר מהתקדמות טכנולוגית. הוא תנאי מקדים ל-AI: בלי שקופית דיגיטלית, אין מה להזין למודל. הוא גם פותח את הדלת לטלפתולוגיה (פתולוג מומחה למלנומה בתל אביב יכול לקרוא שקופית מבוסטון), ומגדיל בקנה מידה אקספוננציאלי את כמות נתוני האימון הזמינים: ממאות אלפי שקופיות ב-2020 למיליונים ב-2025.
🧬 מ-CNN למודלי יסוד: התפתחות הלמידה העמוקה
ב-2019 הגיעה הקפיצה לפתולוגיה אמיתית. Campanella ועמיתיו ב-Memorial Sloan Kettering פרסמו ב-Nature Medicine את העבודה החלוצית על computational pathology ברמה קלינית, באמצעות שיטת Multiple Instance Learning (MIL). הם אימנו את המודל על 44,732 שקופיות מ-15,187 מטופלים, ללא תיוג ידני של אזורים, רק עם האבחנה הסופית כתווית. התוצאה: AUC מעל 0.98 לזיהוי כמה סוגי סרטן, כולל BCC. התובנה הקריטית הייתה ש-MIL מבטלת את הצורך בתיוג ידני, שהיה הצוואר-בקבוק העיקרי בתחום.
באותה שנה פרסמו Hekler ועמיתיו בהיידלברג, ב-European Journal of Cancer, את מחקר ההשוואה הישירה הראשון בין CNN ל-11 פתולוגים על חתכי מלנומה היסטולוגיים. ה-CNN הגיע ל-68% דיוק, הפתולוגים ל-59% (p=0.016). מאמר נוסף של אותה קבוצה (Hekler 2019b) הראה שהקונקורדנציה של ה-CNN עם פתולוג רפרנס הייתה דומה לקונקורדנציה בין פתולוגים שונים.
הקפיצה האחרונה הגיעה ב-2024 עם מודלי היסוד (Foundation Models), מודלים גדולים שאומנו מראש על כמויות עצומות של נתונים. UNI מהרווארד (Chen, Nature Medicine 2024) הוא הדוגמה המובילה. במקום לאמן מודל ייעודי לכל משימה, ניתן לקחת את UNI ולכוונן אותו (fine-tuning) למשימה ספציפית, למשל הבחנה בין Spitz למלנומה, עם הרבה פחות נתונים.
🏢 השחקנים: Paige, Ibex (הישראלית) ו-PathAI
השנייה היא Ibex Medical Analytics, והיא הסיפור הישראלי. החברה נוסדה ב-2016 בתל אביב על ידי Joseph Mossel ו-Chaim Linhart, ופיתחה את פלטפורמת Galen. המאמר המכונן של הצוות (Pantanowitz, Lancet Digital Health 2020) הציג את Galen Prostate, מערכת AI שמשמשת בזמן אמת כקורא שני במעבדות, עם AUC חיצוני של 0.991. החדשנות האמיתית לא הייתה רק במספרים, אלא במודל הפריסה: זוהי הפעם הראשונה שאלגוריתם פתולוגיה נפרס באופן רוטיני קליני ולא רק במסגרת ניסוי. המערכת פועלת כיום במכבי שירותי בריאות ובאסותא אשדוד. ב-2022 פרסמה Ibex את Galen Breast (Sandbank, npj Breast Cancer): AUC 0.99 לסרטן שד פולשני ו-0.98 ל-DCIS. ב-2024 הצטרף Galen HER2 (Krishnamurthy, JCO Precision Oncology), אלגוריתם להערכת ביטוי HER2 ב-IHC, עם דיוק כולל של 92.1%, רלוונטי במיוחד להבחנה הקריטית בין HER2 0 ל-HER2 1+. מודול ייעודי לדרמטופתולוגיה טרם פורסם במאמר peer-reviewed.
השלישית היא PathAI מבוסטון, שמתמקדת בעיקר בפתולוגיה של הכבד ובאונקולוגיה כללית, ומובילה שותפויות אקדמיות נרחבות. גם כאן לא פורסם מאמר ייעודי לדרמטופתולוגיה.
📊 ביצועים בדרמטופתולוגיה: המספרים האמיתיים
ראשית, BCC. Geijs ועמיתיו פרסמו ב-Medical Image Analysis (2024) אחד המחקרים הגדולים שבוצעו בנושא. הם אימנו את המודל על 5,147 שקופיות, ובחנו אותו על סט פנימי וסט חיצוני. התוצאות: AUC 0.997 בסט הפנימי, 0.993 בסט החיצוני, וביצוע השווה לשני פתולוגים שהיו רפרנס. בסיווג לתת-סוגי BCC (סיכון גבוה מול נמוך): AUC 0.931 פנימי, 0.883 חיצוני. נתונים אלה מציבים את BCC כתרחיש הטוב ביותר לאוטומציה בדרמטופתולוגיה.
שנית, חתכים קפואים ב-Mohs. van Zon ועמיתיו פרסמו ב-Experimental Dermatology (2021) אלגוריתם לזיהוי BCC בחתכים קפואים, מאתגר יותר בגלל איכות החתך הקפוא לעומת חתך פרפין. הביצועים: Dice 0.66 בסגמנטציה, AUC 0.90 ברמת שקופית. Davis ועמיתיו פרסמו ב-Experimental Dermatology (2024) אלגוריתם ל-SCC בחתכים קפואים. התוצאות תלויות בדרגת ההתמיינות: SCC לא ממוין נקרא היטב, אבל SCC ממוין היטב קשה להבחין מאפידרמיס תקין.
שלישית, מלנומה. Sauter ועמיתיו פרסמו ב-Computers in Biology and Medicine (2023) סקירה שיטתית של 54 מחקרים על AI במלנומה דרמטופתולוגית, וניתחו את האתגרים הטכניים: ארטיפקטים, עיבוד תמונות gigapixel, ניהול הגדלה. הקבוצה של Brinker (Hekler 2019) הראתה יתרון על פתולוגים בחתכי תמונה. אבל במחקרים אחרים AI טעה במקרים של desmoplastic melanoma.
רביעית, גידולי Spitz. האתגר הקלאסי של דרמטופתולוגיה. Lucassen ועמיתיו פרסמו ב-Journal of Pathology Informatics (2026) מחקר על AI להבחנה בין Spitz למלנומה קונבנציונלית: AUROC 0.95 (95% CI 0.92-0.98), accuracy 0.86, על 393 Spitz ו-379 מלנומות קונבנציונליות. במחקר reader עם 4 פתולוגים מנוסים, ה-AI היה טוב יותר. Mosquera-Zamudio ועמיתיהם פרסמו ב-Scientific Data (2023) את SOPHIE, מאגר ציבורי של גידולי Spitz, וב-Histopathology (2024) ניתוח קונקורדנציה: kappa 0.87 להבחנה בין Spitz nevus למלנומה, אבל רק 0.66 ל-Atypical Spitz Tumors (AST) מול Spitz Melanoma. זהו אזור האפור שגם פתולוגים מומחים מתקשים בו.
חמישית, Lentigo Maligna. Löper ועמיתיו פרסמו ב-Dermatopathology (Basel) (2025) אלגוריתם להערכת שולי כריתה ב-LM באמצעות מיפוי צפיפות מלנוציטים על שקופיות Sox-10. ביצועים: רגישות 87.84%, סגוליות 72.82%, AUC 0.818 על 177 שקופיות. השימוש המעניין: heat map תלת-צבעי אוטומטי שמאפשר לפתולוג סריקה מהירה של השוליים.
👥 AI כקורא שני: התהליך הקליני ב-2026
מכבי שירותי בריאות יישמה את הגישה הזו עם Ibex Galen Prostate החל מ-2020. כל ביופסיה של ערמונית עוברת אוטומטית דרך הפלטפורמה במקביל לקריאת הפתולוג. ב-Lancet Digital Health (Pantanowitz 2020) דווח AUC חיצוני של 0.991, וגם זוהו מקרי אדנוקרצינומה שהפתולוג הראשון לא דיווח עליהם בקריאה ראשונית. מקרים אלה היו מתגלים בסופו של דבר גם בלי AI, אבל מאוחר יותר בתהליך.
Eloy ועמיתיו פרסמו ב-Virchows Archiv (2023) מחקר 'לפני-אחרי' מובהק: 4 פתולוגים, 105 ביופסיות ערמונית, שנקראו פעם בלי AI ופעם עם Paige Prostate. התוצאות: הדיוק נשמר ב-95%, אבל זמן הקריאה ירד ב-20%, בקשות ל-IHC ירדו ב-20%, בקשות לחוות דעת שנייה ירדו ב-40%, ואבחנות של Atypical Small Acinar Proliferation (ASAP) ירדו ב-30%. כל אלה משמעותיים: IHC, חוות דעת שנייה ו-ASAP מובילים לעלויות נוספות ולעיכוב באבחנה.
Pantanowitz ועמיתיו פרסמו ב-Diagnostic Pathology (2020) מחקר במשימה אחרת אבל מאלפת: ספירת מיטוזות בסרטן שד. 24 קוראים, AI כסיוע. הדיוק עלה בכל רמות הניסיון, וחיסכון של 27.8% בזמן. רבים מהקוראים ציינו אחר כך שהם לא רוצים לחזור לעבוד בלי סיוע AI לספירת מיטוזות.
Jia ועמיתיו פרסמו ב-Computers in Biology and Medicine (2025) את פרויקט ARTICULATE PRO, פריסה פרוספקטיבית של Paige Prostate ב-NHS הבריטי, עם מסגרת hazard analysis ומעקב post-market שיטתי. זהו מודל לגישה זהירה: לא רק אישור ה-AI ושליחתו לקליניקה, אלא גם מעקב שיטתי אחר ביצועיו בעולם האמיתי.
⚠️ המגבלות: היכן AI עדיין מתקשה
ראשונה: גידולי Spitz אטיפיים. Mosquera-Zamudio ועמיתיו פרסמו ב-Histopathology (2024) ניתוח של אלגוריתם logistic regression machine-learning על 122 גידולי Spitz מ-4 מדינות. בהבחנה בין Spitz nevus למלנומה: kappa 0.87, accuracy 0.91, ביצוע טוב. אבל בהבחנה בין Atypical Spitz Tumors למלנומת Spitz: ה-ML הגיע רק ל-kappa 0.66 ול-accuracy 0.85, ביצוע בינוני. הקטגוריה עצמה גבולית מורפולוגית, וגם בין פתולוגים מומחים מדווחת על חוסר הסכמה משמעותי. אי אפשר לפתור באמצעות AI בעיה שאין לה אמת מוסכמת ברורה ברמה המולקולרית.
שנייה: מעבר בין מעבדות (Out-of-Distribution). Sikaroudi ועמיתיו פרסמו ב-Scientific Reports (2023) ניתוח שיטתי של ביצועי מודלים שאומנו במעבדה אחת כשהם נבחנים על שקופיות ממעבדה אחרת. ירידה של 10-20% ב-accuracy היא ערך החציון. הסיבות: שונות בפרוטוקול הצביעה, סורקים שונים, ואיכות חתך משתנה. הבעיה אינה נקודתית אלא מערכתית. כל מעבדה חייבת לבצע אימות מקומי של ה-AI על שקופיות שלה, ולא להניח שמה שעובד ב-Memorial Sloan Kettering יעבוד באותה רמה במכבי.
שלישית: שונות בצביעה. Marini ועמיתיו פרסמו ב-Journal of Pathology Informatics (2023) ניתוח של מעל 2 מיליון וריאציות של צביעת H&E ומשמעותן עבור האלגוריתמים. הפתרון הנוכחי הוא color augmentation: חשיפת המודל באימון לכל הצבעים האפשריים. השיטה עוזרת, אבל לא פותרת לחלוטין. שונות בעובי החתך, גיל הריאגנטים, ופרוטוקול הסורק נותרו משתנים שמטלטלים את הביצועים.
רביעית, ופחות מדוברת אבל חשובה: Desmoplastic Melanoma. סוג של מלנומה עם תאי spindle דלים בפיגמנט על רקע סטרומה פיברופלסטית. קל לפספס במיקרוסקופ, וגם AI מתקשה. הסיבה: תאי spindle בעור קיימים לא רק במלנומה, אלא גם בצלקות, נוירופיברומה ודרמטופיברומה. בלי immunohistochemistry (S100, SOX10), קשה לקבוע. בסקירה השיטתית של Mosquera-Zamudio ב-Cancers (2022, על 28 מחקרים במלנומה AI) המקרה הזה מוזכר כנקודה עיוורת מרכזית.
Desmoplastic Melanoma: דפוס spindle cell דל בפיגמנט שמתבלבל עם צלקת, נוירופיברומה ועוד. גם ל-AI קשה. נדרשת IHC (S100, SOX10) להבחנה. אל תסתמך כאן על AI לבד.
🔮 רגולציה ועתיד: חמש שנים קדימה
בישראל, משרד הבריאות מאמץ הנחיות שחלקן מתואמות עם ה-FDA. חברת Ibex עוברת תהליכי אימות מקומיים בכל מערך בריאות שמטמיע אותה.
הצעד הבא הוא מודלי יסוד רב-מודאליים. הקבוצה של Faisal Mahmood בהרווארד פרסמה ב-Nature Medicine (2024) את UNI, foundation model לפתולוגיה שאומן על למעלה מ-100 מיליון תמונות מ-100,000 שקופיות ב-20 רקמות שונות. הצעד הבא: מודלים שמשלבים תמונה היסטופתולוגית עם תמונה קלינית, דרמוסקופית, נתוני RNA ומידע קליני. כך, האבחנה לא תהיה רק 'BCC' מהשקופית, אלא 'BCC nodular בלחי של מטופל בן 75 עם CIN, סיכון גבוה לחזרה, מומלץ Mohs'. זוהי הראייה לקראת 2030.
ולסיכום, Bulten ועמיתיו פרסמו ב-Nature Medicine (2022) את תוצאות אתגר PANDA: תחרות אלגוריתמית לדירוג Gleason של ערמונית, עם נתונים משוודיה, הולנד, ארה״ב, בלגיה ועוד. החדשנות לא הייתה רק במודל המנצח שהגיע לרמת פתולוג, אלא בעצם המודל הראשון של אימות פרוספקטיבי בינלאומי בקנה מידה כזה. ה-FDA רואה את זה כסטנדרט שצריך להפוך לנורמה באישורים העתידיים.
שורה תחתונה
ב-2026 הדרמטופתולוגיה עוברת מהפכה דיגיטלית שקטה. סריקת WSI היא הסטנדרט. אלגוריתמי AI מאושרים על ידי ה-FDA (Paige Prostate משנת 2021), פרוסים קלינית כקורא שני בזמן אמת (Ibex במכבי), ומגיעים לרמת ביצועים קלינית בדרמטופתולוגיה: AUC 0.997 ל-BCC (Geijs 2024), AUROC 0.95 ל-Spitz מול מלנומה (Lucassen 2026), ושיפור של 20-40% ביעילות התהליך (Eloy 2023). אבל המגבלות אמיתיות: Atypical Spitz Tumors נותרים אתגר (kappa 0.66), מעבר בין מעבדות דורש אימות מקומי, ושונות בצביעה היא עקב אכילס שדורש color augmentation שיטתי. לדרמטולוג ב-2026: ה-AI אינו תחליף לפתולוג, אלא קורא שני שמשפר את האבחנה ומקצר זמני המתנה. החדשות הטובות: זה כבר קורה בישראל.
אופק 2030: מודלי יסוד רב-מודאליים שמשלבים היסטופתולוגיה, תמונה קלינית, דרמוסקופיה ונתוני RNA במודל אחד. הדוח הפתולוגי יכלול לא רק אבחנה, אלא גם תחזית פרוגנוסטית מבוססת multi-omics, המלצת טיפול ראשונה מבוססת ראיות, ותמיכה בקבלת החלטות במקרים גבוליים.
📋 פרטי מקור ומחבר
מאת: ד"ר יהונתן קפלן
מומחה ברפואת עור ומין | מנתח מוז (FACMS)
📚 מקורות מאומתים (25):
- Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, Thrun S “Dermatologist-level classification of skin cancer with deep neural networks” Nature. 2017;542(7639):115-118.PMID: 28117445DOI
- Campanella G, Hanna MG, Geneslaw L, Miraflor A, Werneck Krauss Silva V, Busam KJ, Brogi E, Reuter VE, Klimstra DS, Fuchs TJ “Clinical-grade computational pathology using weakly supervised deep learning on whole slide images” Nat Med. 2019;25(8):1301-1309.PMID: 31308507DOI
- Hekler A, Utikal JS, Enk AH, Solass W, Schmitt M, et al. Brinker TJ “Deep learning outperformed 11 pathologists in the classification of histopathological melanoma images” Eur J Cancer. 2019;118:91-96.PMID: 31325876DOI
- Mukhopadhyay S, Feldman MD, Abels E, Ashfaq R, Beltaifa S, et al. Taylor CR “Whole Slide Imaging Versus Microscopy for Primary Diagnosis in Surgical Pathology: A Multicenter Blinded Randomized Noninferiority Study of 1992 Cases (Pivotal Study)” Am J Surg Pathol. 2018;42(1):39-52.PMID: 28961557DOI
- Chen RJ, Ding T, Lu MY, Williamson DFK, Jaume G, et al. Mahmood F “Towards a general-purpose foundation model for computational pathology” Nat Med. 2024;30(3):850-862.PMID: 38504018DOI
- Sauter D, Lodde G, Nensa F, Schadendorf D, Livingstone E, Kukuk M “Deep learning in computational dermatopathology of melanoma: A technical systematic literature review” Comput Biol Med. 2023;163:107083.PMID: 37315382DOI
- Raciti P, Sue J, Retamero JA, Ceballos R, Godrich R, et al. Fuchs TJ “Clinical Validation of Artificial Intelligence-Augmented Pathology Diagnosis Demonstrates Significant Gains in Diagnostic Accuracy in Prostate Cancer Detection” Arch Pathol Lab Med. 2023;147(10):1178-1185.PMID: 36538386DOI
- Pantanowitz L, Quiroga-Garza GM, Bien L, Heled R, Laifenfeld D, Linhart C, Sandbank J, et al. Dhir R “An artificial intelligence algorithm for prostate cancer diagnosis in whole slide images of core needle biopsies: a blinded clinical validation and deployment study” Lancet Digit Health. 2020;2(8):e407-e416.PMID: 33328045DOI
- Sandbank J, Bataillon G, Nudelman A, Krasnitsky I, Mikulinsky R, Bien L, et al. Vincent-Salomon A “Validation and real-world clinical application of an artificial intelligence algorithm for breast cancer detection in biopsies” NPJ Breast Cancer. 2022;8(1):129.PMID: 36473870DOI
- Krishnamurthy S, Schnitt SJ, Vincent-Salomon A, Canas-Marques R, Colon E, et al. Vecsler M “Fully Automated Artificial Intelligence Solution for Human Epidermal Growth Factor Receptor 2 Immunohistochemistry Scoring in Breast Cancer: A Multireader Study” JCO Precis Oncol. 2024;8:e2400353.PMID: 39393036DOI
- Geijs DJ, Dooper S, Aswolinskiy W, Hillen LM, Amir AL, Litjens G “Detection and subtyping of basal cell carcinoma in whole-slide histopathology using weakly-supervised learning” Med Image Anal. 2024;93:103063.PMID: 38194735DOI
- van Zon MCM, van der Waa JD, Veta M, Krekels GAM “Whole-slide margin control through deep learning in Mohs micrographic surgery for basal cell carcinoma” Exp Dermatol. 2021;30(5):733-738.PMID: 33656186DOI
- Davis MJ, Srinivasan G, Chacko R, Chen S, Suvarna A, et al. Levy JJ “A deep learning algorithm to detect cutaneous squamous cell carcinoma on frozen sections in Mohs micrographic surgery: A retrospective assessment” Exp Dermatol. 2024;33(1):e14949.PMID: 37864429DOI
- Lucassen RT, Romers M, Ebbelaar CF, Najem AN, Hayes DP, et al. Blokx WAM “Artificial intelligence-based classification of Spitz tumors” J Pathol Inform. 2026;21:100650.PMID: 41847156DOI
- Löper R, Abels L, Otero Baguer D, Bremmer F, Schön MP, Mitteldorf C “Artificial Intelligence for Lentigo Maligna: Automated Margin Assessment via Sox-10-Based Melanocyte Density Mapping” Dermatopathology (Basel). 2025;13(1):e2025001.PMID: 41562710DOI
- Mosquera-Zamudio A, Launet L, Colomer A, Wiedemeyer K, López-Takegami JC, et al. Monteagudo C “Histological interpretation of spitzoid tumours: an extensive machine learning-based concordance analysis for improving decision making” Histopathology. 2024;85(1):155-170.PMID: 38606989DOI
- Mosquera-Zamudio A, Launet L, Tabatabaei Z, Parra-Medina R, Colomer A, et al. Naranjo V “Deep Learning for Skin Melanocytic Tumors in Whole-Slide Images: A Systematic Review” Cancers (Basel). 2022;15(1):42.PMID: 36612037DOI
- Sikaroudi M, Hosseini M, Gonzalez R, Rahnamayan S, Tizhoosh HR “Generalization of vision pre-trained models for histopathology” Sci Rep. 2023;13(1):6065.PMID: 37055519DOI
- Marini N, Otalora S, Wodzinski M, Tomassini S, Dragoni AF, et al. Atzori M “Data-driven color augmentation for H&E stained images in computational pathology” J Pathol Inform. 2023;14:100183.PMID: 36687531DOI
- Eloy C, Marques A, Pinto J, Pinheiro J, Campelos S, Curado M, Vale J, Polónia A “Artificial intelligence-assisted cancer diagnosis improves the efficiency of pathologists in prostatic biopsies” Virchows Arch. 2023;482(3):595-604.PMID: 36809483DOI
- Pantanowitz L, Hartman D, Qi Y, Cho EY, Suh B, Paeng K, et al. Cho SY “Accuracy and efficiency of an artificial intelligence tool when counting breast mitoses” Diagn Pathol. 2020;15(1):80.PMID: 32622359DOI
- Jia Y, Verrill C, White K, Dolton M, Horton M, Jafferji M, Habli I “A deployment safety case for AI-assisted prostate cancer diagnosis” Comput Biol Med. 2025;192(Pt B):110237.PMID: 40345136DOI
- Pantanowitz L, Hanna M, Pantanowitz J, Lennerz J, Henricks WH, Shen P, Quinn B, Bennet S, Rashidi HH “Regulatory Aspects of Artificial Intelligence and Machine Learning” Mod Pathol. 2024;37(12):100609.PMID: 39260776DOI
- Bulten W, Kartasalo K, Chen PC, Ström P, Pinckaers H, et al. Eklund M “Artificial intelligence for diagnosis and Gleason grading of prostate cancer: the PANDA challenge” Nat Med. 2022;28(1):154-163.PMID: 35027755DOI
- Lalmalani RM, Lim CXY, Oh CC “Artificial intelligence in dermatopathology: a systematic review” Clin Exp Dermatol. 2025;50(2):251-259.PMID: 39226138DOI
הערת עריכה: תוכן זה נכתב ונערך על ידי ד"ר יהונתן קפלן ומבוסס על מקורות אקדמיים מאומתים.
אין להסתמך על תוכן זה ללא קריאת המקורות המלאים.