סקירה עצמאית | DermAI · 2026ד״ר יהונתן קפלן | KaplanClinic.co.il

דרמטופתולוגיה ובינה מלאכותית 2026: כשהמיקרוסקופ פוגש למידה עמוקה
מסריקת שקופית מלאה ועד מודלי יסוד: סקירה של המאמרים המאומתים בשטח, עם דגש על הסיפור הישראלי של חברת Ibex Medical Analytics

AI in Dermatopathology 2026: From Whole Slide Imaging to Foundation Models

✍️ ד״ר יהונתן קפלן

📋 תמונה רחבהדרמטופתולוגיה ובינה מלאכותית 2026: כשהמיקרוסקופ פוגש למידה עמוקה

🎯 בקצרה: על מה מדובר?

בספטמבר 2021 אישר ה-FDA לראשונה אלגוריתם של בינה מלאכותית לאבחנת סרטן ערמונית בפתולוגיה. ארבע שנים אחר כך, אלגוריתם של החברה הישראלית Ibex Medical Analytics מנתח באופן שוטף ביופסיות במכבי שירותי בריאות ובאסותא אשדוד, כקורא שני בזמן אמת. ההתקדמות בדרמטופתולוגיה מרשימה: זיהוי BCC ברמה של AUC 0.997, הבחנה בין גידול Spitz למלנומה קונבנציונלית ב-AUROC 0.95, וביצועים טובים יותר מ-11 פתולוגים בהשוואות ישירות. אבל יש מגבלות שחייבים להכיר: גידולי Spitz אטיפיים נותרו אתגר (kappa 0.66 בלבד), הביצועים יורדים ב-10-20% במעבר בין מעבדות (out-of-distribution), ושונות בצביעת ה-H&E היא עקב אכילס מערכתי. הסקירה מציגה את הראיות המעודכנות, את השחקנים הבולטים בעולם ובארץ, ואת מה שדרמטולוג ישראלי צריך לדעת על המהפך שמגיע למיקרוסקופ.

🏛️

2021

שנת אישור FDA לאלגוריתם Paige Prostate (הראשון בפתולוגיה)

🔬

0.993

AUC לזיהוי BCC ב-Geijs 2024 (validation חיצוני)

🧬

0.95

AUROC ל-AI מול 4 פתולוגים בהבחנת Spitz מול מלנומה (Lucassen 2026)

📚

112

מאמרים שנכללו בסקירה השיטתית של Lalmalani 2025

🌐

100M+

תמונות באימון מודל UNI (foundation model לפתולוגיה)

💡 מה חייבים לזכור מהמאמר הזה

🏛️אישור FDA ראשון לאלגוריתם פתולוגיה היה Paige Prostate בספטמבר 2021. מודול ייעודי לדרמטופתולוגיה של Paige טרם פורסם בספרות מבוקרת.

🇮🇱Ibex Medical Analytics, חברה ישראלית מתל אביב, פרסמה ב-Lancet Digital Health (2020) את אימות אלגוריתם Galen Prostate (AUC 0.991). המערכת מוטמעת קלינית במכבי ובאסותא. מודול ייעודי לדרמטופתולוגיה טרם פורסם.

🔬ביצועי AI בדרמטופתולוגיה: AUC 0.997 לזיהוי BCC (Geijs 2024), AUROC 0.95 לאבחון Spitz מול מלנומה (Lucassen 2026), ויתרון סטטיסטי על 11 פתולוגים בקריאת חתכי מלנומה (Hekler 2019).

⚠️המגבלות המרכזיות: גידולי Spitz אטיפיים (kappa 0.66, Mosquera-Zamudio 2024), ירידת ביצועים במעבר בין מעבדות, ושונות בצביעה שדורשת color augmentation שיטתי.

🔮הצעד הבא: foundation models כמו UNI מהרווארד (Chen, Nature Medicine 2024), שאומנו על למעלה מ-100 מיליון תמונות ומאפשרים few-shot learning למשימות חדשות. בהמשך צפויים מודלים רב-מודאליים שמשלבים תמונה קלינית, דרמוסקופיה והיסטופתולוגיה.

🖥️ WSI: התשתית הטכנולוגית

בלב המהפכה עומדת הסריקה הדיגיטלית של השקופית הפתולוגית, שיטה שמוכרת בקיצור WSI (Whole Slide Imaging). השקופית כולה מצולמת בכל הגדלה, יוצרת קובץ בגודל gigapixel (לעיתים 100,000 על 100,000 פיקסלים), שאליו ניתן לגשת מכל מחשב ולעבד אותו באלגוריתמים. ב-2017 אישר ה-FDA לראשונה סורק WSI (Philips IntelliSite Pathology Solution) לשימוש באבחנה ראשונית, ולא רק לארכוב. האישור התבסס על מחקר non-inferiority נרחב שכלל 1,992 מקרים (Mukhopadhyay 2018), שבו שיעור ה-Major Discordance ב-WSI היה 4.9%, לעומת 4.6% במיקרוסקופיה הקונבנציונלית.

מאז 2017 מעבדות פתולוגיה גדולות בעולם עברו לעבודה דיגיטלית מלאה, ביניהן Memorial Sloan Kettering, Mayo Clinic ו-Mass General Brigham. בישראל, מעבדות פתולוגיה גדולות כמו מכבי ואסותא אשדוד הטמיעו סריקה דיגיטלית כסטנדרט.

ה-WSI הוא יותר מהתקדמות טכנולוגית. הוא תנאי מקדים ל-AI: בלי שקופית דיגיטלית, אין מה להזין למודל. הוא גם פותח את הדלת לטלפתולוגיה (פתולוג מומחה למלנומה בתל אביב יכול לקרוא שקופית מבוסטון), ומגדיל בקנה מידה אקספוננציאלי את כמות נתוני האימון הזמינים: ממאות אלפי שקופיות ב-2020 למיליונים ב-2025.

המחקר המרכזי של Mukhopadhyay (Am J Surg Pathol 2018) שעמד מאחורי האישור: 1,992 מקרים נקראו פעמיים, פעם דיגיטלית ופעם במיקרוסקופ. שיעור ה-Major Discordance Rate היה 4.9% ב-WSI לעומת 4.6% במיקרוסקופ, ללא הבדל קליני משמעותי. זה היה הצעד שאיפשר ל-WSI לעבור משלב המחקר לכלי קליני מאושר.

WSIFDAPhilips2017

Chen ועמיתיו פרסמו ב-Nature Medicine (2024) את UNI, מודל שאומן ב-self-supervised learning על למעלה מ-100 מיליון תמונות, מ-100,000 שקופיות ב-20 רקמות, סך הכל מעל 77 TB. UNI הוא הסטנדרט הנוכחי לפתולוגיה כללית, ובדרמטופתולוגיה הוא משמש כעמוד שדרה לרכיבי downstream, למשל המודל של Lucassen (2026) לסיווג Spitz. הצעד הבא הוא foundation models רב-מודאליים, שיוכלו לקבל בו-זמנית תמונה קלינית, דרמוסקופית ושקופית היסטופתולוגית.

Foundation ModelUNIHarvard2024

🧬 מ-CNN למודלי יסוד: התפתחות הלמידה העמוקה

הסיפור של AI בדרמטולוגיה התחיל ב-2017. אנדרה אסטבה ועמיתיו בסטנפורד פרסמו ב-Nature מאמר שיצר תהודה: רשת קונבולוציה (CNN) שאומנה על 129,450 תמונות קליניות של נגעי עור (2,032 אבחנות שונות) הגיעה לרמת ביצוע השווה ל-21 דרמטולוגים מוסמכים. שתי משימות הסיווג היו זיהוי קרצינומה קרטינוציטית מול keratosis seborrhoeica, ומלנומה ממאירה מול נבוס שפיר. המאמר התבסס על תמונה קלינית ולא על שקופית היסטולוגית, אבל היה הוכחת ההיתכנות הראשונה.

ב-2019 הגיעה הקפיצה לפתולוגיה אמיתית. Campanella ועמיתיו ב-Memorial Sloan Kettering פרסמו ב-Nature Medicine את העבודה החלוצית על computational pathology ברמה קלינית, באמצעות שיטת Multiple Instance Learning (MIL). הם אימנו את המודל על 44,732 שקופיות מ-15,187 מטופלים, ללא תיוג ידני של אזורים, רק עם האבחנה הסופית כתווית. התוצאה: AUC מעל 0.98 לזיהוי כמה סוגי סרטן, כולל BCC. התובנה הקריטית הייתה ש-MIL מבטלת את הצורך בתיוג ידני, שהיה הצוואר-בקבוק העיקרי בתחום.

באותה שנה פרסמו Hekler ועמיתיו בהיידלברג, ב-European Journal of Cancer, את מחקר ההשוואה הישירה הראשון בין CNN ל-11 פתולוגים על חתכי מלנומה היסטולוגיים. ה-CNN הגיע ל-68% דיוק, הפתולוגים ל-59% (p=0.016). מאמר נוסף של אותה קבוצה (Hekler 2019b) הראה שהקונקורדנציה של ה-CNN עם פתולוג רפרנס הייתה דומה לקונקורדנציה בין פתולוגים שונים.

הקפיצה האחרונה הגיעה ב-2024 עם מודלי היסוד (Foundation Models), מודלים גדולים שאומנו מראש על כמויות עצומות של נתונים. UNI מהרווארד (Chen, Nature Medicine 2024) הוא הדוגמה המובילה. במקום לאמן מודל ייעודי לכל משימה, ניתן לקחת את UNI ולכוונן אותו (fine-tuning) למשימה ספציפית, למשל הבחנה בין Spitz למלנומה, עם הרבה פחות נתונים.

המאמר שפתח את התחום. אסטבה ועמיתיו (בהם הדרמטופתולוג רוברטו נובואה) אימנו רשת קונבולוציה אחת על המאגר הקליני הגדול ביותר שאי פעם נבנה, פי מאה מהקודמים. המודל הגיע לרמת 21 דרמטולוגים מוסמכים בשתי משימות סיווג קריטיות: זיהוי קרצינומה קרטינוציטית מול keratosis seborrhoeica, וזיהוי מלנומה מול נבוס. המאמר התבסס על תמונה קלינית ולא היסטולוגית, אבל הוא נשאר נקודת המפנה של תחום AI בדרמטולוגיה.

EstevaStanfordNature2017

Campanella, Fuchs ועמיתיהם פרסמו פתרון לאתגר התיוג הידני. במקום לדרוש סימון ידני של כל אזור בכל שקופית (מאמץ של שנות עבודה לאלפי שקופיות), הם השתמשו ב-Multiple Instance Learning: המודל מקבל את השקופית השלמה ואת האבחנה הסופית בלבד, ולומד בעצמו אילו אזורים חשובים. AUC עבור BCC הגיע ל-0.989 בסט בדיקה חיצוני. זה היה הצעד שהפך את ה-AI בפתולוגיה מהוכחת היתכנות לכלי ברמה קלינית. Klaus Busam, דרמטופתולוג בכיר ב-MSK, היה שותף למאמר.

CampanellaMSKCCMILBCC

ב-695 חתכים היסטופתולוגיים של מלנומה ונבוס הראתה הקבוצה של Tobias Brinker בהיידלברג ש-CNN הגיע ל-68% דיוק לעומת 59% בממוצע ל-11 פתולוגים (p=0.016). חשוב להדגיש שהמחקר התבסס על מקטעי תמונה ולא על שקופיות מלאות, אבל היה הראיה הראשונה ליתרון של AI ספציפית בדרמטופתולוגיה של מלנומה.

HeklerHeidelbergMelanoma2019

🏢 השחקנים: Paige, Ibex (הישראלית) ו-PathAI

שלוש חברות מובילות את התחום הקליני של AI בפתולוגיה. הראשונה היא Paige (ניו יורק), שב-2021 קיבלה את אישור ה-De Novo הראשון אי-פעם של ה-FDA לאלגוריתם פתולוגיה: Paige Prostate. מאמר האימות הקליני (Raciti, Arch Pathol Lab Med 2023) הראה ש-18 פתולוגים שקראו 610 שקופיות שיפרו את הדיוק האבחנתי שלהם משמעותית כשנעזרו ב-Paige Prostate. למרות שהחברה הצהירה על מודול Paige Skin בפיתוח, מאמר אימות peer-reviewed עם נתונים ייעודיים לדרמטופתולוגיה טרם פורסם.

השנייה היא Ibex Medical Analytics, והיא הסיפור הישראלי. החברה נוסדה ב-2016 בתל אביב על ידי Joseph Mossel ו-Chaim Linhart, ופיתחה את פלטפורמת Galen. המאמר המכונן של הצוות (Pantanowitz, Lancet Digital Health 2020) הציג את Galen Prostate, מערכת AI שמשמשת בזמן אמת כקורא שני במעבדות, עם AUC חיצוני של 0.991. החדשנות האמיתית לא הייתה רק במספרים, אלא במודל הפריסה: זוהי הפעם הראשונה שאלגוריתם פתולוגיה נפרס באופן רוטיני קליני ולא רק במסגרת ניסוי. המערכת פועלת כיום במכבי שירותי בריאות ובאסותא אשדוד. ב-2022 פרסמה Ibex את Galen Breast (Sandbank, npj Breast Cancer): AUC 0.99 לסרטן שד פולשני ו-0.98 ל-DCIS. ב-2024 הצטרף Galen HER2 (Krishnamurthy, JCO Precision Oncology), אלגוריתם להערכת ביטוי HER2 ב-IHC, עם דיוק כולל של 92.1%, רלוונטי במיוחד להבחנה הקריטית בין HER2 0 ל-HER2 1+. מודול ייעודי לדרמטופתולוגיה טרם פורסם במאמר peer-reviewed.

השלישית היא PathAI מבוסטון, שמתמקדת בעיקר בפתולוגיה של הכבד ובאונקולוגיה כללית, ומובילה שותפויות אקדמיות נרחבות. גם כאן לא פורסם מאמר ייעודי לדרמטופתולוגיה.

מחקר האימות הקליני (Raciti, Arch Pathol Lab Med 2023) כלל 18 פתולוגים שקראו 610 שקופיות פעמיים, פעם ללא Paige ופעם בעזרתה. השיפור הבולט היה בזיהוי מוקדים קטנים של אדנוקרצינומה, בדיוק המקרים שפתולוגים מפסידים בלחץ עומס יומיומי. ה-FDA תיאר את האישור כאישור הראשון אי-פעם של מערכת פתולוגיה מבוססת AI לאבחנה ראשונית, והוא פתח את הדרך לכל הבאים אחריו.

PaigeFDAProstate2021

Pantanowitz ועמיתיו (בהם החוקרים הישראלים מ-Ibex: Linhart, Sandbank, Bien) פרסמו ב-Lancet Digital Health (2020) את האימות של Galen Prostate. AUC חיצוני: 0.991. אבל החדשנות האמיתית הייתה אחרת: זוהי הפעם הראשונה שאלגוריתם פתולוגיה הופעל באופן רוטיני קליני כקורא שני אוטומטי. במכבי שירותי בריאות, כל ביופסיה של ערמונית עוברת אוטומטית דרך Galen במקביל לקריאת הפתולוג. כאשר יש סתירה, הביופסיה עוברת בדיקה נוספת. Joseph Sandbank מאסותא רחובות הוא מנהל הפתולוגיה בפועל של המערכת.

IbexIsraelTel AvivMaccabi

Sandbank ועמיתיו פרסמו ב-npj Breast Cancer (2022) את אימות Galen Breast: AUC 0.99 לסרטן שד פולשני, 0.98 ל-DCIS. במחקר רב-מרכזי שכלל מוסדות מ-2 מדינות, האלגוריתם זיהה מקרי סרטן שהפתולוג פספס בקריאה ראשונית, דוגמה מובהקת לערך המוסף של 'second reader' AI. ב-2024 הצטרף Galen HER2, אלגוריתם להערכת immunohistochemistry של HER2, עם דיוק כולל של 92.1% (Krishnamurthy, JCO Precis Oncol 2024). בשני המאמרים שותפים חוקרים ישראלים (Sandbank, Vecsler, Bien), ואסותא אשדוד היא בין המוסדות המשתתפים. מודול ייעודי לדרמטופתולוגיה לא פורסם ב-PubMed נכון למאי 2026.

IbexGalen BreastHER2Israel

📊 ביצועים בדרמטופתולוגיה: המספרים האמיתיים

אחרי הכללה כללית, צריך לבחון את המספרים בפועל. מה AI באמת יודע לעשות בדרמטופתולוגיה ב-2026?

ראשית, BCC. Geijs ועמיתיו פרסמו ב-Medical Image Analysis (2024) אחד המחקרים הגדולים שבוצעו בנושא. הם אימנו את המודל על 5,147 שקופיות, ובחנו אותו על סט פנימי וסט חיצוני. התוצאות: AUC 0.997 בסט הפנימי, 0.993 בסט החיצוני, וביצוע השווה לשני פתולוגים שהיו רפרנס. בסיווג לתת-סוגי BCC (סיכון גבוה מול נמוך): AUC 0.931 פנימי, 0.883 חיצוני. נתונים אלה מציבים את BCC כתרחיש הטוב ביותר לאוטומציה בדרמטופתולוגיה.

שנית, חתכים קפואים ב-Mohs. van Zon ועמיתיו פרסמו ב-Experimental Dermatology (2021) אלגוריתם לזיהוי BCC בחתכים קפואים, מאתגר יותר בגלל איכות החתך הקפוא לעומת חתך פרפין. הביצועים: Dice 0.66 בסגמנטציה, AUC 0.90 ברמת שקופית. Davis ועמיתיו פרסמו ב-Experimental Dermatology (2024) אלגוריתם ל-SCC בחתכים קפואים. התוצאות תלויות בדרגת ההתמיינות: SCC לא ממוין נקרא היטב, אבל SCC ממוין היטב קשה להבחין מאפידרמיס תקין.

שלישית, מלנומה. Sauter ועמיתיו פרסמו ב-Computers in Biology and Medicine (2023) סקירה שיטתית של 54 מחקרים על AI במלנומה דרמטופתולוגית, וניתחו את האתגרים הטכניים: ארטיפקטים, עיבוד תמונות gigapixel, ניהול הגדלה. הקבוצה של Brinker (Hekler 2019) הראתה יתרון על פתולוגים בחתכי תמונה. אבל במחקרים אחרים AI טעה במקרים של desmoplastic melanoma.

רביעית, גידולי Spitz. האתגר הקלאסי של דרמטופתולוגיה. Lucassen ועמיתיו פרסמו ב-Journal of Pathology Informatics (2026) מחקר על AI להבחנה בין Spitz למלנומה קונבנציונלית: AUROC 0.95 (95% CI 0.92-0.98), accuracy 0.86, על 393 Spitz ו-379 מלנומות קונבנציונליות. במחקר reader עם 4 פתולוגים מנוסים, ה-AI היה טוב יותר. Mosquera-Zamudio ועמיתיהם פרסמו ב-Scientific Data (2023) את SOPHIE, מאגר ציבורי של גידולי Spitz, וב-Histopathology (2024) ניתוח קונקורדנציה: kappa 0.87 להבחנה בין Spitz nevus למלנומה, אבל רק 0.66 ל-Atypical Spitz Tumors (AST) מול Spitz Melanoma. זהו אזור האפור שגם פתולוגים מומחים מתקשים בו.

חמישית, Lentigo Maligna. Löper ועמיתיו פרסמו ב-Dermatopathology (Basel) (2025) אלגוריתם להערכת שולי כריתה ב-LM באמצעות מיפוי צפיפות מלנוציטים על שקופיות Sox-10. ביצועים: רגישות 87.84%, סגוליות 72.82%, AUC 0.818 על 177 שקופיות. השימוש המעניין: heat map תלת-צבעי אוטומטי שמאפשר לפתולוג סריקה מהירה של השוליים.

המחקר הגדול ביותר עד היום על AI ל-BCC בדרמטופתולוגיה היסטולוגית. Geijs ועמיתיו ברדבוד ובמאסטריכט אימנו רשת weakly-supervised על 5,147 שקופיות ובחנו על סט פנימי וחיצוני. תוצאות: AUC 0.997 פנימי, 0.993 חיצוני לזיהוי בינארי. בסיווג לתת-סוגים (סיכון גבוה מול נמוך, שיקול קריטי בבחירה בין Mohs לכריתה רגילה): AUC 0.931 פנימי, 0.883 חיצוני. הביצוע היה השווה לשני פתולוגים ששימשו כרפרנס.

GeijsBCCAUC 0.993Medical Image Analysis

המחקר העדכני ביותר בתחום (פברואר 2026). Lucassen ועמיתיו באוטרכט אימנו מודל מבוסס UNI על 393 גידולי Spitz ו-379 מלנומות קונבנציונליות. הסיווג הראה AUROC 0.95 ו-accuracy של 86%. ה-AI ניבא גם את השונות הגנטית (BRAF, NRAS, HRAS, ETV6-NTRK3 fusions ועוד) בדיוק של 55%, לעומת 25% של חיזוי אקראי. סימולציה הראתה שניתן להוריד עלויות ולקצר זמני אבחנה אם ה-AI ינחה את הזמנת הבדיקות הגנטיות. עם זאת, הדיוק הגנוטיפי עדיין רחוק מרמה קלינית.

LucassenSpitzAUROC 0.95UNI

אחד האתגרים הקלאסיים בדרמטופתולוגיה: הערכת שולי כריתה ב-Lentigo Maligna. מלנוציטים בודדים על רקע אפידרמיס פגוע שמש, קל לפספס. Löper ועמיתיו פיתחו אלגוריתם שמזהה את האפידרמיס, מודד את אורכו, ומחשב את צפיפות המלנוציטים על שקופיות Sox-10. הסף שהוגדר: 30 מלנוציטים ל-0.5 מ״מ אורך אפידרמיס. הביצועים: רגישות 87.84%, סגוליות 72.82%, AUC 0.818 על 177 שקופיות. החידוש המרכזי: heat map תלת-צבעי אוטומטי שמאפשר לפתולוג סקירה מהירה של השוליים.

LöperLM marginsSox-10AI heat map

Davis ועמיתיו בדרטמות׳ ו-van Zon באיינדהובן פיתחו אלגוריתמים לחתכים קפואים ב-Mohs, מטרה עם פוטנציאל מיידי לקצר זמני המתנה. BCC בחתך קפוא נקרא היטב (van Zon: AUC 0.90 ברמת שקופית). אבל SCC בחתך קפוא מאתגר יותר: ל-well-differentiated SCC יש דמיון מורפולוגי גבוה לאפידרמיס תקין, וזה גורר תוצאות שליליות כוזבות. הדיווח של Davis הוא דוגמה לדיווח כן של מגבלות תלויות תת-קטגוריה.

Mohs frozenDavisSCCvan Zon

👥 AI כקורא שני: התהליך הקליני ב-2026

השאלה המעשית של פתולוג ב-2026: איך AI ישתלב בעבודה היומיומית? התשובה המתפתחת היא לא כתחליף, אלא כקורא שני אוטומטי. כל שקופית עוברת קריאה של הפתולוג, ובמקביל גם של האלגוריתם. אם יש הסכמה, הביופסיה ממשיכה בתהליך הרגיל. כשיש חוסר הסכמה, היא עוברת מיון לבדיקה נוספת.

מכבי שירותי בריאות יישמה את הגישה הזו עם Ibex Galen Prostate החל מ-2020. כל ביופסיה של ערמונית עוברת אוטומטית דרך הפלטפורמה במקביל לקריאת הפתולוג. ב-Lancet Digital Health (Pantanowitz 2020) דווח AUC חיצוני של 0.991, וגם זוהו מקרי אדנוקרצינומה שהפתולוג הראשון לא דיווח עליהם בקריאה ראשונית. מקרים אלה היו מתגלים בסופו של דבר גם בלי AI, אבל מאוחר יותר בתהליך.

Eloy ועמיתיו פרסמו ב-Virchows Archiv (2023) מחקר 'לפני-אחרי' מובהק: 4 פתולוגים, 105 ביופסיות ערמונית, שנקראו פעם בלי AI ופעם עם Paige Prostate. התוצאות: הדיוק נשמר ב-95%, אבל זמן הקריאה ירד ב-20%, בקשות ל-IHC ירדו ב-20%, בקשות לחוות דעת שנייה ירדו ב-40%, ואבחנות של Atypical Small Acinar Proliferation (ASAP) ירדו ב-30%. כל אלה משמעותיים: IHC, חוות דעת שנייה ו-ASAP מובילים לעלויות נוספות ולעיכוב באבחנה.

Pantanowitz ועמיתיו פרסמו ב-Diagnostic Pathology (2020) מחקר במשימה אחרת אבל מאלפת: ספירת מיטוזות בסרטן שד. 24 קוראים, AI כסיוע. הדיוק עלה בכל רמות הניסיון, וחיסכון של 27.8% בזמן. רבים מהקוראים ציינו אחר כך שהם לא רוצים לחזור לעבוד בלי סיוע AI לספירת מיטוזות.

Jia ועמיתיו פרסמו ב-Computers in Biology and Medicine (2025) את פרויקט ARTICULATE PRO, פריסה פרוספקטיבית של Paige Prostate ב-NHS הבריטי, עם מסגרת hazard analysis ומעקב post-market שיטתי. זהו מודל לגישה זהירה: לא רק אישור ה-AI ושליחתו לקליניקה, אלא גם מעקב שיטתי אחר ביצועיו בעולם האמיתי.

מחקר חד וברור: 4 פתולוגים, 105 ביופסיות, נקראו פעמיים. עם Paige Prostate: זמן קריאה ירד ב-20%, בקשות ל-IHC ירדו ב-20%, בקשות לחוות דעת שנייה ירדו ב-40%, אבחנות ASAP ירדו ב-30%, והדיוק נשאר יציב ב-95%. זוהי הראיה הברורה ביותר לכך ש-AI כסיוע משפר את התהליך מבלי לפגוע בדיוק. אם Ibex תפרסם מחקר דומה ממכבי עם נתוני שגרה ישראליים, זה יהיה הקלף החזק ביותר לפריסה רחבה.

EloyPaigeWorkflowTime savings

ב-Diagnostic Pathology (2020) הראה Pantanowitz ש-AI בתפקיד סיוע לספירת מיטוזות בסרטן שד שיפר את הדיוק של כל קורא ללא קשר לניסיונו, וחסך 27.8% מהזמן. ספירת מיטוזות היא משימה שכל פתולוג עושה, אבל היא מונוטונית, נוטה לטעויות, ותלויה ברמת הריכוז. זוהי דוגמה מובהקת למקום שבו AI מתאים יותר מהאדם.

PantanowitzMitosesBreast24 readers

Jia ועמיתיו פרסמו ב-Comput Biol Med (2025) את ה-Safety Case של פריסת Paige ב-NHS. לא רק אישור ה-FDA או ה-MHRA, אלא מסגרת זהירה: hazard analysis, מנגנוני fail-safe, מעקב ביצועים מתמשך, ונתיבי הסלמה לכשיתגלה distribution shift. זהו המודל שעתיד לעצב את פריסת ה-AI ברגולציה מודרנית.

ARTICULATE PRONHSPost-marketSafety

⚠️ המגבלות: היכן AI עדיין מתקשה

אסור להציג AI כמושלם. הוא לא. ב-2026 קיימות ארבע קטגוריות עיקריות של מגבלות אמיתיות.

ראשונה: גידולי Spitz אטיפיים. Mosquera-Zamudio ועמיתיו פרסמו ב-Histopathology (2024) ניתוח של אלגוריתם logistic regression machine-learning על 122 גידולי Spitz מ-4 מדינות. בהבחנה בין Spitz nevus למלנומה: kappa 0.87, accuracy 0.91, ביצוע טוב. אבל בהבחנה בין Atypical Spitz Tumors למלנומת Spitz: ה-ML הגיע רק ל-kappa 0.66 ול-accuracy 0.85, ביצוע בינוני. הקטגוריה עצמה גבולית מורפולוגית, וגם בין פתולוגים מומחים מדווחת על חוסר הסכמה משמעותי. אי אפשר לפתור באמצעות AI בעיה שאין לה אמת מוסכמת ברורה ברמה המולקולרית.

שנייה: מעבר בין מעבדות (Out-of-Distribution). Sikaroudi ועמיתיו פרסמו ב-Scientific Reports (2023) ניתוח שיטתי של ביצועי מודלים שאומנו במעבדה אחת כשהם נבחנים על שקופיות ממעבדה אחרת. ירידה של 10-20% ב-accuracy היא ערך החציון. הסיבות: שונות בפרוטוקול הצביעה, סורקים שונים, ואיכות חתך משתנה. הבעיה אינה נקודתית אלא מערכתית. כל מעבדה חייבת לבצע אימות מקומי של ה-AI על שקופיות שלה, ולא להניח שמה שעובד ב-Memorial Sloan Kettering יעבוד באותה רמה במכבי.

שלישית: שונות בצביעה. Marini ועמיתיו פרסמו ב-Journal of Pathology Informatics (2023) ניתוח של מעל 2 מיליון וריאציות של צביעת H&E ומשמעותן עבור האלגוריתמים. הפתרון הנוכחי הוא color augmentation: חשיפת המודל באימון לכל הצבעים האפשריים. השיטה עוזרת, אבל לא פותרת לחלוטין. שונות בעובי החתך, גיל הריאגנטים, ופרוטוקול הסורק נותרו משתנים שמטלטלים את הביצועים.

רביעית, ופחות מדוברת אבל חשובה: Desmoplastic Melanoma. סוג של מלנומה עם תאי spindle דלים בפיגמנט על רקע סטרומה פיברופלסטית. קל לפספס במיקרוסקופ, וגם AI מתקשה. הסיבה: תאי spindle בעור קיימים לא רק במלנומה, אלא גם בצלקות, נוירופיברומה ודרמטופיברומה. בלי immunohistochemistry (S100, SOX10), קשה לקבוע. בסקירה השיטתית של Mosquera-Zamudio ב-Cancers (2022, על 28 מחקרים במלנומה AI) המקרה הזה מוזכר כנקודה עיוורת מרכזית.

במחקר על 122 גידולי Spitz מ-4 מדינות, אלגוריתם ה-ML (logistic regression) השיג kappa 0.66 ו-accuracy 0.85 בלבד בהבחנה בין Atypical Spitz Tumors למלנומת Spitz, נמוך משמעותית מ-kappa 0.87 שהשיג בהבחנה בין Spitz nevus למלנומה. ה-Atypical Spitz Tumors הם המקרים שגם בין פתולוגים מומחים אין הסכמה, ולכן אין אמת מוסכמת מורפולוגית. עד שתהיה אמת מוסכמת מולקולרית (BRAF, NRAS, בדיקות fusion), AI לא יוכל להגיע לרמה גבוהה יותר. ההמלצה הקלינית: אם ה-AI אומר 'Spitz מול מלנומה' עם רמת ביטחון נמוכה, אל תסתמך עליו לבד.

Atypical Spitzkappa 0.66Concordance

האימות הקליני שמופיע במאמרים מתבצע לרוב במעבדה אחת או במספר מועט. כשמודל יוצא לפריסה רחבה (מעבדות אחרות, פרוטוקולי צביעה אחרים, סורקים אחרים), מצופה ירידה של 10-20% ב-accuracy. לכן Ibex משקיעה ב-fine-tuning ייעודי לכל מוסד. ההמלצה המעשית לכל מעבדה: לפני הסתמכות על AI כקריטריון מכריע, לבצע אימות מקומי על 200-500 שקופיות עם אמת מוסכמת מהמומחה המקומי.

OODSikaroudiExternal validation

שונות בצביעה: הבדלים ב-H&E בין מעבדות, גילים שונים של ריאגנטים, סורקים שונים, ועובי חתך משתנה. כל אלה משתנים שמשנים את התמונה הדיגיטלית באופן שה-AI רגיש אליו. הפתרון הקיים: color augmentation. הפתרון הצפוי: foundation models שאומנו על שונות צביעה עצומה.

Desmoplastic Melanoma: דפוס spindle cell דל בפיגמנט שמתבלבל עם צלקת, נוירופיברומה ועוד. גם ל-AI קשה. נדרשת IHC (S100, SOX10) להבחנה. אל תסתמך כאן על AI לבד.

MariniStain variabilityDesmoplasticBlind spots

🔮 רגולציה ועתיד: חמש שנים קדימה

המסגרת הרגולטורית של AI ברפואה מתפתחת במהירות. Pantanowitz ועמיתיו פרסמו ב-Modern Pathology (2024) את הסקירה האקדמית המקיפה ביותר על הסוגיה. ה-FDA פיתח את ה-Software as a Medical Device framework, כולל את ה-Pre-Determined Change Control Plan (PCCP) שמאפשר ל-AI להמשיך ללמוד ולהשתפר גם אחרי האישור, בכפוף לפרוטוקול ברור ולמנגנוני הגנה. באיחוד האירופי, ה-MDR משנת 2017 כולל AI כמכשיר רפואי, וה-EU AI Act משנת 2024 מוסיף שכבת רגולציה נוספת ל-AI בקטגוריית סיכון גבוה.

בישראל, משרד הבריאות מאמץ הנחיות שחלקן מתואמות עם ה-FDA. חברת Ibex עוברת תהליכי אימות מקומיים בכל מערך בריאות שמטמיע אותה.

הצעד הבא הוא מודלי יסוד רב-מודאליים. הקבוצה של Faisal Mahmood בהרווארד פרסמה ב-Nature Medicine (2024) את UNI, foundation model לפתולוגיה שאומן על למעלה מ-100 מיליון תמונות מ-100,000 שקופיות ב-20 רקמות שונות. הצעד הבא: מודלים שמשלבים תמונה היסטופתולוגית עם תמונה קלינית, דרמוסקופית, נתוני RNA ומידע קליני. כך, האבחנה לא תהיה רק 'BCC' מהשקופית, אלא 'BCC nodular בלחי של מטופל בן 75 עם CIN, סיכון גבוה לחזרה, מומלץ Mohs'. זוהי הראייה לקראת 2030.

ולסיכום, Bulten ועמיתיו פרסמו ב-Nature Medicine (2022) את תוצאות אתגר PANDA: תחרות אלגוריתמית לדירוג Gleason של ערמונית, עם נתונים משוודיה, הולנד, ארה״ב, בלגיה ועוד. החדשנות לא הייתה רק במודל המנצח שהגיע לרמת פתולוג, אלא בעצם המודל הראשון של אימות פרוספקטיבי בינלאומי בקנה מידה כזה. ה-FDA רואה את זה כסטנדרט שצריך להפוך לנורמה באישורים העתידיים.

הסקירה המעודכנת והמקיפה ביותר על המסגרות הרגולטוריות הגלובליות לאבחנה מבוססת AI בפתולוגיה. כוללת את ה-FDA SaMD framework, PCCP, את ה-MDR וה-AI Act באיחוד האירופי, את ה-MHRA בבריטניה, ואת ה-PMDA ביפן. דנה גם ב-laboratory-developed tests, בהחזר עלויות, ובסוגיות פרטיות נתונים (HIPAA, GDPR). אם אתה דרמטולוג שמעורב בהחלטה לאמץ AI במוסד שלך, זוהי הקריאה החובה.

PantanowitzRegulationFDAEU AI Act

Bulten ועמיתיו פרסמו את תוצאות PANDA, תחרות אלגוריתמית לדירוג Gleason של ערמונית, על נתונים משוודיה, הולנד, ארה״ב, בלגיה ועוד. החדשנות לא הייתה רק במודל המנצח שהגיע לרמת פתולוג, אלא בעצם המודל הראשון של אימות פרוספקטיבי בינלאומי בקנה מידה כזה. ה-FDA רואה בזה את הסטנדרט שצריך להפוך לנורמה באישורים עתידיים.

PANDABultenInternationalValidation

Chen ועמיתיו מהרווארד וברגהאם פרסמו ב-Nature Medicine (2024) את UNI, foundation model לפתולוגיה שאומן ב-self-supervised learning על למעלה מ-100 מיליון תמונות, 100,000 שקופיות ב-20 רקמות, סה״כ 77 TB. UNI כבר משמש כעמוד שדרה למודלי downstream, למשל המודל של Lucassen (2026) לסיווג Spitz שהשתמש ב-UNI features. הצעד הבא הוא רב-מודאליות: שילוב היסטופתולוגיה, תמונה קלינית, תמונה דרמוסקופית ונתונים מולקולריים (RNA panel, methylation) בהקשר אחד. עד 2030 ניתן לצפות שדוח ביופסיה יכלול לא רק אבחנה אלא גם תחזית פרוגנוסטית מבוססת multi-omics.

Foundation ModelsUNIMultimodal2030

🔑

שורה תחתונה

ב-2026 הדרמטופתולוגיה עוברת מהפכה דיגיטלית שקטה. סריקת WSI היא הסטנדרט. אלגוריתמי AI מאושרים על ידי ה-FDA (Paige Prostate משנת 2021), פרוסים קלינית כקורא שני בזמן אמת (Ibex במכבי), ומגיעים לרמת ביצועים קלינית בדרמטופתולוגיה: AUC 0.997 ל-BCC (Geijs 2024), AUROC 0.95 ל-Spitz מול מלנומה (Lucassen 2026), ושיפור של 20-40% ביעילות התהליך (Eloy 2023). אבל המגבלות אמיתיות: Atypical Spitz Tumors נותרים אתגר (kappa 0.66), מעבר בין מעבדות דורש אימות מקומי, ושונות בצביעה היא עקב אכילס שדורש color augmentation שיטתי. לדרמטולוג ב-2026: ה-AI אינו תחליף לפתולוג, אלא קורא שני שמשפר את האבחנה ומקצר זמני המתנה. החדשות הטובות: זה כבר קורה בישראל.

אופק 2030: מודלי יסוד רב-מודאליים שמשלבים היסטופתולוגיה, תמונה קלינית, דרמוסקופיה ונתוני RNA במודל אחד. הדוח הפתולוגי יכלול לא רק אבחנה, אלא גם תחזית פרוגנוסטית מבוססת multi-omics, המלצת טיפול ראשונה מבוססת ראיות, ותמיכה בקבלת החלטות במקרים גבוליים.

📋 פרטי מקור ומחבר

מאת: ד"ר יהונתן קפלן

מומחה ברפואת עור ומין | מנתח מוז (FACMS)

📅 פורסם: 14.5.2026🔄 עודכן: 14.5.2026

📚 מקורות מאומתים (25):

Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, Thrun S “Dermatologist-level classification of skin cancer with deep neural networks” Nature. 2017;542(7639):115-118.PMID: 28117445 DOI
Campanella G, Hanna MG, Geneslaw L, Miraflor A, Werneck Krauss Silva V, Busam KJ, Brogi E, Reuter VE, Klimstra DS, Fuchs TJ “Clinical-grade computational pathology using weakly supervised deep learning on whole slide images” Nat Med. 2019;25(8):1301-1309.PMID: 31308507 DOI
Hekler A, Utikal JS, Enk AH, Solass W, Schmitt M, et al. Brinker TJ “Deep learning outperformed 11 pathologists in the classification of histopathological melanoma images” Eur J Cancer. 2019;118:91-96.PMID: 31325876 DOI
Mukhopadhyay S, Feldman MD, Abels E, Ashfaq R, Beltaifa S, et al. Taylor CR “Whole Slide Imaging Versus Microscopy for Primary Diagnosis in Surgical Pathology: A Multicenter Blinded Randomized Noninferiority Study of 1992 Cases (Pivotal Study)” Am J Surg Pathol. 2018;42(1):39-52.PMID: 28961557 DOI
Chen RJ, Ding T, Lu MY, Williamson DFK, Jaume G, et al. Mahmood F “Towards a general-purpose foundation model for computational pathology” Nat Med. 2024;30(3):850-862.PMID: 38504018 DOI
Sauter D, Lodde G, Nensa F, Schadendorf D, Livingstone E, Kukuk M “Deep learning in computational dermatopathology of melanoma: A technical systematic literature review” Comput Biol Med. 2023;163:107083.PMID: 37315382 DOI
Raciti P, Sue J, Retamero JA, Ceballos R, Godrich R, et al. Fuchs TJ “Clinical Validation of Artificial Intelligence-Augmented Pathology Diagnosis Demonstrates Significant Gains in Diagnostic Accuracy in Prostate Cancer Detection” Arch Pathol Lab Med. 2023;147(10):1178-1185.PMID: 36538386 DOI
Pantanowitz L, Quiroga-Garza GM, Bien L, Heled R, Laifenfeld D, Linhart C, Sandbank J, et al. Dhir R “An artificial intelligence algorithm for prostate cancer diagnosis in whole slide images of core needle biopsies: a blinded clinical validation and deployment study” Lancet Digit Health. 2020;2(8):e407-e416.PMID: 33328045 DOI
Sandbank J, Bataillon G, Nudelman A, Krasnitsky I, Mikulinsky R, Bien L, et al. Vincent-Salomon A “Validation and real-world clinical application of an artificial intelligence algorithm for breast cancer detection in biopsies” NPJ Breast Cancer. 2022;8(1):129.PMID: 36473870 DOI
Krishnamurthy S, Schnitt SJ, Vincent-Salomon A, Canas-Marques R, Colon E, et al. Vecsler M “Fully Automated Artificial Intelligence Solution for Human Epidermal Growth Factor Receptor 2 Immunohistochemistry Scoring in Breast Cancer: A Multireader Study” JCO Precis Oncol. 2024;8:e2400353.PMID: 39393036 DOI
Geijs DJ, Dooper S, Aswolinskiy W, Hillen LM, Amir AL, Litjens G “Detection and subtyping of basal cell carcinoma in whole-slide histopathology using weakly-supervised learning” Med Image Anal. 2024;93:103063.PMID: 38194735 DOI
van Zon MCM, van der Waa JD, Veta M, Krekels GAM “Whole-slide margin control through deep learning in Mohs micrographic surgery for basal cell carcinoma” Exp Dermatol. 2021;30(5):733-738.PMID: 33656186 DOI
Davis MJ, Srinivasan G, Chacko R, Chen S, Suvarna A, et al. Levy JJ “A deep learning algorithm to detect cutaneous squamous cell carcinoma on frozen sections in Mohs micrographic surgery: A retrospective assessment” Exp Dermatol. 2024;33(1):e14949.PMID: 37864429 DOI
Lucassen RT, Romers M, Ebbelaar CF, Najem AN, Hayes DP, et al. Blokx WAM “Artificial intelligence-based classification of Spitz tumors” J Pathol Inform. 2026;21:100650.PMID: 41847156 DOI
Löper R, Abels L, Otero Baguer D, Bremmer F, Schön MP, Mitteldorf C “Artificial Intelligence for Lentigo Maligna: Automated Margin Assessment via Sox-10-Based Melanocyte Density Mapping” Dermatopathology (Basel). 2025;13(1):e2025001.PMID: 41562710 DOI
Mosquera-Zamudio A, Launet L, Colomer A, Wiedemeyer K, López-Takegami JC, et al. Monteagudo C “Histological interpretation of spitzoid tumours: an extensive machine learning-based concordance analysis for improving decision making” Histopathology. 2024;85(1):155-170.PMID: 38606989 DOI
Mosquera-Zamudio A, Launet L, Tabatabaei Z, Parra-Medina R, Colomer A, et al. Naranjo V “Deep Learning for Skin Melanocytic Tumors in Whole-Slide Images: A Systematic Review” Cancers (Basel). 2022;15(1):42.PMID: 36612037 DOI
Sikaroudi M, Hosseini M, Gonzalez R, Rahnamayan S, Tizhoosh HR “Generalization of vision pre-trained models for histopathology” Sci Rep. 2023;13(1):6065.PMID: 37055519 DOI
Marini N, Otalora S, Wodzinski M, Tomassini S, Dragoni AF, et al. Atzori M “Data-driven color augmentation for H&E stained images in computational pathology” J Pathol Inform. 2023;14:100183.PMID: 36687531 DOI
Eloy C, Marques A, Pinto J, Pinheiro J, Campelos S, Curado M, Vale J, Polónia A “Artificial intelligence-assisted cancer diagnosis improves the efficiency of pathologists in prostatic biopsies” Virchows Arch. 2023;482(3):595-604.PMID: 36809483 DOI
Pantanowitz L, Hartman D, Qi Y, Cho EY, Suh B, Paeng K, et al. Cho SY “Accuracy and efficiency of an artificial intelligence tool when counting breast mitoses” Diagn Pathol. 2020;15(1):80.PMID: 32622359 DOI
Jia Y, Verrill C, White K, Dolton M, Horton M, Jafferji M, Habli I “A deployment safety case for AI-assisted prostate cancer diagnosis” Comput Biol Med. 2025;192(Pt B):110237.PMID: 40345136 DOI
Pantanowitz L, Hanna M, Pantanowitz J, Lennerz J, Henricks WH, Shen P, Quinn B, Bennet S, Rashidi HH “Regulatory Aspects of Artificial Intelligence and Machine Learning” Mod Pathol. 2024;37(12):100609.PMID: 39260776 DOI
Bulten W, Kartasalo K, Chen PC, Ström P, Pinckaers H, et al. Eklund M “Artificial intelligence for diagnosis and Gleason grading of prostate cancer: the PANDA challenge” Nat Med. 2022;28(1):154-163.PMID: 35027755 DOI
Lalmalani RM, Lim CXY, Oh CC “Artificial intelligence in dermatopathology: a systematic review” Clin Exp Dermatol. 2025;50(2):251-259.PMID: 39226138 DOI

הערת עריכה: תוכן זה נכתב ונערך על ידי ד"ר יהונתן קפלן ומבוסס על מקורות אקדמיים מאומתים.

אין להסתמך על תוכן זה ללא קריאת המקורות המלאים.