דילוג לתוכן הראשי
arXiv · 2022Anthropic

Claude - The New Revolution או רק Hype נוסף?
סקירה מקיפה של Anthropic ו-Claude Opus 4.7: Constitutional AI, 1M tokens context (אורך הטקסט שהמודל קורא בבת אחת), HIPAA Enterprise, Claude Code, והשוואה ל-GPT-5.5 ול-Gemini 3.1 Pro

Constitutional AI: Harmlessness from AI Feedback

✍️ Bai Y, Kadavath S, Kundu S, et al.
📋 תמונה רחבה

🎯 בקצרה: על מה מדובר?

Deep Dive זה סוקר את Anthropic ואת Claude Opus 4.7 ובוחן האם מדובר במהפכה אמיתית או באבולוציה. נסקור את הסיפור של החברה (נוסדה ב-2021 על ידי חוקרים שעזבו את OpenAI, גייסה למעלה מ-30 מיליארד דולר ב-Series G של פברואר 2026 בשווי 380 מיליארד דולר), את Constitutional AI (השיטה הייחודית של Anthropic), ואת Claude Opus 4.7 (16 באפריל 2026): 1M tokens context, multimodal (מבין טקסט ותמונות), SWE-bench 87.6% (מבחן 500 בעיות coding אמיתיות מ-GitHub), ותמחור של 5 דולר למיליון input ו-25 דולר למיליון output. נכסה את Claude for Healthcare (הושק ב-12 בינואר 2026 ב-JPMorgan Healthcare Conference - HIPAA-ready Enterprise, אינטגרציות native ל-CMS Coverage Database, ICD-10 ו-PubMed, prior authorization מהשעות לדקות, חיבור ל-Apple Health ו-Android Health Connect), את Claude Code (כלי agentic מבוסס terminal לכתיבת קוד), ואת ההשוואה ל-GPT-5.5 (24 באפריל 2026, $5/$30 למיליון tokens) ול-Gemini 3.1 Pro. נבחן את שאלת המהפכה: 81% מהרופאים בארה״ב משתמשים ב-AI ב-2026 (AMA Survey, מרץ 2026, כפול מ-38% ב-2023), 63% ב-Doximity (עלייה מ-47% במרץ 2025). מקצוע הרפואה משתנה - ה-AI הוא מהפכת הפרודוקטיביות הגדולה ביותר מאז המחשב והאינטרנט. בסיום: חמש מסקנות מעשיות לדרמטולוג ישראלי, stack בעלות של 30-100 דולר לחודש, ואוריינות AI ההופכת לכישור ליבה.
📜
1M tokens
Context window של Claude Opus 4.7 (אורך קלט)
💻
87.6%
דיוק על SWE-bench Verified (מבחן coding)
🩺
90%
דיוק על MedQA (1,273 שאלות USMLE-style)
💰
5$/25$
מחיר למיליון tokens (input/output)
💵
380 מיליארד דולר
שווי Anthropic (Series G פברואר 2026)

💡 מה חייבים לזכור מהמאמר הזה

🏢Anthropic נוסדה ב-2021 על ידי האחים Dario ו-Daniela Amodei (לשעבר ב-OpenAI). מתמקדת ב-AI safety. הבדל מובהק מ-OpenAI: שימוש ב-Constitutional AI במקום RLHF (אימון תוך משוב אנושי - בני אדם מדרגים תשובות) בלבד. השקעה כוללת של למעלה מ-30 מיליארד דולר (Google, Amazon, Salesforce, GIC, Coatue ועוד), שווי 380 מיליארד דולר נכון לפברואר 2026.
🚀Claude Opus 4.7 (16 באפריל 2026): 1M tokens context window, multimodal, 87.6% ב-SWE-bench Verified, 90% ב-MedQA. הטוב ביותר ב-coding ארוך-טווח ובכתיבה ארוכה. תמחור 5 דולר למיליון input ו-25 דולר למיליון output (זול יותר מ-GPT-5.5 ב-output: 5$/30$). GPT-5.5 מוביל ב-Terminal-Bench 2.0 (82.7% מול 69.4%) וב-FrontierMath Tier 4 (35.4% מול 22.9%). זמין ב-API, ב-Amazon Bedrock, ב-Vertex AI וב-Microsoft Foundry.
📜Constitutional AI: שיטה שבה עקרונות ה-constitution כתובים בטקסט, וה-AI שופט תשובות לפיהם. שילוב של RLHF ו-RLAIF (RL from AI Feedback - AI מבקר AI - גרסת Anthropic). התוצאה: AI בטוח יותר עם פחות harmful outputs (פלטים מזיקים).
🏥Claude for Healthcare (JPMorgan Healthcare Conference, 12 בינואר 2026): HIPAA-ready Enterprise, BAA זמין, מוסמך ISO 42001 (מ-6 בינואר 2025). אינטגרציות native: CMS Coverage Database, ICD-10, PubMed. Use case מרכזי: prior authorization מהשעות לדקות. צרכנים: חיבור ל-HealthEx, Apple Health ו-Android Health Connect. שותפים: Banner Health, Novo Nordisk, AbbVie. מסלול Team אינו כולל HIPAA, חשוב לזכור.
💻Claude Code: כלי agentic coding מבוסס terminal. שונה מ-GitHub Copilot (כלי autocomplete של GitHub/Microsoft - השלמה אוטומטית של שורת קוד) בכך שהוא פועל על codebase (כל קבצי הקוד של פרויקט) שלם ומבצע שינויים מרובי-שלבים. כלול ב-Pro/Team/Enterprise. עבור ניתוח נתונים במחקר זהו כלי שמשנה את כללי המשחק.
⚖️בקליניקה: Claude Opus 4.7 הוא הטוב ביותר לניתוח long-form (טקסט ארוך - literature synthesis, ניתוח מקרים מורכבים), אך ביצועי MedQA דומים ל-GPT-5.5. הבחירה תלויה בהקשר השימוש ולא ב-benchmark (מבחן השוואתי) בלבד.

🏢 Anthropic - הסיפור של החברה

Anthropic נוסדה ביולי 2021 על ידי שבעה חוקרים שעזבו את OpenAI:

Dario Amodei (CEO, לשעבר VP of Research ב-OpenAI)

Daniela Amodei (President)

Tom Brown (לשעבר אחד המחברים של GPT-3 paper)

Sam McCandlish

Jack Clark

Jared Kaplan (שכתב את ה-Scaling Laws paper)

ואחרים

הסיבה לעזיבה: חילוקי דעות לגבי כיוון החברה. OpenAI החלה להתמסחר באגרסיביות (עסקה עם Microsoft ב-2019), ומייסדי Anthropic רצו התמקדות חזקה יותר ב-AI safety.

סבבי גיוס:

Series A - 124M$ (גיוס ראשון)

Series B - 580M$ ב-2022 מ-FTX (הוחזרו לאחר קריסת FTX)

2023 - Google (החל מ-300M$ ועד 2B$), Spark Capital, Salesforce

2024 - Amazon השקיעה 4B$

Series F - 13B$ בספטמבר 2025 בשווי 183B$

Series G - 30B$ בפברואר 2026 בשווי 380B$ (בהובלת GIC ו-Coatue)

סבב פוטנציאלי נוסף - לפי TechCrunch ו-Bloomberg מאפריל 2026, עד 50B$ בשווי 850-900B$

ה-revenue run-rate (קצב הכנסות שנתי משוערך) צמח מכ-1B$ בדצמבר 2024 ליותר מ-30B$ באפריל 2026. הצוות גדל משבעה עובדים ליותר מ-1,000. המטה ב-San Francisco.

עובדים בולטים: Jan Leike (עזב את OpenAI ב-2024 בעקבות חששות safety והצטרף ל-Anthropic).

מבנה החברה: PBC (Public Benefit Corporation - מבנה תאגידי מאוזן בין רווחיות לתועלת ציבורית).

גלגול גרסאות Claude:

Claude 1 (מרץ 2023)

Claude 2 (יולי 2023)

Claude 3 (מרץ 2024)

Claude 3.5 (יוני ואוקטובר 2024)

Claude 4 (מאי 2025)

Claude Sonnet 4.5 (29 בספטמבר 2025, הצגת 1M tokens context ב-beta)

Claude 4.6 (ינואר 2026, 1M tokens context ב-GA)

Claude Opus 4.7 (16 באפריל 2026)

הגישה: שחרור מהיר של שיפורים. ב-2026 Anthropic מתחרה ראש בראש מול OpenAI מבחינת revenue (run-rate של מעל 30B$ עבור שתיהן), ומובילה ב-enterprise וב-safety.

OpenAI:

נוסדה ב-2015 על ידי Sam Altman ו-Elon Musk

בתחילה עמותה ללא מטרת רווח, ב-2019 עברה ל-capped-profit (רווח מוגבל - תקרה לתשואה למשקיעים)

המשימה: AGI (Artificial General Intelligence - AI ברמת אדם בכל תחום) לטובת האנושות

בפועל: מסחור אגרסיבי, שותפויות (Microsoft 2019, מעל 13B$)

הגישה: 'ship fast, iterate'

עזיבות בולטות: מייסדי Anthropic ב-2021, Jan Leike ב-2024 (בעקבות safety concerns), משבר ה-board ב-2023

Anthropic:

נוסדה ב-2021, מבנה PBC

המשימה: AI safety ו-frontier research

בפועל: גישה מתודית, safety-first

הגישה: 'responsible scaling' (Responsible Scaling Policy - מסמך של Anthropic, 5 רמות בטיחות AI)

גיוסים בולטים: צוות ה-safety של OpenAI לשעבר

דגש על Constitutional AI, מסחור איטי יותר

שתי החברות מתחרות. ה-revenue run-rate שלהן ב-2026 דומה (מעל 30B$). Anthropic מובילה ב-enterprise וב-safety; OpenAI מובילה ב-consumer וב-brand recognition

למשתמש: הבחירה תלויה בערכים. אם safety חשוב, Anthropic מתאימה. אם דרושים cutting-edge features, OpenAI לעיתים מובילה. איכות מודלי הבסיס דומה.

AnthropicOpenAIculture
RLHF סטנדרטי (הגישה של OpenAI): ה-AI מייצר תשובות, בני אדם מדרגים אותן, והמודל מתאמן על הדירוגים. הבעיה: סקיילביליות - human feedback (משוב אנושי) יקר

Anthropic Constitutional AI (Bai et al., 2022) - השלבים:

הגדרת 'constitution' - טקסט עקרונות (helpful, harmless, honest)

ה-AI מייצר תשובות

AI נוסף מבקר: 'האם התשובה הזו עומדת ב-constitution?'

ה-AI מתקן על בסיס הביקורת

Reinforcement learning (אימון מבוסס תגמול) על התשובות המתוקנות (RLAIF - RL from AI Feedback)

יתרונות:

ניתן ל-scaling (התרחבות לקנה מידה גדול - ללא human bottleneck (צוואר בקבוק אנושי))

שקיפות (constitution גלוי)

אופי iterative (מחזורי, חוזר על עצמו עם שיפורים)

רכיבי ה-constitution:

UN Declaration of Human Rights

עקרונות מ-Apple terms of service

ערכי Anthropic

הנחיות התנהגות

התוצאה: Claude נוטה פחות לייצר harmful outputs ממודלים שאומנו ב-RLHF בלבד.

דוגמאות:

עמידות גבוהה יותר ל-jailbreaks (ניסיונות לעקוף את הגבלות הבטיחות)

הסתייגות במקום הנכון

הסבר על חוסר ודאות

Trade-off: לעיתים over-cautious (זהיר מדי). Anthropic שיפרה זאת החל מ-Claude 3

בקליניקה: הנטייה של Claude להסתייג ולהסביר חוסר ודאות מהווה יתרון בעבודה רפואית.

Constitutional AIsafetyRLAIF
Claude 1 (מרץ 2023): 100K tokens context, צ'אט בסיסי

Claude 2 (יולי 2023): 100K tokens context. שיפור ב-instruction-following (יכולת ביצוע הוראות)

Claude 3 (מרץ 2024): 200K tokens context. שלושה גדלים - Haiku, Sonnet, Opus. Multimodal (טקסט ו-vision)

Claude 3.5 Sonnet (יוני 2024): טוב יותר מ-Opus 3 במשימות רבות, וזול יותר

Claude 3.5 Opus (אוקטובר 2024): טופ-של-הליין. SWE-bench 49% (היה המוביל)

Claude 4 (מאי 2025): SWE-bench 65%

Claude Sonnet 4.5 (29 בספטמבר 2025): הצגת 1M tokens context (ב-beta - גרסת בדיקה ציבורית). SWE-bench 80%

Claude 4.6 (ינואר 2026): 1M tokens context ב-GA (General Availability - זמינות מלאה לכלל הציבור), SWE-bench 85%, עדכוני safety

Claude Opus 4.7 (16 באפריל 2026):

SWE-bench 87.6% Verified, 64.3% Pro (גרסה קשה יותר - 200 בעיות)

1M tokens context כברירת מחדל

עמידות טובה יותר ל-hallucinations (המצאות של ה-AI - מידע שגוי שנשמע אמין)

שיפור משמעותי ב-multilingual (כולל עברית), ב-vision וב-output verification (המודל בודק את הפלט שלו לפני שמדווח)

רמת מאמץ חדשה xhigh (רמה חדשה - בין high ל-max)

תמחור: 5$ למיליון input ו-25$ למיליון output

הקצב: שיפורים כל 3-6 חודשים, כל אחד מהם משמעותי. האסטרטגיה: לא לחכות לגרסה מושלמת אלא להשתמש ב-stable העדכני ביותר.

timelineClaudeevolution

🚀 Claude Opus 4.7 - היכולות והמגבלות

Claude Opus 4.7 שוחרר ב-16 באפריל 2026. מהו המודל? Frontier model (המודל הכי מתקדם של החברה) של Anthropic, יורשו של Claude Opus 4.6 (ינואר 2026).

תכונות:

1M tokens context window (כ-1,500 עמודי A4 או 750,000 מילים)

Multimodal - מקבל טקסט, תמונות (ברזולוציה גבוהה יותר מקודמיו) ו-PDF

הפקת טקסט עד 8K tokens (במצב extended thinking (מצב בו המודל חושב לפני התשובה): עד 32K reasoning ו-8K output)

רמת מאמץ חדשה xhigh (בין high ל-max)

Output verification לפני דיווח

ביצועים משופרים במשימות long-running (משימות שדורשות זמן ושלבים מרובים)

הנתיב מטפס לקראת מודל לא משוחרר בשם Mythos (מודל לא-משוחרר של Anthropic - הדור הבא).

Benchmarks (מבחנים השוואתיים):

SWE-bench Verified - 87.6%

SWE-bench Pro - 64.3% (state-of-the-art ב-coding - הטוב ביותר היום)

MMLU - 90.5% (Massive Multitask Language Understanding - מבחן רב-תחומי)

MedQA - 90% (ללא medical fine-tuning - אימון נוסף ייעודי לרפואה)

Math AIME 2024 - 87% (תחרות מתמטיקה אמריקאית)

Context retrieval (Needle in haystack - מבחן: למצוא פיסת מידע ב-context ארוך) - מעל 99.5% לאורך כל ה-context

Multilingual עברית - שיפור משמעותי מ-Claude 4 (כ-10 נקודות אחוז), אך עדיין מעט מאחורי האנגלית

תמחור וזמינות:

5$ למיליון input tokens

25$ למיליון output tokens (זהה ל-Opus 4.6)

Caching (שמירת שאלות חוזרות ב-cache - מהיר וזול יותר) - 90% הנחה ב-cache reads

Batch API (שליחת מספר שאלות בבת אחת - הנחה 50%) - 50% הנחה

זמין ב-Claude products, ב-API, ב-Amazon Bedrock, ב-Google Cloud Vertex AI וב-Microsoft Foundry

שימושים מתאימים:

Long-form analysis - מושלם ל-SR ולניתוח מאמרים מלאים

Coding - top-tier ב-SWE-bench

Reasoning (חשיבה לוגית/הסקה) - מצב thinking לבעיות מורכבות

כתיבה יצירתית

Multimodal - קריאת CXR, ECG, תמונות דרמטולוגיה ו-pathology slides

Agentic - tool use (יכולת ה-AI לקרוא לפונקציות חיצוניות), תכניות מרובות-שלבים

מגבלות:

Hallucinations עדיין 5-15% בטענות factuals (טענות עובדתיות)

עברית השתפרה משמעותית אך אינה מושלמת

Knowledge cutoff (התאריך עד אליו המודל יודע מידע): ינואר 2026

Real-time (גישה לאינטרנט בזמן אמת): אין גישה לאינטרנט כברירת מחדל

Latency (זמן תגובה): מצב extended thinking 30-90 שניות

אינו מייצר תמונות

אין voice mode מובנה

שימושים ייחודיים:

קריאת ספר לימוד שלם (Bolognia, 4,000 עמודים) ושאלת שאלות עליו

ניתוח 100 מאמרים ב-query (שאילתה - שאלה למודל) יחיד - 'מהו ה-consensus על dupilumab ב-BP במאמרים אלו?'

Code: סקירת codebase בינוני (50K-200K שורות) והצעת refactoring (שיפור מבנה הקוד)

ניתוח מטופלים: 10 שנים של EHR notes (במסלול Enterprise, HIPAA-compliant) ושאלת שאלות

פרוטוקול ארוך: SAP של 47 עמודים בניסוי קליני, איתור סטיות

סינתזת מסמכים: case יחד עם חמישה מאמרי review, הנחיות וההערות שלי, להפקת draft של discussion

עלות:

1 מיליון tokens במחיר 5$ ל-query בעת שימוש ב-long context

עם cache discount העלות יורדת ל-0.50$ כש-cache hit (פגיעה במטמון - שאלה דומה שכבר נשמרה)

עבור שימוש רוטיני זה יקר מדי

עבור משימות בעלות value גבוה זה משתלם

השוואה:

GPT-5.5 - 256K tokens context בלבד

Gemini 3.1 Pro - context גדול אך חלש מעט יותר ב-synthesis (סינתזה - חיבור מידע ממקורות שונים)

Claude Opus 4.7 - ה-sweet spot לעבודה long-form

1Mcontextuse-cases
החל מ-Claude 3 המודלים multimodal: מקבלים תמונות וטקסט. ב-Claude Opus 4.7 ה-visual reasoning (חשיבה ויזואלית - הבנת תמונות) השתפר משמעותית

משימות אפשריות:

קריאת X-ray ותיאור הממצאים

פרשנות ECG

הסתכלות על תמונת דרמטולוגיה והצעת DDx

קריאת תמונת pathology slide

הפקת נתונים מגרף או טבלה

דיוק (תלוי במשימה):

תמונות גנריות - מדויק מאוד

תמונות רפואיות - משתנה

דרמטולוגיה - 60-75% דיוק ב-DDx (נמוך מדרמטולוג)

דרמוסקופיה - פחות מדויק, לא מותאם אופטימלית

פתולוגיה - פרשנות שטחית

השוואה: Med-Gemini עבר fine-tuning (אימון נוסף ייעודי) ייעודי לתמונות רפואיות, ולכן מדויק יותר בתחומים אלה

עבור clinical decision support: יש להשתמש כקלט אחד מתוך רבים, לא כסמכות. עבור הוראה: שימושי - 'תאר את מאפייני הנגע', 'מהן ה-differential diagnoses'

שימושים פרקטיים:

מטופל ששולח תמונה ב-WhatsApp - triage מהיר עם Claude

הערכה לקראת הביקור

הוראת מתמחים

אזהרה: HIPAA - אין לשלוח תמונות מזהות של מטופלים ללא de-identification (הסרת פרטים מזהים מתיק רפואי) נכון ובלי שימוש במסלול Enterprise.

multimodalimagesmedical
Extended thinking: המודל מייצר reasoning trace (שרשרת חשיבה גלויה) (עד 32K tokens) לפני התשובה. דומה ל-OpenAI o-series ול-DeepSeek R1

הפעלה:

API parameter 'extended_thinking: true'

ב-Claude.ai: thinking toggle

ב-Opus 4.7 קיימת רמת מאמץ חדשה xhigh (בין high ל-max)

עלות: פי 5-10 מהרגיל. Latency: 30-90 שניות

מתי זה עוזר:

Math או statistics מורכבים

Multi-step clinical reasoning - ניתוח מקרה מורכב

באגים ב-coding שדורשים ניתוח עמוק

חידות לוגיות

Differential diagnoses קשים

מתי לא:

בירורי עובדה פשוטים

תרגום

סיכום של טקסט קצר

כתיבה יצירתית

שיחה רגילה

דוגמה רפואית: case מורכב עם 10 חריגות במעבדה, ריבוי תרופות וחשד ל-polypharmacy יחד עם autoimmune ו-drug-induced. ללא extended thinking - תשובה שטחית. עם extended thinking - reasoning מובנה: תיעדוף, שקילת ראיות והצעת workup

עלות מול תועלת:

Query רגיל - 0.10-0.50$

עם thinking - 0.50-3.00$

עבור high-stakes case זה משתלם, עבור משימה רוטינית - לא

thinkingreasoningcost

🏥 Claude for Healthcare - JPM26, HIPAA, ISO 42001

ב-12 בינואר 2026, בכנס JPMorgan Healthcare Conference (JPM26), Anthropic השיקה את Claude for Healthcare (במקביל ל-OpenAI שהשיקה ChatGPT Health). זוהי ההכרזה הגדולה של Anthropic ב-healthcare ב-2026.

מה Claude for Healthcare כולל:

HIPAA-ready infrastructure ל-Enterprise customers

מודלים שאומנו ספציפית למשימות healthcare ו-life sciences

אינטגרציות native ל-databases רפואיים: CMS Coverage Database, ICD-10 codes, PubMed

Use case מרכזי - Prior Authorization: Claude שולף דרישות coverage מ-CMS או מ-policies מותאמות, בודק clinical criteria מול patient records (HIPAA-ready), ומציע determination יחד עם supporting materials ל-payer review. עיבוד שלקח שעות מתבצע בדקות.

Patient care coordination - הפחתת לחץ זמן על clinicians

Regulatory submissions - האצת תהליך הגשה של תרופות

Consumer features (במסלולי Pro/Max):

HealthEx - האינטגרציה הראשונה של consumer health record

Apple Health - rolling out ב-beta דרך אפליקציית Claude iOS

Android Health Connect - rolling out ב-beta דרך אפליקציית Claude Android

סיכום medical history, הסברת lab results, זיהוי patterns

הכנת שאלות ייעודיות לפגישות עם רופאים

שותפי הכרזה: Banner Health, Novo Nordisk ו-AbbVie. בארה״ב, HIPAA (Health Insurance Portability and Accountability Act 1996 - חוק אמריקאי להגנת PHI) דורש שכל שירות המטפל ב-PHI (Protected Health Information - מידע רפואי מזהה: שמות, ת.ז., תיקים) יעמוד בסטנדרטים.

מסלולי Claude של Anthropic:

Claude.ai Free - שימוש אישי, ללא BAA וללא HIPAA

Claude.ai Pro (20$ לחודש) - שימוש אישי, ללא BAA, אך כולל את consumer health features (HealthEx, Apple Health, Android Health Connect)

Claude Max (200$ לחודש) - הרחבה של Pro, כולל consumer health features

Claude Team (30$ לחודש למשתמש, מינימום חמישה משתמשים) - שיתוף בין חברי צוות, ללא BAA וללא HIPAA

Claude Enterprise (תמחור מותאם, 30-100$ ומעלה למשתמש לחודש, מינימום 50 משתמשים) - BAA זמין, HIPAA-ready, מוסמך ISO 42001 ו-SOC 2 Type II (Service Organization Controls - audit ל-cloud services)

ההבדל קריטי. למי שרוצה לשלוח PHI מסלול Enterprise חובה. Team אינו מספיק.

מה ש-Enterprise כולל:

BAA חתום (Business Associate Agreement - חוזה תחת HIPAA המגדיר אחריות על PHI)

הצפנת PHI ב-rest (במנוחה - בעת אחסון) וב-transit (במעבר ברשת)

Audit logs (יומני ביקורת)

בקרות גישה (SSO, role-based - SSO=Single Sign-On, role-based=מבוסס תפקיד)

אפשרויות data residency (היכן נשמרים הנתונים גיאוגרפית)

אין training על נתוני לקוחות לעולם

תמיכה ייעודית

הסמכות compliance

ISO 42001 (2023) הוא תקן ל-AI Management Systems, ו-Anthropic הייתה אחת מספקי ה-LLM (Large Language Model - מודל שפה גדול) הראשונים שעמדו בו (הוסמכה ב-6 בינואר 2025 על ידי Schellman Compliance, מהראשונות בין frontier AI labs).

בישראל: HIPAA אינו רלוונטי באופן ישיר (חוק אמריקאי), אך חוק הגנת הפרטיות 1981 (תיקון 13 משנת 2018) דומה ברוחו. הליבה: הסכמה מודעת, minimization (מינימיזציה - איסוף רק מה שצריך) ו-security.

רופא ישראלי השולח PHI ל-AI cloud צריך:

הסכמת מטופל

Data minimization (de-identify במידת האפשר)

Security סביר

מסלול ה-Enterprise של Anthropic מספק security סביר, אך הסכמה ספציפית עדיין נדרשת.

ISO 42001:2023 פורסם בדצמבר 2023. הדומיין: AI management systems

הדרישות:

AI risk management - זיהוי, הערכה ומיתון של סיכונים

AI lifecycle - design, deploy, monitor ו-decommission

Data governance - quality, lineage ו-consent

Transparency - explainability היכן שאפשר

Accountability - אחריות ברורה להחלטות AI

Performance monitoring

עבור enterprise customers - סימן למקצועיות

ב-procurement, ISO 42001 הופך לדרישה. Anthropic קיבלה הסמכה ב-6 בינואר 2025 (early adopter, הוסמכה על ידי Schellman Compliance). Microsoft, Google, AWS ו-OpenAI עמדו בתקן במהלך 2025

עבור קליניקות: רלוונטי כאשר רגולטורים או חברות ביטוח דורשים AI compliance. בישראל: עדיין לא נדרש, אך המגמה מגיעה

עבור שיתופי פעולה במחקר עם מוסדות אירופאים: צפוי יותר ויותר

הצעה: בעת בחירת ספק AI, יש לוודא הסמכת ISO 42001. זהו סימן ל-AI governance בוגר.

ISO 42001certificationgovernance
חוק הגנת הפרטיות 1981, תיקון 13 (2018) - תוקף בעיקר ב-2018.

העקרונות:

הסכמה מודעת

מטרה ספציפית

Minimization

Security

Accuracy

Retention

זכויות נושא המידע

עבור AI שמטפל ב-PHI - כל אלו חלים

השלכות:

הסכמה ספציפית, general consent אינו מספיק

Minimization - de-identify במידת האפשר

Security - הצפנה ב-rest וב-transit (מסלול Anthropic Enterprise מספק זאת)

Audit logs

Breach notification

לרופא בפועל:

יש להוסיף סעיף לטופס ההסכמה של המטופל בנוגע לעיבוד ב-AI

De-identify של clinical data לפני שליחה

שימוש במסלול Enterprise או on-premise עבור PHI

תיעוד שימוש ב-AI ב-record של המטופל

להישאר מעודכן, הרגולציה מתפתחת

ב-2026: רגולטור הגנת הפרטיות הישראלי טרם הוציא הנחיות ספציפיות ל-AI, אך ה-EU AI Act משפיע.

Israelprivacy lawחוק
ההכרזה של JPM26 התמקדה ב-Prior Authorization (אישור מראש מחברת ביטוח לטיפול/תרופה - אחד התהליכים האדמיניסטרטיביים הגדולים בארה״ב, מקור עיקרי ל-clinician burnout)

הזרימה המסורתית:

רופא מבקש טיפול/תרופה

עוזר/מזכירה ממלא טופס prior auth

הטופס נשלח ל-payer

reviewer ב-payer קורא את הבקשה (ידנית) ומחפש דרישות coverage ב-CMS או ב-policy פנימי

reviewer בודק קריטריונים מול תיק המטופל

determination (אישור/דחייה) חוזר לרופא

הזמן: שעות עד ימים. עיכוב טיפולי

הזרימה עם Claude for Healthcare:

Claude שולף את דרישות ה-coverage אוטומטית מ-CMS Coverage Database או מ-policies מותאמות

Claude בודק את ה-clinical criteria מול patient records (HIPAA-ready)

Claude מציע determination יחד עם supporting materials

reviewer אנושי מאשר או דוחה

הזמן: דקות. שיפור efficiency של פי 10-50

שותפי השקה:

Banner Health - מערכת בריאות גדולה

Novo Nordisk - חברת תרופות (סוכרת, השמנה)

AbbVie - חברת תרופות (Humira, Skyrizi)

Reuse בקליניקה דרמטולוגית: למרות ש-prior auth אינו מרכזי בישראל, יש מקבילה - אישורי ועדה (יותרת, סל בריאות מורחב). ה-pattern רלוונטי: אוטומציה של תהליך coverage-checking

גישה: דרך Claude Enterprise, חיובי הכרזת Anthropic באתר הרשמי

prior-authpayerJPM26
Enterprise:

יתרונות:

מודלים state-of-the-art

אין דרישת תשתית

BAA זמין

ISO 42001

חסרונות:

עלות (30-100$ ומעלה למשתמש לחודש)

הנתונים על cloud (גם עם BAA)

Vendor lock-in (תלות בספק - קושי לעבור)

שימוש מתאים: קליניקות עם צרכי AI עקביים

On-Premise (הרצה מקומית בארגון - לא בענן) (Llama 4, MedGemma, Mistral):

יתרונות:

שליטה מלאה בנתונים (PHI לא יוצא החוצה)

השקעה חד-פעמית

ללא תשלום שוטף למשתמש

ניתן להתאמה

חסרונות:

מודלים חלשים יותר

דרישת תשתית (שרת GPU מעל 10,000$)

נדרש ידע טכני

שימוש מתאים: privacy-critical, צוות טכני

Hybrid: ההגיוני ביותר. שימוש ב-Enterprise לעבודה כללית עם AI ושימוש ב-on-premise ל-PHI ברגישות גבוהה

דוגמה: תמונות ניתוח מוז - on-premise. חיפוש ספרות שוטף - cloud

בישראל ב-2026:

רוב הקליניקות העצמאיות - cloud Enterprise

בתי חולים גדולים - hybrid

מחקר אקדמי - cloud בדרך כלל מספק כאשר הנתונים de-identified

enterpriseon-premisechoice

💻 Claude Code - Agentic Coding

Claude Code הוא ה-CLI (Command Line Interface - ממשק מבוסס terminal/text) tool של Anthropic, שוחרר ב-2024 ועובר התפתחות מתמדת. הוא agentic (אוטונומי - מבצע משימות מורכבות) ולא רק chatbot.

ההבדל מ-GitHub Copilot: Copilot מבצע autocomplete (מציע את השורה הבאה תוך כדי הקלדה). Claude Code פועל על codebase שלם ומבצע שינויים מרובי-שלבים (קריאת קבצים, עריכה, הרצת בדיקות, debugging - ניפוי באגים).

הקלט: terminal command. הזרימה: הקלדת 'claude' ב-terminal פותחת session ב-codebase. המשתמש כותב משימה. Claude קורא את הקבצים הרלוונטיים, מתכנן שינויים, עורך קבצים, מריץ בדיקות ומדווח חזרה.

מה שמאפשר זאת:

Long context (1M tokens)

Tool use - קריאה וכתיבה לקבצים, הרצת bash commands (פקודות מערכת הפעלה), חיפוש

Project memory (CLAUDE.md - קובץ זיכרון לפרויקט)

Reasoning - תכנון מרובה-שלבים

Hooks (וו - חיבור פעולות אוטומטיות) לאוטומציה

שימושים מעבר ל-coding:

ניתוח מסמכים

עיבוד נתונים

אוטומציה (bash commands ו-file operations)

מחקר

ניהול פרויקטים

המסמך הזה נכתב באמצעות Claude Code.

הפיצ'רים מתפתחים:

MCP (Model Context Protocol - protocol של Anthropic ל-LLMs לחבר ל-tools חיצוניים)

Plugins - הרחבות שפותחו על ידי קהילה

Custom agents

Settings - permissions, hooks ו-env vars (משתני סביבה)

תמחור: Claude Pro/Team/Enterprise כוללים את Claude Code ללא תשלום נוסף. עבור מי שאינם מפתחים: Claude.ai web מספק. עבור מפתחים וחוקרים: Claude Code משנה את כללי המשחק.

בקליניקה: רוב הרופאים לא ישתמשו. רופאי מחקר שמכינים scripts (קבצי הוראות אוטומטיות) לניתוח נתונים - Claude Code יכול להחליף עבודת python שלמה.

דוגמה: 'קרא CSV של נתוני מטופלים, חשב סטטיסטיקה בסיסית והפק עקומת Kaplan-Meier ב-R script'. Claude Code מבצע זאת ב-2-3 דקות לעומת 1-2 שעות של coding ידני.

אך נדרשת תחושה בסיסית של עבודה עם קבצים ו-terminal.

דוגמאות שימוש:

ניתוח סטטיסטי - 'יש לי CSV עם 200 מטופלים ו-PASI scores בשבועות 0, 12, 24. חשב descriptive stats, paired t-test וצור גרף ב-R'. Claude מייצר R script, מריץ אותו ומציג פלט

ניתוח survival - '50 מטופלים עם מלנומה, נתוני time-to-event. צור Kaplan-Meier curves להשוואת שתי קבוצות והרץ log-rank test'

עיבוד תמונות - 'המר 100 תמונות דרמוסקופיה לגודל סטנדרטי 224x224 ושמור בתיקייה'

ניקוי נתונים - 'בקובץ Excel זה יש typos, ערכים חסרים ו-formats לא עקביים. נקה אותו ודווח על הבעיות'

הכנת מאמר - 'צור Table 1 (דמוגרפיה) מקובץ CSV זה בסגנון JAMA'

ספרות - 'קרא 20 PDFs בתיקייה, חלץ: study design, n, intervention, primary outcome ו-results. ייצא ל-CSV'

דרישות: נוחות עם terminal ועם file folders, נכונות ללמוד CLI בסיסי

ROI: שעות נחסכות לכל ניתוח, חודשים נחסכים לכל פרויקט

אזהרה: יש לאמת את ה-code של Claude על sample data לפני שימוש על נתונים אמיתיים.

researchdataanalysis
ChatGPT Code Interpreter (Advanced Data Analysis):

מבוסס web, sandbox מבודד

מעלים קבצי CSV ו-ChatGPT מריץ Python עליהם

הפלט: code, results ו-plots

הנתונים נמחקים בסיום ה-session

Claude Code:

Terminal-native

פועל על מערכת הקבצים שלך

קורא קבצים בתיקייה שלך, עורך אותם ומריץ commands

עובד באופן Persistent

ההבחנה: Code Interpreter = 'עבד על הקובץ ב-cloud'. Claude Code = 'עבד על הפרויקט שלי על המחשב שלי'

מתי Code Interpreter עדיף:

ניתוח חד-פעמי

אין צורך ב-persistence

העדפה ל-web interface

פחות טכני

מתי Claude Code עדיף:

פרויקט מתמשך

עבודה עם מספר קבצים

צורך להריץ commands

Developer workflow

לרוב הרופאים: Code Interpreter נגיש יותר. לרופאי מחקר מתקדמים: Claude Code מספק יותר ערך.

comparisonCode InterpreterClaude Code
שלב 1 (חמש דקות): התקנה. https://claude.ai/code. הורדת installer ל-Mac/Windows/Linux או 'npm install -g @anthropic-ai/claude-code'

שלב 2 (חמש דקות): authenticate. 'claude' ב-terminal. התחברות עם חשבון Claude Pro

שלב 3 (עשר דקות): הרצה ראשונה. פתח תיקייה של פרויקט. 'claude' פותח session. שאל: 'הסבר מה נמצא בתיקייה הזו'

שלב 4 (עשר דקות): נסה משימה. 'צור CSV של 100 מטופלי דרמטולוגיה fake עם עמודות ID, age, diagnosis ו-PASI'. Claude יבצע

השקעת זמן: 30 דקות עד שעה כדי להגיע לתחושת נוחות. לאחר מכן שימוש שוטף 1-2 פעמים בשבוע. ה-ROI מצטבר עם כל משימה שנחסכת

אופציה: הגדרת CLAUDE.md, קובץ זיכרון לפרויקט. ניתן להוסיף:

הערות workflow

פקודות נפוצות

מבנה הפרויקט

Learning curve: נמוך עבור משתמשים נוחים טכנית, בינוני לאחרים

מקורות:

תיעוד ב-docs.anthropic.com/claude-code

קהילה: r/Anthropic ו-X

getting-startedinstallbasic

📊 השוואה ל-GPT-5.5 ול-Gemini 3.1 Pro - מי הכי טוב?

שלושה frontier models מובילים ב-2026:

GPT-5.5 (OpenAI, 24 באפריל 2026)

Claude Opus 4.7 (Anthropic, 16 באפריל 2026)

Gemini 3.1 Pro (Google, 19 בפברואר 2026)

Context window:

GPT-5.5 - מעל 1M tokens (1,050,000), max output 128K

Claude Opus 4.7 - 1M tokens

Gemini 3.1 Pro - context גדול

תמחור (input/output למיליון tokens):

GPT-5.5 - 5$ / 30$ (פי 2 מ-GPT-5.4 שהיה ב-2.50$/15$). Pro Tier: 30$/180$. עבור prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output

Claude Opus 4.7 - 5$ / 25$

Gemini 3.1 Pro - 7$ / 21$

Benchmarks חדשים מהשקת GPT-5.5:

Terminal-Bench 2.0 (coding agentic, real-world workflows) - GPT-5.5 82.7%, Claude Opus 4.7 69.4%, GPT-5.4 75.1%. פער של 13+ נקודות לטובת GPT-5.5

FrontierMath Tiers 1-3 - GPT-5.5 51.7%, Claude Opus 4.7 43.8%

FrontierMath Tier 4 (הקשה ביותר) - GPT-5.5 35.4%, Claude Opus 4.7 22.9%, Gemini 3.1 Pro 16.7%

MRCR v2 (long-context, 1M tokens) - GPT-5.5 74.0% (קפיצה מ-36.6% ב-GPT-5.4)

SWE-bench Verified - Claude Opus 4.7 87.6% (מוביל)

יכולות לפי קטגוריה:

Coding ארוך-טווח (SWE-bench) - Claude Opus 4.7 מוביל

Coding agentic (Terminal-Bench 2.0) - GPT-5.5 מוביל בפער

Math/FrontierMath - GPT-5.5 מוביל בפער (במיוחד Tier 4)

כתיבה ו-long-form - Claude Opus 4.7 מוביל, GPT-5.5 קרוב

Multimodal - Gemini 3.1 Pro מוביל (טקסט, תמונה, וידאו ואודיו), GPT-5.5 חזק, Claude Opus 4.7 תומך בטקסט, תמונה ו-PDF בלבד

Multilingual (רב-לשוני) - Gemini 3.1 Pro מוביל, Claude Opus 4.7 השתפר

עברית - Gemini 3.1 Pro הכי טוב, Claude קרוב, GPT-5.5 בסוף

Real-time ואינטרנט - Gemini 3.1 Pro מוביל (אינטגרציה מובנית עם Google search)

Tool use ו-agentic - Claude Opus 4.7 יחד עם Claude Code הם המובילים בקוד ארוך-טווח, GPT-5.5 מוביל ב-terminal agentic

Safety ו-refusals (סירובי AI - מתי המודל מסרב לענות) - Claude בדרך כלל הזהיר ביותר

עמידות ל-hallucinations - Claude הטוב ביותר בטענות factuals

עבור medical use cases:

Literature synthesis - Claude הטוב ביותר (1M tokens context, ציטוטים זהירים)

Multi-document analysis - Claude

Coding למחקר - Claude Code משנה את כללי המשחק

Multimodal רפואי - Gemini 3.1 Pro ב-Vertex AI

עבודה קלינית בעברית - Gemini 3.1 Pro הכי טוב במעט

HIPAA-eligible / HIPAA-ready - כל השלושה (Claude for Healthcare מ-JPM26)

הבחירה: לרוב המשתמשים, כל אחד מהשלושה עובד.

יתרונות לפי מודל:

Claude - long context, זהירות, SWE-bench מוביל ו-Claude Code

GPT-5.5 - הפופולרי ביותר, ecosystem רחב, מוביל ב-Terminal-Bench וב-FrontierMath

Gemini 3.1 Pro - multimodal, multilingual ואינטגרציה עם Google

שאלה 1 - 'האם יש לי context ארוך (מעל 50K tokens)?'

אם כן - Claude Opus 4.7 (1M tokens) או Gemini 3.1 Pro

אם לא - כל מודל יתאים

שאלה 2 - 'האם אני עובד עם video או audio?'

אם כן - Gemini 3.1 Pro (multimodal הטוב ביותר)

אם לא - כל מודל יתאים

שאלה 3 - 'האם אני עושה coding?'

אם כן - Claude Opus 4.7 (SWE-bench הטוב ביותר) יחד עם Claude Code

אם לא - כל מודל יתאים

שאלה 4 - 'האם אני זקוק ל-reasoning המתקדם ביותר?'

אם כן - GPT-5.5 או Claude Opus 4.7 עם extended thinking (כולל רמת xhigh חדשה)

אם לא - כל מודל יתאים

שאלה 5 - 'האם התקציב מצומצם?'

אם כן - Llama 4 או Muse Spark (חינמי, open source) או Claude Opus 4.7 (ה-premium הזול ביותר ב-5$/25$ למיליון tokens)

אם לא - כל מודל יתאים

שאלה 6 - 'האם privacy קריטי?'

אם כן - מסלול Enterprise של אחד המודלים או on-premise (Llama 4, MedGemma)

אם לא - מסלול Pro

שאלה 7 - 'האם השפה הראשית עברית?'

אם כן - Gemini 3.1 Pro מוביל במעט, Claude קרוב

אם לא - כל מודל יתאים

בפועל: רוב הרופאים ישתמשו ב-1-2 כלים. Claude Opus 4.7 בשילוב Haiku 4.5 הזול מכסה כ-95% מהצרכים.

decision-treechoicemodel
תמחור מוצהר 2026:

Claude Opus 4.7 - 5$ למיליון input, 25$ למיליון output

GPT-5.5 - 5$ למיליון input, 30$ למיליון output (פי 2 מ-GPT-5.4 ב-2.50$/15$). GPT-5.5 Pro - 30$/180$. ה-effective cost גבוה ב-~20% מ-GPT-5.4 (אך 40% פחות tokens per task)

נשמע זול

בפועל - עלויות נסתרות:

Long context יקר - query של 1M tokens = 5$ ל-input בלבד. שימוש שוטף יוצא יקר

GPT-5.5 ב-prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output

Output יקר פי 5-6 מ-input. דוחות ארוכים יקרים

טוקניזציה (חיתוך טקסט ל-tokens) של עברית פי 3 = עלות אפקטיבית פי 3. 5$ באנגלית שווים ל-15$ בעברית. בנוסף, ב-Opus 4.7 הוצג טוקנייזר (האלגוריתם שחותך טקסט ל-tokens) חדש שמייצר עד 35% יותר tokens עבור אותו טקסט

שיחות multi-turn (רב-סבב) - כל הסבבים הקודמים נספרים שוב בכל סבב. 10 סבבים = סכום כל הסבבים הקודמים

Tools ו-agentic - כל tool call (קריאה לכלי חיצוני) = עוד tokens. משימות מרובות-שלבים יקרות

Cache discount 90% - רק כשיש cache hit

מסלולי subscription (Claude Pro 20$ לחודש) - שימוש 'unlimited' אך עם rate limit (מגבלת קצב שימוש)

Enterprise - תמחור מותאם של 30-100$ למשתמש לחודש

הערכה: קליניקה טיפוסית עם חמישה משתמשים ב-Claude Pro = 100$ לחודש. עם Enterprise = 250-500$ לחודש

חישוב ROI (Return on Investment - תשואה על השקעה): כמה זמן ה-AI חוסך. חיסכון של 10 שעות בחודש (צנוע) ב-100$ לשעה = ערך של 1,000$ מול עלות של 100$ = ROI של פי 10. החישוב פשוט.

pricingcostshidden
AMA Physician AI Survey 2026 (מרץ 2026):

81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023)

94% משתמשים או מתעניינים

76%+ מאמינים ש-AI משפר את הטיפול (מ-65% ב-2023)

ממוצע use cases - 2.3 לרופא (1.1 ב-2023)

70% רואים ב-AI כלי להפחתת burnout

Use cases מובילים (AMA 2026):

סיכומי מחקר רפואי וסטנדרטים של טיפול - 39%

הוראות שחרור, care plans ו-progress notes - 30%

Documentation של billing, charts ו-visit notes - 28%

Generation של chart summaries - 28%

AI scribes - 29%

Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151 רופאים, 15 specialties):

47% במרץ-אפריל 2025 → 63% בנובמבר 2025-ינואר 2026

74% מהמשתמשים - שימוש יומי לפחות

36% - מספר פעמים ביום

Top use case - חיפוש ספרות (35%, מ-22% ב-אפריל 2025)

Voice/scribes - 29% (מ-20%)

71% חששות ראשי - דיוק ו-reliability

העדפת כלים:

ChatGPT - 65%

Claude - 23%

Gemini - 18%

Copilot - 15%

בישראל (סקר informal, דרמטולוגים, n=85, מרץ 2026):

ChatGPT - 78%

Claude - 28%

Gemini - 35%

שימוש מועט יותר ב-Claude לעומת ארה״ב (ecosystem effect)

חששות שעלו:

Hallucinations (מקום ראשון)

פרטיות (שני)

עלות (שלישי)

איכות עברית (רביעי)

יתרונות שצוינו:

חיסכון בזמן וצמצום administrative burden

Drafts טובים יותר

שיפור work-life balance ו-job satisfaction

תקשורת קלה יותר עם מטופלים

המגמה: השימוש ב-AI גדל במהירות. ב-2023 היה 38% (AMA), ב-2026 הוא 81% (AMA). עד 2028 הוא צפוי לעבור 90%.

usageAMA-2026Doximity

🤔 האם זו באמת מהפכה? נתוני adoption ב-2026

נחזור לשאלת הכותרת - האם Claude (וה-AI בכלל) הוא באמת מהפכה ברפואה?

נתוני adoption (אימוץ - שיעור המשתמשים) ב-2026:

AMA Physician AI Survey 2026 (מרץ 2026) - 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023). 94% משתמשים או מתעניינים. 76%+ מאמינים ש-AI משפר טיפול (מ-65% ב-2023). 70% רואים ב-AI כלי להפחתת burnout.

Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151) - 63% adoption בנובמבר 2025-ינואר 2026 (עלייה מ-47% במרץ-אפריל 2025). 74% מהמשתמשים - שימוש יומי. 36% - מספר פעמים ביום.

סקר Clalit 2026 - כ-60% מהרופאים בישראל משתמשים ב-AI מדי שבוע

אך מה משמעות הדבר? Real impact: גם ב-2026, ה-AI:

אינו מאבחן באופן עצמאי

אינו מחליף דרמטולוגים

אינו משנה משמעותית את outcomes המטופלים

אינו מוטמע באופן רחב ב-EHR

אינו מפחית את עלויות המערכת

מה כן השתנה:

זמן ה-documentation ירד ב-30-60 דקות ביום (AI scribes - מתעתקי AI לפגישות מטופל)

Prior authorization - מ-Claude for Healthcare (JPM26): מהשעות לדקות

זמן חיפוש בספרות מהיר פי 10 (Top use case ב-Doximity 2026 - 35%)

מכתבי תקשורת למטופלים מהירים פי 5

גישה להוראה רפואית התרחבה

יעילות המחקר השתפרה

הוראת מתמחים - ה-AI מסייע

ההגדרה של 'מהפכה': בהיסטוריה הרפואית, מהפכות אמיתיות הן:

פניצילין (1928)

חיסונים

הרדמה

אנטיספסיס

MRI

השתלות אברים

Monoclonal antibodies

ה-AI ב-2026 אינו ברמה הזו. עדיין. אולי בעתיד.

אך מצד שני: ה-AI ב-2026 הוא מהפכת הפרודוקטיביות הגדולה ביותר מאז המחשב (שנות ה-80) והאינטרנט (שנות ה-90). חוסך זמן משמעותי, חיוני ל-research workflow, שיפר drafting ו-communication.

ברדיולוגיה - AI screen-reading קיבל אישור FDA. בדרמטולוגיה - AI image analysis מתפתח (DermaSensor קיבל אישור FDA ב-2024) אך עדיין אינו standard of care.

הצפי ל-2027-2030:

AI מוטמע יותר ב-EHR

Clinical decision support בזמן אמת

Patient triage עם AI

במקביל הרגולציה מתהדקת (EU AI Act 2026 enforcement - אכיפת חוק ה-AI האירופי)

השורה התחתונה: Anthropic (Claude for Healthcare), OpenAI (ChatGPT Health) ו-Google מחוללים מהפכה בכלים שהרופאים משתמשים בהם, אך אין מהפכה במקצוע עצמו. הוא נשאר human-driven. ה-AI מסייע, אינו מחליף.

שימוש ב-AI בדרמטולוגיה בארה״ב (סקר American Academy of Dermatology 2025, n=2,400): 71% משתמשים בכלי AI מדי שבוע, 35% מדי יום

כלים:

ChatGPT - 75%

Claude - 22%

Gemini - 18%

AI ייעודי לדרמטולוגיה - 12%

שימושים:

Documentation ו-scribe - 45%

תקשורת עם מטופלים - 38%

ספרות - 32%

DDx - 28%

חומרי הסברה למטופלים - 22%

Triage של תמונות - 8%

פריסת AI ייעודי לדרמטולוגיה:

SkinVision (CE marked - אישור התאמה אירופי) - אפליקציית מטופלים, מעל 2M משתמשים באירופה

DermaSensor (אישור FDA 2024)

AI scribes (Heidi, Augmedix) - 25% מקליניקות הדרמטולוגיה בארה״ב בפיילוט

ישראל: Clalit ומכבי מריצות פיילוטים בשנים 2024-2026 עם מספר משתמשים מצומצם בפועל

עתיד: AI image analysis בצמיחה, וכך גם teledermatology עם triage מבוסס AI

מגבלות:

המודלים אומנו רובם על עור בהיר ומתקשים בגוונים כהים יותר

אינם מתעדים היסטוריה והקשר קליני

הרגולציה של ה-FDA עדיין מתבגרת

הצפי: ב-2027-2028 ה-AI יהיה מוטמע יותר, אך לא יחליף את הרופא.

dermatologyadoptionnumbers
מחקרים על AI ו-clinical outcomes:

Wang 2024 (BMJ) - AI scribe הפחית זמן documentation ב-33%. האיכות נשמרה ו-burnout ירד, אך outcomes קליניים לא נמדדו

Hager et al. 2024 (Nature Medicine) - 'Evaluation and mitigation of the limitations of LLMs in clinical decision-making' - LLMs מובילים מאבחנים פחות טוב מרופאים, אינם עוקבים אחר הנחיות clinical, ואינם מפרשים תוצאות מעבדה

Smith 2025 (NEJM) - meta-analysis של 47 מחקרי clinical decision support מבוססי AI. שיפור מתון ב-metrics מסוימים (אבחון בזמן +8%), אך ללא השפעה משמעותית על mortality, readmission ו-complications

DermaSensor RCT (2024) - מכשיר נייד לזיהוי סרטן עור ב-primary care. Sensitivity 96%, specificity 73%. היה גורם ל-25% יותר ביופסיות אך תופס 96% מהמלנומות

מחקרי השוואה בין AI לדרמטולוג - בשנים 2017-2023 ה-AI השווה לדרמטולוג בתמונות מבודדות. במציאות (Han 2023): AI הגיע ל-73% דיוק על image set (מערך תמונות) חדש, דרמטולוג ל-85%. המציאות מאתגרת יותר

לסיכום: שיפורי efficiency מוכחים, שיפורי outcomes עם ראיות מוגבלות

הקריאה: ה-AI הוא כלי פרודוקטיביות אמיתי. ההשפעה הקלינית עדיין מתפתחת. אין למכור יתר על המידה למטופלים, ואין להמעיט בערכו מול עמיתים.

outcomesevidenceRCTs
השערות על AI ברפואה ב-2030:

השערה 1 (סבירה) - AI scribe יהפוך לסטנדרט. כל קליניקה בישראל ובארה״ב תשתמש ב-AI scribe ב-2030, עם חיסכון של מעל 80% בזמן ה-documentation

השערה 2 (סבירה) - Clinical decision support יהפוך ל-mainstream. הצעות AI בזמן אמת בתוך ה-EHR

השערה 3 (אפשרית) - AI image analysis יהפוך לכלי סטנדרטי. מכשירים ניידים ב-primary care

השערה 4 (לא סבירה) - אבחון AI עצמאי. לא סביר עד 2030 בשל רגולציה, אחריות משפטית, קבלת המטופלים ו-edge cases

השערה 5 (לא ודאית) - AI במחקר. אוטומציה רחבה של SR. עיצוב ניסויים קליניים מסייע ב-AI. סביר שכן

סוגיות בוערות לקראת 2030:

רגולציה (EU AI Act ייושם במלואו, ארה״ב בעקבותיה)

מסגרות אחריות משפטית

Reimbursement (כיסוי ביטוחי לכלי AI)

כוח אדם

השורה התחתונה: ה-AI הוא כלי augmentation. דרמטולוגים ב-2030 עדיין חיוניים. ה-workflow ישתנה משמעותית, אך שיקול הדעת, התקשורת והמיומנויות הפרוצדורליות יישארו ליבה אנושית.

future2030predictions

Take-aways לדרמטולוג בישראל ב-2026

Claude - מהפכה או אבולוציה? תשובה כנה: אבולוציה משמעותית, לא מהפכה.

ההבדל מתקופת pre-2022 ChatGPT era: בעבר ה-AI היה כלי למומחים, כיום הוא mainstream tool. אך הוא אינו משנה את ה-fundamentals של עבודת הדרמטולוג.

היכן Claude בולט:

Long-form analysis בזכות 1M tokens context

Coding - Claude Code משנה את כללי המשחק בניתוח נתוני מחקר

Safety - Constitutional AI

תמחור - 5$/25$ למיליון tokens, הזול ביותר בקטגוריית premium

עברית - שיפור משמעותי

Enterprise - HIPAA ו-ISO 42001 ready

היכן Claude אינו בולט:

Multimodal - GPT-5.5 ו-Gemini 3.1 Pro חזקים

Real-time ואינטרנט - native טוב יותר ב-Gemini

Ecosystem (סביבת כלים והרחבות) ו-plugins - ל-GPT-5.5 יש יותר

Brand recognition - ChatGPT הוא ה-brand הצרכני

לרופא בישראל ב-2026: יש לבחור על בסיס use case ולא נאמנות.

Stack מעשי:

NotebookLM (חינמי)

Claude Pro או ChatGPT Plus (20$ לחודש)

אולי גם Gemini Pro (חינמי עם Google One במחיר נמוך לחודש)

סך הכול כ-22$ לחודש

המיצוב הייחודי של Claude: long context, safety ו-coding הופכים אותו לכלי של חוקרים. עבור עבודה קלינית טהורה כל frontier model יעבוד דומה.

מחשבה מסכמת: אוריינות AI הופכת לחלק מהכשירות של רופא. בבתי הספר לרפואה החל מ-2030 ילמדו prompt engineering (אומנות כתיבת ההוראות ל-AI). CME credits עבור קורסי AI. ייתכן ש-accreditation (תהליך הסמכה רשמי) ידרוש כשירות AI בסיסית.

הצעדים:

הירשמו לפחות לכלי AI מתקדם אחד (20$ לחודש)

הקדישו 30 דקות ביום במשך 30 יום

פתחו workflow אישי

הישארו מעודכנים

גלו את השימוש כשנדרש

שמרו על חשיבה ביקורתית

ה-AI כאן כדי להישאר. צריך לאמץ אותו.

שבוע 1 - Foundation:

יום 1 - רישום ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus ורישום ל-NotebookLM (חינמי)

ימים 2-3 - תרגול שאלות בסיסיות

ימים 4-7 - ניסיון use case ספציפי - drafting של מכתב הפניה או סיכום מאמר עדכני

שבוע 2 - Workflow:

ימים 8-10 - שילוב בשגרה היומית. AI למשימה אחת לפחות ביום

ימים 11-14 - פרויקט NotebookLM - העלאת 5-10 מאמרים בנושא נבחר

שבוע 3 - Optimization:

ימים 15-18 - בניית prompt library

ימים 19-21 - בדיקת כלים נוספים (Perplexity לחיפוש, Consensus לראיות)

שבוע 4 - Review:

ימים 22-25 - הערכת הזמן שנחסך. אומדן וכימות

ימים 26-28 - זיהוי כאבים מתמשכים

ימים 29-30 - תכנון 90 הימים הבאים

השאלה המרכזית: לאחר 30 יום, האם אתה חוסך זמן? אם כן - להמשיך. אם לא - לבחון מחדש את הגישה. רוב המשתמשים אינם רואים את התועלת המלאה לפני 60-90 יום, ההתמדה משתלמת.

action-plan30-daysintegration
מלכודות נפוצות:

אמון יתר ב-AI - דוגמה: ה-AI מצטט 'מחקר X הראה 75% efficacy' מבלי שתאמת, והמחקר אינו קיים. הפתרון: לאמת תמיד

אי-גילוי שימוש ב-AI - ההשלכות: בעיות אתיות וסיכון retraction (משיכת מאמר שפורסם) בעת חשיפה. הפתרון: לגלות את השימוש במאמרי מחקר ובאינטראקציות עם מטופלים כשרלוונטי

שליחת PHI ל-consumer tier (מסלול צרכני - לא ארגוני) - הפרה של חוק הגנת הפרטיות בישראל. הפתרון: de-identify לפני השליחה או שימוש במסלול Enterprise

אינטראקציות מטופל מומצאות - ה-AI 'זוכר' שמטופל X אמר משהו, אך מדובר בהמצאה. הפתרון: AI scribes שמקליטים אודיו, אמינים יותר

הפיכה לתלוי מדי ב-AI ושכחה לחשוב באופן ביקורתי - הפתרון: לשמור על שיקול דעת קליני כראשי

ריבוי כלים - ניסיון להשתמש ב-ChatGPT, Claude, Gemini ובחמישה כלים נוספים. מציף את המשתמש. הפתרון: להישאר עם 2-3 כלים לכל היותר

בעיות עברית מבלי לשים לב - ה-AI מתרגם מילולית ושמות תרופות מתעוותים. הפתרון: לסקור בקפידה

פלטים גנריים - טקסט שמרגיש 'AI'. הפתרון: לערוך, לתת אופי אישי ולהוסיף את הקול שלך. ה-AI הוא נקודת התחלה

pitfallsmistakesavoid
פעולות קונקרטיות לדרמטולוג ב-2026:

הירשם ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus. כלי אחד, התחל. אחרי חודש תרגיש את ההבדל

הוסף את NotebookLM (חינמי) לעבודה עם ספרות ול-deep dives. משלים את הכלי הראשי

הקצב 30 דקות ביום במשך חודש. שילוב לוקח זמן, אל תצפה לקסם מיידי

הכר את HIPAA ואת חוק הגנת הפרטיות. אין לשלוח PHI ל-consumer tiers. בצע de-identify או השתמש במסלול Enterprise

שמור על חשיבה ביקורתית. לאמת תמיד את פלטי ה-AI, במיוחד ציטוטים, מספרים, מינוני תרופות והחלטות קליניות

גלה את השימוש כשנדרש. גילוי במחקר, שקיפות מול המטופל כאשר רלוונטי. הנחיות ICMJE (International Committee of Medical Journal Editors - הועדה הבינלאומית של עורכי כתבי עת רפואיים) 2024 קובעות את הרף

הישאר מעודכן. ה-AI משתנה מדי חודש. עקוב אחר @AnthropicAI, @OpenAI ומובילי AI בדרמטולוגיה ב-X. חמש דקות ביום

Workflow עברי - צפה לבעיות. שילוב של אנגלית ועברית פעמים רבות הוא הטוב ביותר. אמת את הפלט בעברית

אל תשווה את עצמך לעמיתים יתר על המידה. כל אחד מאמץ בקצב שלו. ה-learning curve אמיתי

בנה את ה-workflow לאורך שנים. עד 2030 ה-AI יהיה חיוני לעבודה. התחלה עכשיו ממקמת אותך בקדמת הבמה

takeawaysaction2026
🔑

שורה תחתונה

Claude (ו-Anthropic בכלל) הוא אבולוציה משמעותית, לא מהפכה. Anthropic נוסדה ב-2021 על ידי חוקרים שעזבו את OpenAI, ומתמקדת ב-AI safety וב-Constitutional AI. שווי 380 מיליארד דולר לאחר Series G של פברואר 2026 (revenue run-rate מעל 30 מיליארד דולר). Claude for Healthcare הושק ב-12 בינואר 2026 ב-JPM26 - HIPAA-ready Enterprise, אינטגרציות ל-CMS/ICD-10/PubMed, prior authorization מהשעות לדקות. Claude Opus 4.7 (16 באפריל 2026) הוא frontier model - 1M tokens context, multimodal, SWE-bench 87.6%, 5 דולר למיליון input ו-25 דולר למיליון output (output זול יותר מ-GPT-5.5 שעלה ל-5$/30$). ב-SWE-bench וב-long-form analysis Claude מוביל. GPT-5.5 מוביל ב-Terminal-Bench 2.0 (82.7% מול 69.4%) וב-FrontierMath Tier 4. ב-multimodal וב-multilingual - Gemini 3.1 Pro מוביל. ב-ecosystem וב-plugins - GPT-5.5 מוביל. Claude Code הופך את Claude לייחודי עבור מפתחים וחוקרים. Constitutional AI הופך את Claude לבטוח יותר באופן כללי. HIPAA-ready (במסלול Enterprise), מוסמך ISO 42001 מ-6 בינואר 2025 (מהראשונות בין frontier AI labs). בעברית - שיפור משמעותי, עדיין מעט מאחורי האנגלית. AMA 2026: 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-2023).

הכיוון לדרמטולוג בישראל ב-2026: Claude הוא אופציה מצוינת, במיוחד לעבודת מחקר וספרות. כך גם GPT-5.5 וכך גם Gemini 3.1 Pro. כולם עובדים. יש לבחור על בסיס use case ולא נאמנות. Stack מעשי: NotebookLM (חינמי) יחד עם Claude Pro או ChatGPT Plus (20 דולר לחודש) מכסים 95% מהצרכים בעלות של 20 דולר לחודש. ה-AI הוא כלי שמעצים את העבודה. עד 2030 הוא צפוי להפוך לחיוני בעבודת הרופא. אוריינות AI הופכת לכישור של רופא. ה'מהפכה' אינה רופאי AI אוטונומיים, אלא כלי פרודוקטיביות שחוסכים 30-60 דקות ביום על documentation, מהירות פי 10 בספרות ופי 5 ב-drafting. תועלת אמיתית. השפעה אמיתית. פחות ממה שה-hype מבטיח, יותר ממה שהסקפטים מודים. יש לאמץ בפרגמטיות.

📋 פרטי מקור ומחבר

מאת: ד"ר יהונתן קפלן

מומחה ברפואת עור ומין | מנתח מוז (FACMS)

📅 פורסם: 1.5.2026🔄 עודכן: 1.5.2026

מבוסס על:

Constitutional AI: Harmlessness from AI Feedback

Bai Y, Kadavath S, Kundu S, et al.

arXiv, 2022

הערת עריכה: תוכן זה נכתב ונערך על ידי ד"ר יהונתן קפלן ומבוסס על המאמר המקורי.

אין להסתמך על תוכן זה ללא קריאת המקור המלא.