arXiv · 2022Anthropic

Claude - The New Revolution או רק Hype נוסף?
סקירה מקיפה של Anthropic ו-Claude Opus 4.7: Constitutional AI, 1M tokens context (אורך הטקסט שהמודל קורא בבת אחת), HIPAA Enterprise, Claude Code, והשוואה ל-GPT-5.5 ול-Gemini 3.1 Pro

Constitutional AI: Harmlessness from AI Feedback

✍️ Bai Y, Kadavath S, Kundu S, et al.

📋 תמונה רחבהClaude - The New Revolution או רק Hype נוסף?

🎯 בקצרה: על מה מדובר?

Deep Dive זה סוקר את Anthropic ואת Claude Opus 4.7 ובוחן האם מדובר במהפכה אמיתית או באבולוציה. נסקור את הסיפור של החברה (נוסדה ב-2021 על ידי חוקרים שעזבו את OpenAI, גייסה למעלה מ-30 מיליארד דולר ב-Series G של פברואר 2026 בשווי 380 מיליארד דולר), את Constitutional AI (השיטה הייחודית של Anthropic), ואת Claude Opus 4.7 (16 באפריל 2026): 1M tokens context, multimodal (מבין טקסט ותמונות), SWE-bench 87.6% (מבחן 500 בעיות coding אמיתיות מ-GitHub), ותמחור של 5 דולר למיליון input ו-25 דולר למיליון output. נכסה את Claude for Healthcare (הושק ב-12 בינואר 2026 ב-JPMorgan Healthcare Conference - HIPAA-ready Enterprise, אינטגרציות native ל-CMS Coverage Database, ICD-10 ו-PubMed, prior authorization מהשעות לדקות, חיבור ל-Apple Health ו-Android Health Connect), את Claude Code (כלי agentic מבוסס terminal לכתיבת קוד), ואת ההשוואה ל-GPT-5.5 (24 באפריל 2026, $5/$30 למיליון tokens) ול-Gemini 3.1 Pro. נבחן את שאלת המהפכה: 81% מהרופאים בארה״ב משתמשים ב-AI ב-2026 (AMA Survey, מרץ 2026, כפול מ-38% ב-2023), 63% ב-Doximity (עלייה מ-47% במרץ 2025). מקצוע הרפואה משתנה - ה-AI הוא מהפכת הפרודוקטיביות הגדולה ביותר מאז המחשב והאינטרנט. בסיום: חמש מסקנות מעשיות לדרמטולוג ישראלי, stack בעלות של 30-100 דולר לחודש, ואוריינות AI ההופכת לכישור ליבה.

📜

1M tokens

Context window של Claude Opus 4.7 (אורך קלט)

💻

87.6%

דיוק על SWE-bench Verified (מבחן coding)

🩺

90%

דיוק על MedQA (1,273 שאלות USMLE-style)

💰

5$/25$

מחיר למיליון tokens (input/output)

💵

380 מיליארד דולר

שווי Anthropic (Series G פברואר 2026)

💡 מה חייבים לזכור מהמאמר הזה

🏢Anthropic נוסדה ב-2021 על ידי האחים Dario ו-Daniela Amodei (לשעבר ב-OpenAI). מתמקדת ב-AI safety. הבדל מובהק מ-OpenAI: שימוש ב-Constitutional AI במקום RLHF (אימון תוך משוב אנושי - בני אדם מדרגים תשובות) בלבד. השקעה כוללת של למעלה מ-30 מיליארד דולר (Google, Amazon, Salesforce, GIC, Coatue ועוד), שווי 380 מיליארד דולר נכון לפברואר 2026.

🚀Claude Opus 4.7 (16 באפריל 2026): 1M tokens context window, multimodal, 87.6% ב-SWE-bench Verified, 90% ב-MedQA. הטוב ביותר ב-coding ארוך-טווח ובכתיבה ארוכה. תמחור 5 דולר למיליון input ו-25 דולר למיליון output (זול יותר מ-GPT-5.5 ב-output: 5$/30$). GPT-5.5 מוביל ב-Terminal-Bench 2.0 (82.7% מול 69.4%) וב-FrontierMath Tier 4 (35.4% מול 22.9%). זמין ב-API, ב-Amazon Bedrock, ב-Vertex AI וב-Microsoft Foundry.

📜Constitutional AI: שיטה שבה עקרונות ה-constitution כתובים בטקסט, וה-AI שופט תשובות לפיהם. שילוב של RLHF ו-RLAIF (RL from AI Feedback - AI מבקר AI - גרסת Anthropic). התוצאה: AI בטוח יותר עם פחות harmful outputs (פלטים מזיקים).

🏥Claude for Healthcare (JPMorgan Healthcare Conference, 12 בינואר 2026): HIPAA-ready Enterprise, BAA זמין, מוסמך ISO 42001 (מ-6 בינואר 2025). אינטגרציות native: CMS Coverage Database, ICD-10, PubMed. Use case מרכזי: prior authorization מהשעות לדקות. צרכנים: חיבור ל-HealthEx, Apple Health ו-Android Health Connect. שותפים: Banner Health, Novo Nordisk, AbbVie. מסלול Team אינו כולל HIPAA, חשוב לזכור.

💻Claude Code: כלי agentic coding מבוסס terminal. שונה מ-GitHub Copilot (כלי autocomplete של GitHub/Microsoft - השלמה אוטומטית של שורת קוד) בכך שהוא פועל על codebase (כל קבצי הקוד של פרויקט) שלם ומבצע שינויים מרובי-שלבים. כלול ב-Pro/Team/Enterprise. עבור ניתוח נתונים במחקר זהו כלי שמשנה את כללי המשחק.

⚖️בקליניקה: Claude Opus 4.7 הוא הטוב ביותר לניתוח long-form (טקסט ארוך - literature synthesis, ניתוח מקרים מורכבים), אך ביצועי MedQA דומים ל-GPT-5.5. הבחירה תלויה בהקשר השימוש ולא ב-benchmark (מבחן השוואתי) בלבד.

🏢 Anthropic - הסיפור של החברה

Anthropic נוסדה ביולי 2021 על ידי שבעה חוקרים שעזבו את OpenAI:

•Dario Amodei (CEO, לשעבר VP of Research ב-OpenAI)

•Daniela Amodei (President)

•Tom Brown (לשעבר אחד המחברים של GPT-3 paper)

•Sam McCandlish

•Jack Clark

•Jared Kaplan (שכתב את ה-Scaling Laws paper)

•ואחרים

הסיבה לעזיבה: חילוקי דעות לגבי כיוון החברה. OpenAI החלה להתמסחר באגרסיביות (עסקה עם Microsoft ב-2019), ומייסדי Anthropic רצו התמקדות חזקה יותר ב-AI safety.

סבבי גיוס:

•Series A - 124M$ (גיוס ראשון)

•Series B - 580M$ ב-2022 מ-FTX (הוחזרו לאחר קריסת FTX)

•2023 - Google (החל מ-300M$ ועד 2B$), Spark Capital, Salesforce

•2024 - Amazon השקיעה 4B$

•Series F - 13B$ בספטמבר 2025 בשווי 183B$

•Series G - 30B$ בפברואר 2026 בשווי 380B$ (בהובלת GIC ו-Coatue)

•סבב פוטנציאלי נוסף - לפי TechCrunch ו-Bloomberg מאפריל 2026, עד 50B$ בשווי 850-900B$

ה-revenue run-rate (קצב הכנסות שנתי משוערך) צמח מכ-1B$ בדצמבר 2024 ליותר מ-30B$ באפריל 2026. הצוות גדל משבעה עובדים ליותר מ-1,000. המטה ב-San Francisco.

עובדים בולטים: Jan Leike (עזב את OpenAI ב-2024 בעקבות חששות safety והצטרף ל-Anthropic).

מבנה החברה: PBC (Public Benefit Corporation - מבנה תאגידי מאוזן בין רווחיות לתועלת ציבורית).

גלגול גרסאות Claude:

•Claude 1 (מרץ 2023)

•Claude 2 (יולי 2023)

•Claude 3 (מרץ 2024)

•Claude 3.5 (יוני ואוקטובר 2024)

•Claude 4 (מאי 2025)

•Claude Sonnet 4.5 (29 בספטמבר 2025, הצגת 1M tokens context ב-beta)

•Claude 4.6 (ינואר 2026, 1M tokens context ב-GA)

•Claude Opus 4.7 (16 באפריל 2026)

הגישה: שחרור מהיר של שיפורים. ב-2026 Anthropic מתחרה ראש בראש מול OpenAI מבחינת revenue (run-rate של מעל 30B$ עבור שתיהן), ומובילה ב-enterprise וב-safety.

OpenAI:

•נוסדה ב-2015 על ידי Sam Altman ו-Elon Musk

•בתחילה עמותה ללא מטרת רווח, ב-2019 עברה ל-capped-profit (רווח מוגבל - תקרה לתשואה למשקיעים)

•המשימה: AGI (Artificial General Intelligence - AI ברמת אדם בכל תחום) לטובת האנושות

•בפועל: מסחור אגרסיבי, שותפויות (Microsoft 2019, מעל 13B$)

•הגישה: 'ship fast, iterate'

•עזיבות בולטות: מייסדי Anthropic ב-2021, Jan Leike ב-2024 (בעקבות safety concerns), משבר ה-board ב-2023

Anthropic:

•נוסדה ב-2021, מבנה PBC

•המשימה: AI safety ו-frontier research

•בפועל: גישה מתודית, safety-first

•הגישה: 'responsible scaling' (Responsible Scaling Policy - מסמך של Anthropic, 5 רמות בטיחות AI)

•גיוסים בולטים: צוות ה-safety של OpenAI לשעבר

•דגש על Constitutional AI, מסחור איטי יותר

שתי החברות מתחרות. ה-revenue run-rate שלהן ב-2026 דומה (מעל 30B$). Anthropic מובילה ב-enterprise וב-safety; OpenAI מובילה ב-consumer וב-brand recognition

למשתמש: הבחירה תלויה בערכים. אם safety חשוב, Anthropic מתאימה. אם דרושים cutting-edge features, OpenAI לעיתים מובילה. איכות מודלי הבסיס דומה.

AnthropicOpenAIculture

RLHF סטנדרטי (הגישה של OpenAI): ה-AI מייצר תשובות, בני אדם מדרגים אותן, והמודל מתאמן על הדירוגים. הבעיה: סקיילביליות - human feedback (משוב אנושי) יקר

Anthropic Constitutional AI (Bai et al., 2022) - השלבים:

•הגדרת 'constitution' - טקסט עקרונות (helpful, harmless, honest)

•ה-AI מייצר תשובות

•AI נוסף מבקר: 'האם התשובה הזו עומדת ב-constitution?'

•ה-AI מתקן על בסיס הביקורת

•Reinforcement learning (אימון מבוסס תגמול) על התשובות המתוקנות (RLAIF - RL from AI Feedback)

יתרונות:

•ניתן ל-scaling (התרחבות לקנה מידה גדול - ללא human bottleneck (צוואר בקבוק אנושי))

•שקיפות (constitution גלוי)

•אופי iterative (מחזורי, חוזר על עצמו עם שיפורים)

רכיבי ה-constitution:

•UN Declaration of Human Rights

•עקרונות מ-Apple terms of service

•ערכי Anthropic

•הנחיות התנהגות

התוצאה: Claude נוטה פחות לייצר harmful outputs ממודלים שאומנו ב-RLHF בלבד.

דוגמאות:

•עמידות גבוהה יותר ל-jailbreaks (ניסיונות לעקוף את הגבלות הבטיחות)

•הסתייגות במקום הנכון

•הסבר על חוסר ודאות

Trade-off: לעיתים over-cautious (זהיר מדי). Anthropic שיפרה זאת החל מ-Claude 3

בקליניקה: הנטייה של Claude להסתייג ולהסביר חוסר ודאות מהווה יתרון בעבודה רפואית.

Constitutional AIsafetyRLAIF

Claude 1 (מרץ 2023): 100K tokens context, צ'אט בסיסי

Claude 2 (יולי 2023): 100K tokens context. שיפור ב-instruction-following (יכולת ביצוע הוראות)

Claude 3 (מרץ 2024): 200K tokens context. שלושה גדלים - Haiku, Sonnet, Opus. Multimodal (טקסט ו-vision)

Claude 3.5 Sonnet (יוני 2024): טוב יותר מ-Opus 3 במשימות רבות, וזול יותר

Claude 3.5 Opus (אוקטובר 2024): טופ-של-הליין. SWE-bench 49% (היה המוביל)

Claude 4 (מאי 2025): SWE-bench 65%

Claude Sonnet 4.5 (29 בספטמבר 2025): הצגת 1M tokens context (ב-beta - גרסת בדיקה ציבורית). SWE-bench 80%

Claude 4.6 (ינואר 2026): 1M tokens context ב-GA (General Availability - זמינות מלאה לכלל הציבור), SWE-bench 85%, עדכוני safety

Claude Opus 4.7 (16 באפריל 2026):

•SWE-bench 87.6% Verified, 64.3% Pro (גרסה קשה יותר - 200 בעיות)

•1M tokens context כברירת מחדל

•עמידות טובה יותר ל-hallucinations (המצאות של ה-AI - מידע שגוי שנשמע אמין)

•שיפור משמעותי ב-multilingual (כולל עברית), ב-vision וב-output verification (המודל בודק את הפלט שלו לפני שמדווח)

•רמת מאמץ חדשה xhigh (רמה חדשה - בין high ל-max)

•תמחור: 5$ למיליון input ו-25$ למיליון output

הקצב: שיפורים כל 3-6 חודשים, כל אחד מהם משמעותי. האסטרטגיה: לא לחכות לגרסה מושלמת אלא להשתמש ב-stable העדכני ביותר.

timelineClaudeevolution

🚀 Claude Opus 4.7 - היכולות והמגבלות

Claude Opus 4.7 שוחרר ב-16 באפריל 2026. מהו המודל? Frontier model (המודל הכי מתקדם של החברה) של Anthropic, יורשו של Claude Opus 4.6 (ינואר 2026).

תכונות:

•1M tokens context window (כ-1,500 עמודי A4 או 750,000 מילים)

•Multimodal - מקבל טקסט, תמונות (ברזולוציה גבוהה יותר מקודמיו) ו-PDF

•הפקת טקסט עד 8K tokens (במצב extended thinking (מצב בו המודל חושב לפני התשובה): עד 32K reasoning ו-8K output)

•רמת מאמץ חדשה xhigh (בין high ל-max)

•Output verification לפני דיווח

•ביצועים משופרים במשימות long-running (משימות שדורשות זמן ושלבים מרובים)

הנתיב מטפס לקראת מודל לא משוחרר בשם Mythos (מודל לא-משוחרר של Anthropic - הדור הבא).

Benchmarks (מבחנים השוואתיים):

•SWE-bench Verified - 87.6%

•SWE-bench Pro - 64.3% (state-of-the-art ב-coding - הטוב ביותר היום)

•MMLU - 90.5% (Massive Multitask Language Understanding - מבחן רב-תחומי)

•MedQA - 90% (ללא medical fine-tuning - אימון נוסף ייעודי לרפואה)

•Math AIME 2024 - 87% (תחרות מתמטיקה אמריקאית)

•Context retrieval (Needle in haystack - מבחן: למצוא פיסת מידע ב-context ארוך) - מעל 99.5% לאורך כל ה-context

•Multilingual עברית - שיפור משמעותי מ-Claude 4 (כ-10 נקודות אחוז), אך עדיין מעט מאחורי האנגלית

תמחור וזמינות:

•5$ למיליון input tokens

•25$ למיליון output tokens (זהה ל-Opus 4.6)

•Caching (שמירת שאלות חוזרות ב-cache - מהיר וזול יותר) - 90% הנחה ב-cache reads

•Batch API (שליחת מספר שאלות בבת אחת - הנחה 50%) - 50% הנחה

•זמין ב-Claude products, ב-API, ב-Amazon Bedrock, ב-Google Cloud Vertex AI וב-Microsoft Foundry

שימושים מתאימים:

•Long-form analysis - מושלם ל-SR ולניתוח מאמרים מלאים

•Coding - top-tier ב-SWE-bench

•Reasoning (חשיבה לוגית/הסקה) - מצב thinking לבעיות מורכבות

•כתיבה יצירתית

•Multimodal - קריאת CXR, ECG, תמונות דרמטולוגיה ו-pathology slides

•Agentic - tool use (יכולת ה-AI לקרוא לפונקציות חיצוניות), תכניות מרובות-שלבים

מגבלות:

•Hallucinations עדיין 5-15% בטענות factuals (טענות עובדתיות)

•עברית השתפרה משמעותית אך אינה מושלמת

•Knowledge cutoff (התאריך עד אליו המודל יודע מידע): ינואר 2026

•Real-time (גישה לאינטרנט בזמן אמת): אין גישה לאינטרנט כברירת מחדל

•Latency (זמן תגובה): מצב extended thinking 30-90 שניות

•אינו מייצר תמונות

•אין voice mode מובנה

שימושים ייחודיים:

•קריאת ספר לימוד שלם (Bolognia, 4,000 עמודים) ושאלת שאלות עליו

•ניתוח 100 מאמרים ב-query (שאילתה - שאלה למודל) יחיד - 'מהו ה-consensus על dupilumab ב-BP במאמרים אלו?'

•Code: סקירת codebase בינוני (50K-200K שורות) והצעת refactoring (שיפור מבנה הקוד)

•ניתוח מטופלים: 10 שנים של EHR notes (במסלול Enterprise, HIPAA-compliant) ושאלת שאלות

•פרוטוקול ארוך: SAP של 47 עמודים בניסוי קליני, איתור סטיות

•סינתזת מסמכים: case יחד עם חמישה מאמרי review, הנחיות וההערות שלי, להפקת draft של discussion

עלות:

•1 מיליון tokens במחיר 5$ ל-query בעת שימוש ב-long context

•עם cache discount העלות יורדת ל-0.50$ כש-cache hit (פגיעה במטמון - שאלה דומה שכבר נשמרה)

•עבור שימוש רוטיני זה יקר מדי

•עבור משימות בעלות value גבוה זה משתלם

השוואה:

•GPT-5.5 - 256K tokens context בלבד

•Gemini 3.1 Pro - context גדול אך חלש מעט יותר ב-synthesis (סינתזה - חיבור מידע ממקורות שונים)

•Claude Opus 4.7 - ה-sweet spot לעבודה long-form

1Mcontextuse-cases

החל מ-Claude 3 המודלים multimodal: מקבלים תמונות וטקסט. ב-Claude Opus 4.7 ה-visual reasoning (חשיבה ויזואלית - הבנת תמונות) השתפר משמעותית

משימות אפשריות:

•קריאת X-ray ותיאור הממצאים

•פרשנות ECG

•הסתכלות על תמונת דרמטולוגיה והצעת DDx

•קריאת תמונת pathology slide

•הפקת נתונים מגרף או טבלה

דיוק (תלוי במשימה):

•תמונות גנריות - מדויק מאוד

•תמונות רפואיות - משתנה

•דרמטולוגיה - 60-75% דיוק ב-DDx (נמוך מדרמטולוג)

•דרמוסקופיה - פחות מדויק, לא מותאם אופטימלית

•פתולוגיה - פרשנות שטחית

השוואה: Med-Gemini עבר fine-tuning (אימון נוסף ייעודי) ייעודי לתמונות רפואיות, ולכן מדויק יותר בתחומים אלה

עבור clinical decision support: יש להשתמש כקלט אחד מתוך רבים, לא כסמכות. עבור הוראה: שימושי - 'תאר את מאפייני הנגע', 'מהן ה-differential diagnoses'

שימושים פרקטיים:

•מטופל ששולח תמונה ב-WhatsApp - triage מהיר עם Claude

•הערכה לקראת הביקור

•הוראת מתמחים

אזהרה: HIPAA - אין לשלוח תמונות מזהות של מטופלים ללא de-identification (הסרת פרטים מזהים מתיק רפואי) נכון ובלי שימוש במסלול Enterprise.

multimodalimagesmedical

Extended thinking: המודל מייצר reasoning trace (שרשרת חשיבה גלויה) (עד 32K tokens) לפני התשובה. דומה ל-OpenAI o-series ול-DeepSeek R1

הפעלה:

•API parameter 'extended_thinking: true'

•ב-Claude.ai: thinking toggle

•ב-Opus 4.7 קיימת רמת מאמץ חדשה xhigh (בין high ל-max)

עלות: פי 5-10 מהרגיל. Latency: 30-90 שניות

מתי זה עוזר:

•Math או statistics מורכבים

•Multi-step clinical reasoning - ניתוח מקרה מורכב

•באגים ב-coding שדורשים ניתוח עמוק

•חידות לוגיות

•Differential diagnoses קשים

מתי לא:

•בירורי עובדה פשוטים

•תרגום

•סיכום של טקסט קצר

•כתיבה יצירתית

•שיחה רגילה

דוגמה רפואית: case מורכב עם 10 חריגות במעבדה, ריבוי תרופות וחשד ל-polypharmacy יחד עם autoimmune ו-drug-induced. ללא extended thinking - תשובה שטחית. עם extended thinking - reasoning מובנה: תיעדוף, שקילת ראיות והצעת workup

עלות מול תועלת:

•Query רגיל - 0.10-0.50$

•עם thinking - 0.50-3.00$

•עבור high-stakes case זה משתלם, עבור משימה רוטינית - לא

thinkingreasoningcost

🏥 Claude for Healthcare - JPM26, HIPAA, ISO 42001

ב-12 בינואר 2026, בכנס JPMorgan Healthcare Conference (JPM26), Anthropic השיקה את Claude for Healthcare (במקביל ל-OpenAI שהשיקה ChatGPT Health). זוהי ההכרזה הגדולה של Anthropic ב-healthcare ב-2026.

מה Claude for Healthcare כולל:

•HIPAA-ready infrastructure ל-Enterprise customers

•מודלים שאומנו ספציפית למשימות healthcare ו-life sciences

•אינטגרציות native ל-databases רפואיים: CMS Coverage Database, ICD-10 codes, PubMed

•Use case מרכזי - Prior Authorization: Claude שולף דרישות coverage מ-CMS או מ-policies מותאמות, בודק clinical criteria מול patient records (HIPAA-ready), ומציע determination יחד עם supporting materials ל-payer review. עיבוד שלקח שעות מתבצע בדקות.

•Patient care coordination - הפחתת לחץ זמן על clinicians

•Regulatory submissions - האצת תהליך הגשה של תרופות

Consumer features (במסלולי Pro/Max):

•HealthEx - האינטגרציה הראשונה של consumer health record

•Apple Health - rolling out ב-beta דרך אפליקציית Claude iOS

•Android Health Connect - rolling out ב-beta דרך אפליקציית Claude Android

•סיכום medical history, הסברת lab results, זיהוי patterns

•הכנת שאלות ייעודיות לפגישות עם רופאים

שותפי הכרזה: Banner Health, Novo Nordisk ו-AbbVie. בארה״ב, HIPAA (Health Insurance Portability and Accountability Act 1996 - חוק אמריקאי להגנת PHI) דורש שכל שירות המטפל ב-PHI (Protected Health Information - מידע רפואי מזהה: שמות, ת.ז., תיקים) יעמוד בסטנדרטים.

מסלולי Claude של Anthropic:

•Claude.ai Free - שימוש אישי, ללא BAA וללא HIPAA

•Claude.ai Pro (20$ לחודש) - שימוש אישי, ללא BAA, אך כולל את consumer health features (HealthEx, Apple Health, Android Health Connect)

•Claude Max (200$ לחודש) - הרחבה של Pro, כולל consumer health features

•Claude Team (30$ לחודש למשתמש, מינימום חמישה משתמשים) - שיתוף בין חברי צוות, ללא BAA וללא HIPAA

•Claude Enterprise (תמחור מותאם, 30-100$ ומעלה למשתמש לחודש, מינימום 50 משתמשים) - BAA זמין, HIPAA-ready, מוסמך ISO 42001 ו-SOC 2 Type II (Service Organization Controls - audit ל-cloud services)

ההבדל קריטי. למי שרוצה לשלוח PHI מסלול Enterprise חובה. Team אינו מספיק.

מה ש-Enterprise כולל:

•BAA חתום (Business Associate Agreement - חוזה תחת HIPAA המגדיר אחריות על PHI)

•הצפנת PHI ב-rest (במנוחה - בעת אחסון) וב-transit (במעבר ברשת)

•Audit logs (יומני ביקורת)

•בקרות גישה (SSO, role-based - SSO=Single Sign-On, role-based=מבוסס תפקיד)

•אפשרויות data residency (היכן נשמרים הנתונים גיאוגרפית)

•אין training על נתוני לקוחות לעולם

•תמיכה ייעודית

•הסמכות compliance

ISO 42001 (2023) הוא תקן ל-AI Management Systems, ו-Anthropic הייתה אחת מספקי ה-LLM (Large Language Model - מודל שפה גדול) הראשונים שעמדו בו (הוסמכה ב-6 בינואר 2025 על ידי Schellman Compliance, מהראשונות בין frontier AI labs).

בישראל: HIPAA אינו רלוונטי באופן ישיר (חוק אמריקאי), אך חוק הגנת הפרטיות 1981 (תיקון 13 משנת 2018) דומה ברוחו. הליבה: הסכמה מודעת, minimization (מינימיזציה - איסוף רק מה שצריך) ו-security.

רופא ישראלי השולח PHI ל-AI cloud צריך:

•הסכמת מטופל

•Data minimization (de-identify במידת האפשר)

•Security סביר

מסלול ה-Enterprise של Anthropic מספק security סביר, אך הסכמה ספציפית עדיין נדרשת.

ISO 42001:2023 פורסם בדצמבר 2023. הדומיין: AI management systems

הדרישות:

•AI risk management - זיהוי, הערכה ומיתון של סיכונים

•AI lifecycle - design, deploy, monitor ו-decommission

•Data governance - quality, lineage ו-consent

•Transparency - explainability היכן שאפשר

•Accountability - אחריות ברורה להחלטות AI

•Performance monitoring

עבור enterprise customers - סימן למקצועיות

ב-procurement, ISO 42001 הופך לדרישה. Anthropic קיבלה הסמכה ב-6 בינואר 2025 (early adopter, הוסמכה על ידי Schellman Compliance). Microsoft, Google, AWS ו-OpenAI עמדו בתקן במהלך 2025

עבור קליניקות: רלוונטי כאשר רגולטורים או חברות ביטוח דורשים AI compliance. בישראל: עדיין לא נדרש, אך המגמה מגיעה

עבור שיתופי פעולה במחקר עם מוסדות אירופאים: צפוי יותר ויותר

הצעה: בעת בחירת ספק AI, יש לוודא הסמכת ISO 42001. זהו סימן ל-AI governance בוגר.

ISO 42001certificationgovernance

חוק הגנת הפרטיות 1981, תיקון 13 (2018) - תוקף בעיקר ב-2018.

העקרונות:

•הסכמה מודעת

•מטרה ספציפית

•Minimization

•Security

•Accuracy

•Retention

•זכויות נושא המידע

עבור AI שמטפל ב-PHI - כל אלו חלים

השלכות:

•הסכמה ספציפית, general consent אינו מספיק

•Minimization - de-identify במידת האפשר

•Security - הצפנה ב-rest וב-transit (מסלול Anthropic Enterprise מספק זאת)

•Audit logs

•Breach notification

לרופא בפועל:

•יש להוסיף סעיף לטופס ההסכמה של המטופל בנוגע לעיבוד ב-AI

•De-identify של clinical data לפני שליחה

•שימוש במסלול Enterprise או on-premise עבור PHI

•תיעוד שימוש ב-AI ב-record של המטופל

•להישאר מעודכן, הרגולציה מתפתחת

ב-2026: רגולטור הגנת הפרטיות הישראלי טרם הוציא הנחיות ספציפיות ל-AI, אך ה-EU AI Act משפיע.

Israelprivacy lawחוק

ההכרזה של JPM26 התמקדה ב-Prior Authorization (אישור מראש מחברת ביטוח לטיפול/תרופה - אחד התהליכים האדמיניסטרטיביים הגדולים בארה״ב, מקור עיקרי ל-clinician burnout)

הזרימה המסורתית:

•רופא מבקש טיפול/תרופה

•עוזר/מזכירה ממלא טופס prior auth

•הטופס נשלח ל-payer

•reviewer ב-payer קורא את הבקשה (ידנית) ומחפש דרישות coverage ב-CMS או ב-policy פנימי

•reviewer בודק קריטריונים מול תיק המטופל

•determination (אישור/דחייה) חוזר לרופא

הזמן: שעות עד ימים. עיכוב טיפולי

הזרימה עם Claude for Healthcare:

•Claude שולף את דרישות ה-coverage אוטומטית מ-CMS Coverage Database או מ-policies מותאמות

•Claude בודק את ה-clinical criteria מול patient records (HIPAA-ready)

•Claude מציע determination יחד עם supporting materials

•reviewer אנושי מאשר או דוחה

הזמן: דקות. שיפור efficiency של פי 10-50

שותפי השקה:

•Banner Health - מערכת בריאות גדולה

•Novo Nordisk - חברת תרופות (סוכרת, השמנה)

•AbbVie - חברת תרופות (Humira, Skyrizi)

Reuse בקליניקה דרמטולוגית: למרות ש-prior auth אינו מרכזי בישראל, יש מקבילה - אישורי ועדה (יותרת, סל בריאות מורחב). ה-pattern רלוונטי: אוטומציה של תהליך coverage-checking

גישה: דרך Claude Enterprise, חיובי הכרזת Anthropic באתר הרשמי

prior-authpayerJPM26

Enterprise:

יתרונות:

•מודלים state-of-the-art

•אין דרישת תשתית

•BAA זמין

•ISO 42001

חסרונות:

•עלות (30-100$ ומעלה למשתמש לחודש)

•הנתונים על cloud (גם עם BAA)

•Vendor lock-in (תלות בספק - קושי לעבור)

שימוש מתאים: קליניקות עם צרכי AI עקביים

On-Premise (הרצה מקומית בארגון - לא בענן) (Llama 4, MedGemma, Mistral):

יתרונות:

•שליטה מלאה בנתונים (PHI לא יוצא החוצה)

•השקעה חד-פעמית

•ללא תשלום שוטף למשתמש

•ניתן להתאמה

חסרונות:

•מודלים חלשים יותר

•דרישת תשתית (שרת GPU מעל 10,000$)

•נדרש ידע טכני

שימוש מתאים: privacy-critical, צוות טכני

Hybrid: ההגיוני ביותר. שימוש ב-Enterprise לעבודה כללית עם AI ושימוש ב-on-premise ל-PHI ברגישות גבוהה

דוגמה: תמונות ניתוח מוז - on-premise. חיפוש ספרות שוטף - cloud

בישראל ב-2026:

•רוב הקליניקות העצמאיות - cloud Enterprise

•בתי חולים גדולים - hybrid

•מחקר אקדמי - cloud בדרך כלל מספק כאשר הנתונים de-identified

enterpriseon-premisechoice

💻 Claude Code - Agentic Coding

Claude Code הוא ה-CLI (Command Line Interface - ממשק מבוסס terminal/text) tool של Anthropic, שוחרר ב-2024 ועובר התפתחות מתמדת. הוא agentic (אוטונומי - מבצע משימות מורכבות) ולא רק chatbot.

ההבדל מ-GitHub Copilot: Copilot מבצע autocomplete (מציע את השורה הבאה תוך כדי הקלדה). Claude Code פועל על codebase שלם ומבצע שינויים מרובי-שלבים (קריאת קבצים, עריכה, הרצת בדיקות, debugging - ניפוי באגים).

הקלט: terminal command. הזרימה: הקלדת 'claude' ב-terminal פותחת session ב-codebase. המשתמש כותב משימה. Claude קורא את הקבצים הרלוונטיים, מתכנן שינויים, עורך קבצים, מריץ בדיקות ומדווח חזרה.

מה שמאפשר זאת:

•Long context (1M tokens)

•Tool use - קריאה וכתיבה לקבצים, הרצת bash commands (פקודות מערכת הפעלה), חיפוש

•Project memory (CLAUDE.md - קובץ זיכרון לפרויקט)

•Reasoning - תכנון מרובה-שלבים

•Hooks (וו - חיבור פעולות אוטומטיות) לאוטומציה

שימושים מעבר ל-coding:

•ניתוח מסמכים

•עיבוד נתונים

•אוטומציה (bash commands ו-file operations)

•מחקר

•ניהול פרויקטים

המסמך הזה נכתב באמצעות Claude Code.

הפיצ'רים מתפתחים:

•MCP (Model Context Protocol - protocol של Anthropic ל-LLMs לחבר ל-tools חיצוניים)

•Plugins - הרחבות שפותחו על ידי קהילה

•Custom agents

•Settings - permissions, hooks ו-env vars (משתני סביבה)

תמחור: Claude Pro/Team/Enterprise כוללים את Claude Code ללא תשלום נוסף. עבור מי שאינם מפתחים: Claude.ai web מספק. עבור מפתחים וחוקרים: Claude Code משנה את כללי המשחק.

בקליניקה: רוב הרופאים לא ישתמשו. רופאי מחקר שמכינים scripts (קבצי הוראות אוטומטיות) לניתוח נתונים - Claude Code יכול להחליף עבודת python שלמה.

דוגמה: 'קרא CSV של נתוני מטופלים, חשב סטטיסטיקה בסיסית והפק עקומת Kaplan-Meier ב-R script'. Claude Code מבצע זאת ב-2-3 דקות לעומת 1-2 שעות של coding ידני.

אך נדרשת תחושה בסיסית של עבודה עם קבצים ו-terminal.

דוגמאות שימוש:

•ניתוח סטטיסטי - 'יש לי CSV עם 200 מטופלים ו-PASI scores בשבועות 0, 12, 24. חשב descriptive stats, paired t-test וצור גרף ב-R'. Claude מייצר R script, מריץ אותו ומציג פלט

•ניתוח survival - '50 מטופלים עם מלנומה, נתוני time-to-event. צור Kaplan-Meier curves להשוואת שתי קבוצות והרץ log-rank test'

•עיבוד תמונות - 'המר 100 תמונות דרמוסקופיה לגודל סטנדרטי 224x224 ושמור בתיקייה'

•ניקוי נתונים - 'בקובץ Excel זה יש typos, ערכים חסרים ו-formats לא עקביים. נקה אותו ודווח על הבעיות'

•הכנת מאמר - 'צור Table 1 (דמוגרפיה) מקובץ CSV זה בסגנון JAMA'

•ספרות - 'קרא 20 PDFs בתיקייה, חלץ: study design, n, intervention, primary outcome ו-results. ייצא ל-CSV'

דרישות: נוחות עם terminal ועם file folders, נכונות ללמוד CLI בסיסי

ROI: שעות נחסכות לכל ניתוח, חודשים נחסכים לכל פרויקט

אזהרה: יש לאמת את ה-code של Claude על sample data לפני שימוש על נתונים אמיתיים.

researchdataanalysis

ChatGPT Code Interpreter (Advanced Data Analysis):

•מבוסס web, sandbox מבודד

•מעלים קבצי CSV ו-ChatGPT מריץ Python עליהם

•הפלט: code, results ו-plots

•הנתונים נמחקים בסיום ה-session

Claude Code:

•Terminal-native

•פועל על מערכת הקבצים שלך

•קורא קבצים בתיקייה שלך, עורך אותם ומריץ commands

•עובד באופן Persistent

ההבחנה: Code Interpreter = 'עבד על הקובץ ב-cloud'. Claude Code = 'עבד על הפרויקט שלי על המחשב שלי'

מתי Code Interpreter עדיף:

•ניתוח חד-פעמי

•אין צורך ב-persistence

•העדפה ל-web interface

•פחות טכני

מתי Claude Code עדיף:

•פרויקט מתמשך

•עבודה עם מספר קבצים

•צורך להריץ commands

•Developer workflow

לרוב הרופאים: Code Interpreter נגיש יותר. לרופאי מחקר מתקדמים: Claude Code מספק יותר ערך.

comparisonCode InterpreterClaude Code

שלב 1 (חמש דקות): התקנה. https://claude.ai/code. הורדת installer ל-Mac/Windows/Linux או 'npm install -g @anthropic-ai/claude-code'

שלב 2 (חמש דקות): authenticate. 'claude' ב-terminal. התחברות עם חשבון Claude Pro

שלב 3 (עשר דקות): הרצה ראשונה. פתח תיקייה של פרויקט. 'claude' פותח session. שאל: 'הסבר מה נמצא בתיקייה הזו'

שלב 4 (עשר דקות): נסה משימה. 'צור CSV של 100 מטופלי דרמטולוגיה fake עם עמודות ID, age, diagnosis ו-PASI'. Claude יבצע

השקעת זמן: 30 דקות עד שעה כדי להגיע לתחושת נוחות. לאחר מכן שימוש שוטף 1-2 פעמים בשבוע. ה-ROI מצטבר עם כל משימה שנחסכת

אופציה: הגדרת CLAUDE.md, קובץ זיכרון לפרויקט. ניתן להוסיף:

•הערות workflow

•פקודות נפוצות

•מבנה הפרויקט

Learning curve: נמוך עבור משתמשים נוחים טכנית, בינוני לאחרים

מקורות:

•תיעוד ב-docs.anthropic.com/claude-code

•קהילה: r/Anthropic ו-X

getting-startedinstallbasic

📊 השוואה ל-GPT-5.5 ול-Gemini 3.1 Pro - מי הכי טוב?

שלושה frontier models מובילים ב-2026:

•GPT-5.5 (OpenAI, 24 באפריל 2026)

•Claude Opus 4.7 (Anthropic, 16 באפריל 2026)

•Gemini 3.1 Pro (Google, 19 בפברואר 2026)

Context window:

•GPT-5.5 - מעל 1M tokens (1,050,000), max output 128K

•Claude Opus 4.7 - 1M tokens

•Gemini 3.1 Pro - context גדול

תמחור (input/output למיליון tokens):

•GPT-5.5 - 5$ / 30$ (פי 2 מ-GPT-5.4 שהיה ב-2.50$/15$). Pro Tier: 30$/180$. עבור prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output

•Claude Opus 4.7 - 5$ / 25$

•Gemini 3.1 Pro - 7$ / 21$

Benchmarks חדשים מהשקת GPT-5.5:

•Terminal-Bench 2.0 (coding agentic, real-world workflows) - GPT-5.5 82.7%, Claude Opus 4.7 69.4%, GPT-5.4 75.1%. פער של 13+ נקודות לטובת GPT-5.5

•FrontierMath Tiers 1-3 - GPT-5.5 51.7%, Claude Opus 4.7 43.8%

•FrontierMath Tier 4 (הקשה ביותר) - GPT-5.5 35.4%, Claude Opus 4.7 22.9%, Gemini 3.1 Pro 16.7%

•MRCR v2 (long-context, 1M tokens) - GPT-5.5 74.0% (קפיצה מ-36.6% ב-GPT-5.4)

•SWE-bench Verified - Claude Opus 4.7 87.6% (מוביל)

יכולות לפי קטגוריה:

•Coding ארוך-טווח (SWE-bench) - Claude Opus 4.7 מוביל

•Coding agentic (Terminal-Bench 2.0) - GPT-5.5 מוביל בפער

•Math/FrontierMath - GPT-5.5 מוביל בפער (במיוחד Tier 4)

•כתיבה ו-long-form - Claude Opus 4.7 מוביל, GPT-5.5 קרוב

•Multimodal - Gemini 3.1 Pro מוביל (טקסט, תמונה, וידאו ואודיו), GPT-5.5 חזק, Claude Opus 4.7 תומך בטקסט, תמונה ו-PDF בלבד

•Multilingual (רב-לשוני) - Gemini 3.1 Pro מוביל, Claude Opus 4.7 השתפר

•עברית - Gemini 3.1 Pro הכי טוב, Claude קרוב, GPT-5.5 בסוף

•Real-time ואינטרנט - Gemini 3.1 Pro מוביל (אינטגרציה מובנית עם Google search)

•Tool use ו-agentic - Claude Opus 4.7 יחד עם Claude Code הם המובילים בקוד ארוך-טווח, GPT-5.5 מוביל ב-terminal agentic

•Safety ו-refusals (סירובי AI - מתי המודל מסרב לענות) - Claude בדרך כלל הזהיר ביותר

•עמידות ל-hallucinations - Claude הטוב ביותר בטענות factuals

עבור medical use cases:

•Literature synthesis - Claude הטוב ביותר (1M tokens context, ציטוטים זהירים)

•Multi-document analysis - Claude

•Coding למחקר - Claude Code משנה את כללי המשחק

•Multimodal רפואי - Gemini 3.1 Pro ב-Vertex AI

•עבודה קלינית בעברית - Gemini 3.1 Pro הכי טוב במעט

•HIPAA-eligible / HIPAA-ready - כל השלושה (Claude for Healthcare מ-JPM26)

הבחירה: לרוב המשתמשים, כל אחד מהשלושה עובד.

יתרונות לפי מודל:

•Claude - long context, זהירות, SWE-bench מוביל ו-Claude Code

•GPT-5.5 - הפופולרי ביותר, ecosystem רחב, מוביל ב-Terminal-Bench וב-FrontierMath

•Gemini 3.1 Pro - multimodal, multilingual ואינטגרציה עם Google

שאלה 1 - 'האם יש לי context ארוך (מעל 50K tokens)?'

•אם כן - Claude Opus 4.7 (1M tokens) או Gemini 3.1 Pro

•אם לא - כל מודל יתאים

שאלה 2 - 'האם אני עובד עם video או audio?'

•אם כן - Gemini 3.1 Pro (multimodal הטוב ביותר)

•אם לא - כל מודל יתאים

שאלה 3 - 'האם אני עושה coding?'

•אם כן - Claude Opus 4.7 (SWE-bench הטוב ביותר) יחד עם Claude Code

•אם לא - כל מודל יתאים

שאלה 4 - 'האם אני זקוק ל-reasoning המתקדם ביותר?'

•אם כן - GPT-5.5 או Claude Opus 4.7 עם extended thinking (כולל רמת xhigh חדשה)

•אם לא - כל מודל יתאים

שאלה 5 - 'האם התקציב מצומצם?'

•אם כן - Llama 4 או Muse Spark (חינמי, open source) או Claude Opus 4.7 (ה-premium הזול ביותר ב-5$/25$ למיליון tokens)

•אם לא - כל מודל יתאים

שאלה 6 - 'האם privacy קריטי?'

•אם כן - מסלול Enterprise של אחד המודלים או on-premise (Llama 4, MedGemma)

•אם לא - מסלול Pro

שאלה 7 - 'האם השפה הראשית עברית?'

•אם כן - Gemini 3.1 Pro מוביל במעט, Claude קרוב

•אם לא - כל מודל יתאים

בפועל: רוב הרופאים ישתמשו ב-1-2 כלים. Claude Opus 4.7 בשילוב Haiku 4.5 הזול מכסה כ-95% מהצרכים.

decision-treechoicemodel

תמחור מוצהר 2026:

•Claude Opus 4.7 - 5$ למיליון input, 25$ למיליון output

•GPT-5.5 - 5$ למיליון input, 30$ למיליון output (פי 2 מ-GPT-5.4 ב-2.50$/15$). GPT-5.5 Pro - 30$/180$. ה-effective cost גבוה ב-~20% מ-GPT-5.4 (אך 40% פחות tokens per task)

נשמע זול

בפועל - עלויות נסתרות:

•Long context יקר - query של 1M tokens = 5$ ל-input בלבד. שימוש שוטף יוצא יקר

•GPT-5.5 ב-prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output

•Output יקר פי 5-6 מ-input. דוחות ארוכים יקרים

•טוקניזציה (חיתוך טקסט ל-tokens) של עברית פי 3 = עלות אפקטיבית פי 3. 5$ באנגלית שווים ל-15$ בעברית. בנוסף, ב-Opus 4.7 הוצג טוקנייזר (האלגוריתם שחותך טקסט ל-tokens) חדש שמייצר עד 35% יותר tokens עבור אותו טקסט

•שיחות multi-turn (רב-סבב) - כל הסבבים הקודמים נספרים שוב בכל סבב. 10 סבבים = סכום כל הסבבים הקודמים

•Tools ו-agentic - כל tool call (קריאה לכלי חיצוני) = עוד tokens. משימות מרובות-שלבים יקרות

•Cache discount 90% - רק כשיש cache hit

•מסלולי subscription (Claude Pro 20$ לחודש) - שימוש 'unlimited' אך עם rate limit (מגבלת קצב שימוש)

•Enterprise - תמחור מותאם של 30-100$ למשתמש לחודש

הערכה: קליניקה טיפוסית עם חמישה משתמשים ב-Claude Pro = 100$ לחודש. עם Enterprise = 250-500$ לחודש

חישוב ROI (Return on Investment - תשואה על השקעה): כמה זמן ה-AI חוסך. חיסכון של 10 שעות בחודש (צנוע) ב-100$ לשעה = ערך של 1,000$ מול עלות של 100$ = ROI של פי 10. החישוב פשוט.

pricingcostshidden

AMA Physician AI Survey 2026 (מרץ 2026):

•81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023)

•94% משתמשים או מתעניינים

•76%+ מאמינים ש-AI משפר את הטיפול (מ-65% ב-2023)

•ממוצע use cases - 2.3 לרופא (1.1 ב-2023)

•70% רואים ב-AI כלי להפחתת burnout

Use cases מובילים (AMA 2026):

•סיכומי מחקר רפואי וסטנדרטים של טיפול - 39%

•הוראות שחרור, care plans ו-progress notes - 30%

•Documentation של billing, charts ו-visit notes - 28%

•Generation של chart summaries - 28%

•AI scribes - 29%

Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151 רופאים, 15 specialties):

•47% במרץ-אפריל 2025 → 63% בנובמבר 2025-ינואר 2026

•74% מהמשתמשים - שימוש יומי לפחות

•36% - מספר פעמים ביום

•Top use case - חיפוש ספרות (35%, מ-22% ב-אפריל 2025)

•Voice/scribes - 29% (מ-20%)

•71% חששות ראשי - דיוק ו-reliability

העדפת כלים:

•ChatGPT - 65%

•Claude - 23%

•Gemini - 18%

•Copilot - 15%

בישראל (סקר informal, דרמטולוגים, n=85, מרץ 2026):

•ChatGPT - 78%

•Claude - 28%

•Gemini - 35%

שימוש מועט יותר ב-Claude לעומת ארה״ב (ecosystem effect)

חששות שעלו:

•Hallucinations (מקום ראשון)

•פרטיות (שני)

•עלות (שלישי)

•איכות עברית (רביעי)

יתרונות שצוינו:

•חיסכון בזמן וצמצום administrative burden

•Drafts טובים יותר

•שיפור work-life balance ו-job satisfaction

•תקשורת קלה יותר עם מטופלים

המגמה: השימוש ב-AI גדל במהירות. ב-2023 היה 38% (AMA), ב-2026 הוא 81% (AMA). עד 2028 הוא צפוי לעבור 90%.

usageAMA-2026Doximity

🤔 האם זו באמת מהפכה? נתוני adoption ב-2026

נחזור לשאלת הכותרת - האם Claude (וה-AI בכלל) הוא באמת מהפכה ברפואה?

נתוני adoption (אימוץ - שיעור המשתמשים) ב-2026:

•AMA Physician AI Survey 2026 (מרץ 2026) - 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023). 94% משתמשים או מתעניינים. 76%+ מאמינים ש-AI משפר טיפול (מ-65% ב-2023). 70% רואים ב-AI כלי להפחתת burnout.

•Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151) - 63% adoption בנובמבר 2025-ינואר 2026 (עלייה מ-47% במרץ-אפריל 2025). 74% מהמשתמשים - שימוש יומי. 36% - מספר פעמים ביום.

•סקר Clalit 2026 - כ-60% מהרופאים בישראל משתמשים ב-AI מדי שבוע

אך מה משמעות הדבר? Real impact: גם ב-2026, ה-AI:

•אינו מאבחן באופן עצמאי

•אינו מחליף דרמטולוגים

•אינו משנה משמעותית את outcomes המטופלים

•אינו מוטמע באופן רחב ב-EHR

•אינו מפחית את עלויות המערכת

מה כן השתנה:

•זמן ה-documentation ירד ב-30-60 דקות ביום (AI scribes - מתעתקי AI לפגישות מטופל)

•Prior authorization - מ-Claude for Healthcare (JPM26): מהשעות לדקות

•זמן חיפוש בספרות מהיר פי 10 (Top use case ב-Doximity 2026 - 35%)

•מכתבי תקשורת למטופלים מהירים פי 5

•גישה להוראה רפואית התרחבה

•יעילות המחקר השתפרה

•הוראת מתמחים - ה-AI מסייע

ההגדרה של 'מהפכה': בהיסטוריה הרפואית, מהפכות אמיתיות הן:

•פניצילין (1928)

•חיסונים

•הרדמה

•אנטיספסיס

•MRI

•השתלות אברים

•Monoclonal antibodies

ה-AI ב-2026 אינו ברמה הזו. עדיין. אולי בעתיד.

אך מצד שני: ה-AI ב-2026 הוא מהפכת הפרודוקטיביות הגדולה ביותר מאז המחשב (שנות ה-80) והאינטרנט (שנות ה-90). חוסך זמן משמעותי, חיוני ל-research workflow, שיפר drafting ו-communication.

ברדיולוגיה - AI screen-reading קיבל אישור FDA. בדרמטולוגיה - AI image analysis מתפתח (DermaSensor קיבל אישור FDA ב-2024) אך עדיין אינו standard of care.

הצפי ל-2027-2030:

•AI מוטמע יותר ב-EHR

•Clinical decision support בזמן אמת

•Patient triage עם AI

•במקביל הרגולציה מתהדקת (EU AI Act 2026 enforcement - אכיפת חוק ה-AI האירופי)

השורה התחתונה: Anthropic (Claude for Healthcare), OpenAI (ChatGPT Health) ו-Google מחוללים מהפכה בכלים שהרופאים משתמשים בהם, אך אין מהפכה במקצוע עצמו. הוא נשאר human-driven. ה-AI מסייע, אינו מחליף.

שימוש ב-AI בדרמטולוגיה בארה״ב (סקר American Academy of Dermatology 2025, n=2,400): 71% משתמשים בכלי AI מדי שבוע, 35% מדי יום

כלים:

•ChatGPT - 75%

•Claude - 22%

•Gemini - 18%

•AI ייעודי לדרמטולוגיה - 12%

שימושים:

•Documentation ו-scribe - 45%

•תקשורת עם מטופלים - 38%

•ספרות - 32%

•DDx - 28%

•חומרי הסברה למטופלים - 22%

•Triage של תמונות - 8%

פריסת AI ייעודי לדרמטולוגיה:

•SkinVision (CE marked - אישור התאמה אירופי) - אפליקציית מטופלים, מעל 2M משתמשים באירופה

•DermaSensor (אישור FDA 2024)

•AI scribes (Heidi, Augmedix) - 25% מקליניקות הדרמטולוגיה בארה״ב בפיילוט

ישראל: Clalit ומכבי מריצות פיילוטים בשנים 2024-2026 עם מספר משתמשים מצומצם בפועל

עתיד: AI image analysis בצמיחה, וכך גם teledermatology עם triage מבוסס AI

מגבלות:

•המודלים אומנו רובם על עור בהיר ומתקשים בגוונים כהים יותר

•אינם מתעדים היסטוריה והקשר קליני

•הרגולציה של ה-FDA עדיין מתבגרת

הצפי: ב-2027-2028 ה-AI יהיה מוטמע יותר, אך לא יחליף את הרופא.

dermatologyadoptionnumbers

מחקרים על AI ו-clinical outcomes:

•Wang 2024 (BMJ) - AI scribe הפחית זמן documentation ב-33%. האיכות נשמרה ו-burnout ירד, אך outcomes קליניים לא נמדדו

•Hager et al. 2024 (Nature Medicine) - 'Evaluation and mitigation of the limitations of LLMs in clinical decision-making' - LLMs מובילים מאבחנים פחות טוב מרופאים, אינם עוקבים אחר הנחיות clinical, ואינם מפרשים תוצאות מעבדה

•Smith 2025 (NEJM) - meta-analysis של 47 מחקרי clinical decision support מבוססי AI. שיפור מתון ב-metrics מסוימים (אבחון בזמן +8%), אך ללא השפעה משמעותית על mortality, readmission ו-complications

•DermaSensor RCT (2024) - מכשיר נייד לזיהוי סרטן עור ב-primary care. Sensitivity 96%, specificity 73%. היה גורם ל-25% יותר ביופסיות אך תופס 96% מהמלנומות

•מחקרי השוואה בין AI לדרמטולוג - בשנים 2017-2023 ה-AI השווה לדרמטולוג בתמונות מבודדות. במציאות (Han 2023): AI הגיע ל-73% דיוק על image set (מערך תמונות) חדש, דרמטולוג ל-85%. המציאות מאתגרת יותר

לסיכום: שיפורי efficiency מוכחים, שיפורי outcomes עם ראיות מוגבלות

הקריאה: ה-AI הוא כלי פרודוקטיביות אמיתי. ההשפעה הקלינית עדיין מתפתחת. אין למכור יתר על המידה למטופלים, ואין להמעיט בערכו מול עמיתים.

outcomesevidenceRCTs

השערות על AI ברפואה ב-2030:

•השערה 1 (סבירה) - AI scribe יהפוך לסטנדרט. כל קליניקה בישראל ובארה״ב תשתמש ב-AI scribe ב-2030, עם חיסכון של מעל 80% בזמן ה-documentation

•השערה 2 (סבירה) - Clinical decision support יהפוך ל-mainstream. הצעות AI בזמן אמת בתוך ה-EHR

•השערה 3 (אפשרית) - AI image analysis יהפוך לכלי סטנדרטי. מכשירים ניידים ב-primary care

•השערה 4 (לא סבירה) - אבחון AI עצמאי. לא סביר עד 2030 בשל רגולציה, אחריות משפטית, קבלת המטופלים ו-edge cases

•השערה 5 (לא ודאית) - AI במחקר. אוטומציה רחבה של SR. עיצוב ניסויים קליניים מסייע ב-AI. סביר שכן

סוגיות בוערות לקראת 2030:

•רגולציה (EU AI Act ייושם במלואו, ארה״ב בעקבותיה)

•מסגרות אחריות משפטית

•Reimbursement (כיסוי ביטוחי לכלי AI)

•כוח אדם

השורה התחתונה: ה-AI הוא כלי augmentation. דרמטולוגים ב-2030 עדיין חיוניים. ה-workflow ישתנה משמעותית, אך שיקול הדעת, התקשורת והמיומנויות הפרוצדורליות יישארו ליבה אנושית.

future2030predictions

✅ Take-aways לדרמטולוג בישראל ב-2026

Claude - מהפכה או אבולוציה? תשובה כנה: אבולוציה משמעותית, לא מהפכה.

ההבדל מתקופת pre-2022 ChatGPT era: בעבר ה-AI היה כלי למומחים, כיום הוא mainstream tool. אך הוא אינו משנה את ה-fundamentals של עבודת הדרמטולוג.

היכן Claude בולט:

•Long-form analysis בזכות 1M tokens context

•Coding - Claude Code משנה את כללי המשחק בניתוח נתוני מחקר

•Safety - Constitutional AI

•תמחור - 5$/25$ למיליון tokens, הזול ביותר בקטגוריית premium

•עברית - שיפור משמעותי

•Enterprise - HIPAA ו-ISO 42001 ready

היכן Claude אינו בולט:

•Multimodal - GPT-5.5 ו-Gemini 3.1 Pro חזקים

•Real-time ואינטרנט - native טוב יותר ב-Gemini

•Ecosystem (סביבת כלים והרחבות) ו-plugins - ל-GPT-5.5 יש יותר

•Brand recognition - ChatGPT הוא ה-brand הצרכני

לרופא בישראל ב-2026: יש לבחור על בסיס use case ולא נאמנות.

Stack מעשי:

•NotebookLM (חינמי)

•Claude Pro או ChatGPT Plus (20$ לחודש)

•אולי גם Gemini Pro (חינמי עם Google One במחיר נמוך לחודש)

•סך הכול כ-22$ לחודש

המיצוב הייחודי של Claude: long context, safety ו-coding הופכים אותו לכלי של חוקרים. עבור עבודה קלינית טהורה כל frontier model יעבוד דומה.

מחשבה מסכמת: אוריינות AI הופכת לחלק מהכשירות של רופא. בבתי הספר לרפואה החל מ-2030 ילמדו prompt engineering (אומנות כתיבת ההוראות ל-AI). CME credits עבור קורסי AI. ייתכן ש-accreditation (תהליך הסמכה רשמי) ידרוש כשירות AI בסיסית.

הצעדים:

•הירשמו לפחות לכלי AI מתקדם אחד (20$ לחודש)

•הקדישו 30 דקות ביום במשך 30 יום

•פתחו workflow אישי

•הישארו מעודכנים

•גלו את השימוש כשנדרש

•שמרו על חשיבה ביקורתית

ה-AI כאן כדי להישאר. צריך לאמץ אותו.

שבוע 1 - Foundation:

•יום 1 - רישום ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus ורישום ל-NotebookLM (חינמי)

•ימים 2-3 - תרגול שאלות בסיסיות

•ימים 4-7 - ניסיון use case ספציפי - drafting של מכתב הפניה או סיכום מאמר עדכני

שבוע 2 - Workflow:

•ימים 8-10 - שילוב בשגרה היומית. AI למשימה אחת לפחות ביום

•ימים 11-14 - פרויקט NotebookLM - העלאת 5-10 מאמרים בנושא נבחר

שבוע 3 - Optimization:

•ימים 15-18 - בניית prompt library

•ימים 19-21 - בדיקת כלים נוספים (Perplexity לחיפוש, Consensus לראיות)

שבוע 4 - Review:

•ימים 22-25 - הערכת הזמן שנחסך. אומדן וכימות

•ימים 26-28 - זיהוי כאבים מתמשכים

•ימים 29-30 - תכנון 90 הימים הבאים

השאלה המרכזית: לאחר 30 יום, האם אתה חוסך זמן? אם כן - להמשיך. אם לא - לבחון מחדש את הגישה. רוב המשתמשים אינם רואים את התועלת המלאה לפני 60-90 יום, ההתמדה משתלמת.

action-plan30-daysintegration

מלכודות נפוצות:

•אמון יתר ב-AI - דוגמה: ה-AI מצטט 'מחקר X הראה 75% efficacy' מבלי שתאמת, והמחקר אינו קיים. הפתרון: לאמת תמיד

•אי-גילוי שימוש ב-AI - ההשלכות: בעיות אתיות וסיכון retraction (משיכת מאמר שפורסם) בעת חשיפה. הפתרון: לגלות את השימוש במאמרי מחקר ובאינטראקציות עם מטופלים כשרלוונטי

•שליחת PHI ל-consumer tier (מסלול צרכני - לא ארגוני) - הפרה של חוק הגנת הפרטיות בישראל. הפתרון: de-identify לפני השליחה או שימוש במסלול Enterprise

•אינטראקציות מטופל מומצאות - ה-AI 'זוכר' שמטופל X אמר משהו, אך מדובר בהמצאה. הפתרון: AI scribes שמקליטים אודיו, אמינים יותר

•הפיכה לתלוי מדי ב-AI ושכחה לחשוב באופן ביקורתי - הפתרון: לשמור על שיקול דעת קליני כראשי

•ריבוי כלים - ניסיון להשתמש ב-ChatGPT, Claude, Gemini ובחמישה כלים נוספים. מציף את המשתמש. הפתרון: להישאר עם 2-3 כלים לכל היותר

•בעיות עברית מבלי לשים לב - ה-AI מתרגם מילולית ושמות תרופות מתעוותים. הפתרון: לסקור בקפידה

•פלטים גנריים - טקסט שמרגיש 'AI'. הפתרון: לערוך, לתת אופי אישי ולהוסיף את הקול שלך. ה-AI הוא נקודת התחלה

pitfallsmistakesavoid

פעולות קונקרטיות לדרמטולוג ב-2026:

•הירשם ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus. כלי אחד, התחל. אחרי חודש תרגיש את ההבדל

•הוסף את NotebookLM (חינמי) לעבודה עם ספרות ול-deep dives. משלים את הכלי הראשי

•הקצב 30 דקות ביום במשך חודש. שילוב לוקח זמן, אל תצפה לקסם מיידי

•הכר את HIPAA ואת חוק הגנת הפרטיות. אין לשלוח PHI ל-consumer tiers. בצע de-identify או השתמש במסלול Enterprise

•שמור על חשיבה ביקורתית. לאמת תמיד את פלטי ה-AI, במיוחד ציטוטים, מספרים, מינוני תרופות והחלטות קליניות

•גלה את השימוש כשנדרש. גילוי במחקר, שקיפות מול המטופל כאשר רלוונטי. הנחיות ICMJE (International Committee of Medical Journal Editors - הועדה הבינלאומית של עורכי כתבי עת רפואיים) 2024 קובעות את הרף

•הישאר מעודכן. ה-AI משתנה מדי חודש. עקוב אחר @AnthropicAI, @OpenAI ומובילי AI בדרמטולוגיה ב-X. חמש דקות ביום

•Workflow עברי - צפה לבעיות. שילוב של אנגלית ועברית פעמים רבות הוא הטוב ביותר. אמת את הפלט בעברית

•אל תשווה את עצמך לעמיתים יתר על המידה. כל אחד מאמץ בקצב שלו. ה-learning curve אמיתי

•בנה את ה-workflow לאורך שנים. עד 2030 ה-AI יהיה חיוני לעבודה. התחלה עכשיו ממקמת אותך בקדמת הבמה

takeawaysaction2026

🔑

שורה תחתונה

Claude (ו-Anthropic בכלל) הוא אבולוציה משמעותית, לא מהפכה. Anthropic נוסדה ב-2021 על ידי חוקרים שעזבו את OpenAI, ומתמקדת ב-AI safety וב-Constitutional AI. שווי 380 מיליארד דולר לאחר Series G של פברואר 2026 (revenue run-rate מעל 30 מיליארד דולר). Claude for Healthcare הושק ב-12 בינואר 2026 ב-JPM26 - HIPAA-ready Enterprise, אינטגרציות ל-CMS/ICD-10/PubMed, prior authorization מהשעות לדקות. Claude Opus 4.7 (16 באפריל 2026) הוא frontier model - 1M tokens context, multimodal, SWE-bench 87.6%, 5 דולר למיליון input ו-25 דולר למיליון output (output זול יותר מ-GPT-5.5 שעלה ל-5$/30$). ב-SWE-bench וב-long-form analysis Claude מוביל. GPT-5.5 מוביל ב-Terminal-Bench 2.0 (82.7% מול 69.4%) וב-FrontierMath Tier 4. ב-multimodal וב-multilingual - Gemini 3.1 Pro מוביל. ב-ecosystem וב-plugins - GPT-5.5 מוביל. Claude Code הופך את Claude לייחודי עבור מפתחים וחוקרים. Constitutional AI הופך את Claude לבטוח יותר באופן כללי. HIPAA-ready (במסלול Enterprise), מוסמך ISO 42001 מ-6 בינואר 2025 (מהראשונות בין frontier AI labs). בעברית - שיפור משמעותי, עדיין מעט מאחורי האנגלית. AMA 2026: 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-2023).

הכיוון לדרמטולוג בישראל ב-2026: Claude הוא אופציה מצוינת, במיוחד לעבודת מחקר וספרות. כך גם GPT-5.5 וכך גם Gemini 3.1 Pro. כולם עובדים. יש לבחור על בסיס use case ולא נאמנות. Stack מעשי: NotebookLM (חינמי) יחד עם Claude Pro או ChatGPT Plus (20 דולר לחודש) מכסים 95% מהצרכים בעלות של 20 דולר לחודש. ה-AI הוא כלי שמעצים את העבודה. עד 2030 הוא צפוי להפוך לחיוני בעבודת הרופא. אוריינות AI הופכת לכישור של רופא. ה'מהפכה' אינה רופאי AI אוטונומיים, אלא כלי פרודוקטיביות שחוסכים 30-60 דקות ביום על documentation, מהירות פי 10 בספרות ופי 5 ב-drafting. תועלת אמיתית. השפעה אמיתית. פחות ממה שה-hype מבטיח, יותר ממה שהסקפטים מודים. יש לאמץ בפרגמטיות.

📋 פרטי מקור ומחבר

מאת: ד"ר יהונתן קפלן

מומחה ברפואת עור ומין | מנתח מוז (FACMS)

📅 פורסם: 1.5.2026🔄 עודכן: 1.5.2026

הערת עריכה: תוכן זה נכתב ונערך על ידי ד"ר יהונתן קפלן ומבוסס על מקורות אקדמיים מאומתים.

אין להסתמך על תוכן זה ללא קריאת המקורות המלאים.