Claude - The New Revolution או רק Hype נוסף?
סקירה מקיפה של Anthropic ו-Claude Opus 4.7: Constitutional AI, 1M tokens context (אורך הטקסט שהמודל קורא בבת אחת), HIPAA Enterprise, Claude Code, והשוואה ל-GPT-5.5 ול-Gemini 3.1 Pro
Constitutional AI: Harmlessness from AI Feedback
🎯 בקצרה: על מה מדובר?
💡 מה חייבים לזכור מהמאמר הזה
🏢 Anthropic - הסיפור של החברה
•Dario Amodei (CEO, לשעבר VP of Research ב-OpenAI)
•Daniela Amodei (President)
•Tom Brown (לשעבר אחד המחברים של GPT-3 paper)
•Sam McCandlish
•Jack Clark
•Jared Kaplan (שכתב את ה-Scaling Laws paper)
•ואחרים
הסיבה לעזיבה: חילוקי דעות לגבי כיוון החברה. OpenAI החלה להתמסחר באגרסיביות (עסקה עם Microsoft ב-2019), ומייסדי Anthropic רצו התמקדות חזקה יותר ב-AI safety.
סבבי גיוס:
•Series A - 124M$ (גיוס ראשון)
•Series B - 580M$ ב-2022 מ-FTX (הוחזרו לאחר קריסת FTX)
•2023 - Google (החל מ-300M$ ועד 2B$), Spark Capital, Salesforce
•2024 - Amazon השקיעה 4B$
•Series F - 13B$ בספטמבר 2025 בשווי 183B$
•Series G - 30B$ בפברואר 2026 בשווי 380B$ (בהובלת GIC ו-Coatue)
•סבב פוטנציאלי נוסף - לפי TechCrunch ו-Bloomberg מאפריל 2026, עד 50B$ בשווי 850-900B$
ה-revenue run-rate (קצב הכנסות שנתי משוערך) צמח מכ-1B$ בדצמבר 2024 ליותר מ-30B$ באפריל 2026. הצוות גדל משבעה עובדים ליותר מ-1,000. המטה ב-San Francisco.
עובדים בולטים: Jan Leike (עזב את OpenAI ב-2024 בעקבות חששות safety והצטרף ל-Anthropic).
מבנה החברה: PBC (Public Benefit Corporation - מבנה תאגידי מאוזן בין רווחיות לתועלת ציבורית).
גלגול גרסאות Claude:
•Claude 1 (מרץ 2023)
•Claude 2 (יולי 2023)
•Claude 3 (מרץ 2024)
•Claude 3.5 (יוני ואוקטובר 2024)
•Claude 4 (מאי 2025)
•Claude Sonnet 4.5 (29 בספטמבר 2025, הצגת 1M tokens context ב-beta)
•Claude 4.6 (ינואר 2026, 1M tokens context ב-GA)
•Claude Opus 4.7 (16 באפריל 2026)
הגישה: שחרור מהיר של שיפורים. ב-2026 Anthropic מתחרה ראש בראש מול OpenAI מבחינת revenue (run-rate של מעל 30B$ עבור שתיהן), ומובילה ב-enterprise וב-safety.
•נוסדה ב-2015 על ידי Sam Altman ו-Elon Musk
•בתחילה עמותה ללא מטרת רווח, ב-2019 עברה ל-capped-profit (רווח מוגבל - תקרה לתשואה למשקיעים)
•המשימה: AGI (Artificial General Intelligence - AI ברמת אדם בכל תחום) לטובת האנושות
•בפועל: מסחור אגרסיבי, שותפויות (Microsoft 2019, מעל 13B$)
•הגישה: 'ship fast, iterate'
•עזיבות בולטות: מייסדי Anthropic ב-2021, Jan Leike ב-2024 (בעקבות safety concerns), משבר ה-board ב-2023
Anthropic:
•נוסדה ב-2021, מבנה PBC
•המשימה: AI safety ו-frontier research
•בפועל: גישה מתודית, safety-first
•הגישה: 'responsible scaling' (Responsible Scaling Policy - מסמך של Anthropic, 5 רמות בטיחות AI)
•גיוסים בולטים: צוות ה-safety של OpenAI לשעבר
•דגש על Constitutional AI, מסחור איטי יותר
שתי החברות מתחרות. ה-revenue run-rate שלהן ב-2026 דומה (מעל 30B$). Anthropic מובילה ב-enterprise וב-safety; OpenAI מובילה ב-consumer וב-brand recognition
למשתמש: הבחירה תלויה בערכים. אם safety חשוב, Anthropic מתאימה. אם דרושים cutting-edge features, OpenAI לעיתים מובילה. איכות מודלי הבסיס דומה.
Anthropic Constitutional AI (Bai et al., 2022) - השלבים:
•הגדרת 'constitution' - טקסט עקרונות (helpful, harmless, honest)
•ה-AI מייצר תשובות
•AI נוסף מבקר: 'האם התשובה הזו עומדת ב-constitution?'
•ה-AI מתקן על בסיס הביקורת
•Reinforcement learning (אימון מבוסס תגמול) על התשובות המתוקנות (RLAIF - RL from AI Feedback)
יתרונות:
•ניתן ל-scaling (התרחבות לקנה מידה גדול - ללא human bottleneck (צוואר בקבוק אנושי))
•שקיפות (constitution גלוי)
•אופי iterative (מחזורי, חוזר על עצמו עם שיפורים)
רכיבי ה-constitution:
•UN Declaration of Human Rights
•עקרונות מ-Apple terms of service
•ערכי Anthropic
•הנחיות התנהגות
התוצאה: Claude נוטה פחות לייצר harmful outputs ממודלים שאומנו ב-RLHF בלבד.
דוגמאות:
•עמידות גבוהה יותר ל-jailbreaks (ניסיונות לעקוף את הגבלות הבטיחות)
•הסתייגות במקום הנכון
•הסבר על חוסר ודאות
Trade-off: לעיתים over-cautious (זהיר מדי). Anthropic שיפרה זאת החל מ-Claude 3
בקליניקה: הנטייה של Claude להסתייג ולהסביר חוסר ודאות מהווה יתרון בעבודה רפואית.
Claude 2 (יולי 2023): 100K tokens context. שיפור ב-instruction-following (יכולת ביצוע הוראות)
Claude 3 (מרץ 2024): 200K tokens context. שלושה גדלים - Haiku, Sonnet, Opus. Multimodal (טקסט ו-vision)
Claude 3.5 Sonnet (יוני 2024): טוב יותר מ-Opus 3 במשימות רבות, וזול יותר
Claude 3.5 Opus (אוקטובר 2024): טופ-של-הליין. SWE-bench 49% (היה המוביל)
Claude 4 (מאי 2025): SWE-bench 65%
Claude Sonnet 4.5 (29 בספטמבר 2025): הצגת 1M tokens context (ב-beta - גרסת בדיקה ציבורית). SWE-bench 80%
Claude 4.6 (ינואר 2026): 1M tokens context ב-GA (General Availability - זמינות מלאה לכלל הציבור), SWE-bench 85%, עדכוני safety
Claude Opus 4.7 (16 באפריל 2026):
•SWE-bench 87.6% Verified, 64.3% Pro (גרסה קשה יותר - 200 בעיות)
•1M tokens context כברירת מחדל
•עמידות טובה יותר ל-hallucinations (המצאות של ה-AI - מידע שגוי שנשמע אמין)
•שיפור משמעותי ב-multilingual (כולל עברית), ב-vision וב-output verification (המודל בודק את הפלט שלו לפני שמדווח)
•רמת מאמץ חדשה xhigh (רמה חדשה - בין high ל-max)
•תמחור: 5$ למיליון input ו-25$ למיליון output
הקצב: שיפורים כל 3-6 חודשים, כל אחד מהם משמעותי. האסטרטגיה: לא לחכות לגרסה מושלמת אלא להשתמש ב-stable העדכני ביותר.
🚀 Claude Opus 4.7 - היכולות והמגבלות
תכונות:
•1M tokens context window (כ-1,500 עמודי A4 או 750,000 מילים)
•Multimodal - מקבל טקסט, תמונות (ברזולוציה גבוהה יותר מקודמיו) ו-PDF
•הפקת טקסט עד 8K tokens (במצב extended thinking (מצב בו המודל חושב לפני התשובה): עד 32K reasoning ו-8K output)
•רמת מאמץ חדשה xhigh (בין high ל-max)
•Output verification לפני דיווח
•ביצועים משופרים במשימות long-running (משימות שדורשות זמן ושלבים מרובים)
הנתיב מטפס לקראת מודל לא משוחרר בשם Mythos (מודל לא-משוחרר של Anthropic - הדור הבא).
Benchmarks (מבחנים השוואתיים):
•SWE-bench Verified - 87.6%
•SWE-bench Pro - 64.3% (state-of-the-art ב-coding - הטוב ביותר היום)
•MMLU - 90.5% (Massive Multitask Language Understanding - מבחן רב-תחומי)
•MedQA - 90% (ללא medical fine-tuning - אימון נוסף ייעודי לרפואה)
•Math AIME 2024 - 87% (תחרות מתמטיקה אמריקאית)
•Context retrieval (Needle in haystack - מבחן: למצוא פיסת מידע ב-context ארוך) - מעל 99.5% לאורך כל ה-context
•Multilingual עברית - שיפור משמעותי מ-Claude 4 (כ-10 נקודות אחוז), אך עדיין מעט מאחורי האנגלית
תמחור וזמינות:
•5$ למיליון input tokens
•25$ למיליון output tokens (זהה ל-Opus 4.6)
•Caching (שמירת שאלות חוזרות ב-cache - מהיר וזול יותר) - 90% הנחה ב-cache reads
•Batch API (שליחת מספר שאלות בבת אחת - הנחה 50%) - 50% הנחה
•זמין ב-Claude products, ב-API, ב-Amazon Bedrock, ב-Google Cloud Vertex AI וב-Microsoft Foundry
שימושים מתאימים:
•Long-form analysis - מושלם ל-SR ולניתוח מאמרים מלאים
•Coding - top-tier ב-SWE-bench
•Reasoning (חשיבה לוגית/הסקה) - מצב thinking לבעיות מורכבות
•כתיבה יצירתית
•Multimodal - קריאת CXR, ECG, תמונות דרמטולוגיה ו-pathology slides
•Agentic - tool use (יכולת ה-AI לקרוא לפונקציות חיצוניות), תכניות מרובות-שלבים
מגבלות:
•Hallucinations עדיין 5-15% בטענות factuals (טענות עובדתיות)
•עברית השתפרה משמעותית אך אינה מושלמת
•Knowledge cutoff (התאריך עד אליו המודל יודע מידע): ינואר 2026
•Real-time (גישה לאינטרנט בזמן אמת): אין גישה לאינטרנט כברירת מחדל
•Latency (זמן תגובה): מצב extended thinking 30-90 שניות
•אינו מייצר תמונות
•אין voice mode מובנה
•קריאת ספר לימוד שלם (Bolognia, 4,000 עמודים) ושאלת שאלות עליו
•ניתוח 100 מאמרים ב-query (שאילתה - שאלה למודל) יחיד - 'מהו ה-consensus על dupilumab ב-BP במאמרים אלו?'
•Code: סקירת codebase בינוני (50K-200K שורות) והצעת refactoring (שיפור מבנה הקוד)
•ניתוח מטופלים: 10 שנים של EHR notes (במסלול Enterprise, HIPAA-compliant) ושאלת שאלות
•פרוטוקול ארוך: SAP של 47 עמודים בניסוי קליני, איתור סטיות
•סינתזת מסמכים: case יחד עם חמישה מאמרי review, הנחיות וההערות שלי, להפקת draft של discussion
עלות:
•1 מיליון tokens במחיר 5$ ל-query בעת שימוש ב-long context
•עם cache discount העלות יורדת ל-0.50$ כש-cache hit (פגיעה במטמון - שאלה דומה שכבר נשמרה)
•עבור שימוש רוטיני זה יקר מדי
•עבור משימות בעלות value גבוה זה משתלם
השוואה:
•GPT-5.5 - 256K tokens context בלבד
•Gemini 3.1 Pro - context גדול אך חלש מעט יותר ב-synthesis (סינתזה - חיבור מידע ממקורות שונים)
•Claude Opus 4.7 - ה-sweet spot לעבודה long-form
משימות אפשריות:
•קריאת X-ray ותיאור הממצאים
•פרשנות ECG
•הסתכלות על תמונת דרמטולוגיה והצעת DDx
•קריאת תמונת pathology slide
•הפקת נתונים מגרף או טבלה
דיוק (תלוי במשימה):
•תמונות גנריות - מדויק מאוד
•תמונות רפואיות - משתנה
•דרמטולוגיה - 60-75% דיוק ב-DDx (נמוך מדרמטולוג)
•דרמוסקופיה - פחות מדויק, לא מותאם אופטימלית
•פתולוגיה - פרשנות שטחית
השוואה: Med-Gemini עבר fine-tuning (אימון נוסף ייעודי) ייעודי לתמונות רפואיות, ולכן מדויק יותר בתחומים אלה
עבור clinical decision support: יש להשתמש כקלט אחד מתוך רבים, לא כסמכות. עבור הוראה: שימושי - 'תאר את מאפייני הנגע', 'מהן ה-differential diagnoses'
שימושים פרקטיים:
•מטופל ששולח תמונה ב-WhatsApp - triage מהיר עם Claude
•הערכה לקראת הביקור
•הוראת מתמחים
אזהרה: HIPAA - אין לשלוח תמונות מזהות של מטופלים ללא de-identification (הסרת פרטים מזהים מתיק רפואי) נכון ובלי שימוש במסלול Enterprise.
הפעלה:
•API parameter 'extended_thinking: true'
•ב-Claude.ai: thinking toggle
•ב-Opus 4.7 קיימת רמת מאמץ חדשה xhigh (בין high ל-max)
עלות: פי 5-10 מהרגיל. Latency: 30-90 שניות
מתי זה עוזר:
•Math או statistics מורכבים
•Multi-step clinical reasoning - ניתוח מקרה מורכב
•באגים ב-coding שדורשים ניתוח עמוק
•חידות לוגיות
•Differential diagnoses קשים
מתי לא:
•בירורי עובדה פשוטים
•תרגום
•סיכום של טקסט קצר
•כתיבה יצירתית
•שיחה רגילה
דוגמה רפואית: case מורכב עם 10 חריגות במעבדה, ריבוי תרופות וחשד ל-polypharmacy יחד עם autoimmune ו-drug-induced. ללא extended thinking - תשובה שטחית. עם extended thinking - reasoning מובנה: תיעדוף, שקילת ראיות והצעת workup
עלות מול תועלת:
•Query רגיל - 0.10-0.50$
•עם thinking - 0.50-3.00$
•עבור high-stakes case זה משתלם, עבור משימה רוטינית - לא
🏥 Claude for Healthcare - JPM26, HIPAA, ISO 42001
מה Claude for Healthcare כולל:
•HIPAA-ready infrastructure ל-Enterprise customers
•מודלים שאומנו ספציפית למשימות healthcare ו-life sciences
•אינטגרציות native ל-databases רפואיים: CMS Coverage Database, ICD-10 codes, PubMed
•Use case מרכזי - Prior Authorization: Claude שולף דרישות coverage מ-CMS או מ-policies מותאמות, בודק clinical criteria מול patient records (HIPAA-ready), ומציע determination יחד עם supporting materials ל-payer review. עיבוד שלקח שעות מתבצע בדקות.
•Patient care coordination - הפחתת לחץ זמן על clinicians
•Regulatory submissions - האצת תהליך הגשה של תרופות
Consumer features (במסלולי Pro/Max):
•HealthEx - האינטגרציה הראשונה של consumer health record
•Apple Health - rolling out ב-beta דרך אפליקציית Claude iOS
•Android Health Connect - rolling out ב-beta דרך אפליקציית Claude Android
•סיכום medical history, הסברת lab results, זיהוי patterns
•הכנת שאלות ייעודיות לפגישות עם רופאים
שותפי הכרזה: Banner Health, Novo Nordisk ו-AbbVie. בארה״ב, HIPAA (Health Insurance Portability and Accountability Act 1996 - חוק אמריקאי להגנת PHI) דורש שכל שירות המטפל ב-PHI (Protected Health Information - מידע רפואי מזהה: שמות, ת.ז., תיקים) יעמוד בסטנדרטים.
מסלולי Claude של Anthropic:
•Claude.ai Free - שימוש אישי, ללא BAA וללא HIPAA
•Claude.ai Pro (20$ לחודש) - שימוש אישי, ללא BAA, אך כולל את consumer health features (HealthEx, Apple Health, Android Health Connect)
•Claude Max (200$ לחודש) - הרחבה של Pro, כולל consumer health features
•Claude Team (30$ לחודש למשתמש, מינימום חמישה משתמשים) - שיתוף בין חברי צוות, ללא BAA וללא HIPAA
•Claude Enterprise (תמחור מותאם, 30-100$ ומעלה למשתמש לחודש, מינימום 50 משתמשים) - BAA זמין, HIPAA-ready, מוסמך ISO 42001 ו-SOC 2 Type II (Service Organization Controls - audit ל-cloud services)
ההבדל קריטי. למי שרוצה לשלוח PHI מסלול Enterprise חובה. Team אינו מספיק.
מה ש-Enterprise כולל:
•BAA חתום (Business Associate Agreement - חוזה תחת HIPAA המגדיר אחריות על PHI)
•הצפנת PHI ב-rest (במנוחה - בעת אחסון) וב-transit (במעבר ברשת)
•Audit logs (יומני ביקורת)
•בקרות גישה (SSO, role-based - SSO=Single Sign-On, role-based=מבוסס תפקיד)
•אפשרויות data residency (היכן נשמרים הנתונים גיאוגרפית)
•אין training על נתוני לקוחות לעולם
•תמיכה ייעודית
•הסמכות compliance
ISO 42001 (2023) הוא תקן ל-AI Management Systems, ו-Anthropic הייתה אחת מספקי ה-LLM (Large Language Model - מודל שפה גדול) הראשונים שעמדו בו (הוסמכה ב-6 בינואר 2025 על ידי Schellman Compliance, מהראשונות בין frontier AI labs).
בישראל: HIPAA אינו רלוונטי באופן ישיר (חוק אמריקאי), אך חוק הגנת הפרטיות 1981 (תיקון 13 משנת 2018) דומה ברוחו. הליבה: הסכמה מודעת, minimization (מינימיזציה - איסוף רק מה שצריך) ו-security.
רופא ישראלי השולח PHI ל-AI cloud צריך:
•הסכמת מטופל
•Data minimization (de-identify במידת האפשר)
•Security סביר
מסלול ה-Enterprise של Anthropic מספק security סביר, אך הסכמה ספציפית עדיין נדרשת.
הדרישות:
•AI risk management - זיהוי, הערכה ומיתון של סיכונים
•AI lifecycle - design, deploy, monitor ו-decommission
•Data governance - quality, lineage ו-consent
•Transparency - explainability היכן שאפשר
•Accountability - אחריות ברורה להחלטות AI
•Performance monitoring
עבור enterprise customers - סימן למקצועיות
ב-procurement, ISO 42001 הופך לדרישה. Anthropic קיבלה הסמכה ב-6 בינואר 2025 (early adopter, הוסמכה על ידי Schellman Compliance). Microsoft, Google, AWS ו-OpenAI עמדו בתקן במהלך 2025
עבור קליניקות: רלוונטי כאשר רגולטורים או חברות ביטוח דורשים AI compliance. בישראל: עדיין לא נדרש, אך המגמה מגיעה
עבור שיתופי פעולה במחקר עם מוסדות אירופאים: צפוי יותר ויותר
הצעה: בעת בחירת ספק AI, יש לוודא הסמכת ISO 42001. זהו סימן ל-AI governance בוגר.
העקרונות:
•הסכמה מודעת
•מטרה ספציפית
•Minimization
•Security
•Accuracy
•Retention
•זכויות נושא המידע
עבור AI שמטפל ב-PHI - כל אלו חלים
השלכות:
•הסכמה ספציפית, general consent אינו מספיק
•Minimization - de-identify במידת האפשר
•Security - הצפנה ב-rest וב-transit (מסלול Anthropic Enterprise מספק זאת)
•Audit logs
•Breach notification
לרופא בפועל:
•יש להוסיף סעיף לטופס ההסכמה של המטופל בנוגע לעיבוד ב-AI
•De-identify של clinical data לפני שליחה
•שימוש במסלול Enterprise או on-premise עבור PHI
•תיעוד שימוש ב-AI ב-record של המטופל
•להישאר מעודכן, הרגולציה מתפתחת
ב-2026: רגולטור הגנת הפרטיות הישראלי טרם הוציא הנחיות ספציפיות ל-AI, אך ה-EU AI Act משפיע.
הזרימה המסורתית:
•רופא מבקש טיפול/תרופה
•עוזר/מזכירה ממלא טופס prior auth
•הטופס נשלח ל-payer
•reviewer ב-payer קורא את הבקשה (ידנית) ומחפש דרישות coverage ב-CMS או ב-policy פנימי
•reviewer בודק קריטריונים מול תיק המטופל
•determination (אישור/דחייה) חוזר לרופא
הזמן: שעות עד ימים. עיכוב טיפולי
הזרימה עם Claude for Healthcare:
•Claude שולף את דרישות ה-coverage אוטומטית מ-CMS Coverage Database או מ-policies מותאמות
•Claude בודק את ה-clinical criteria מול patient records (HIPAA-ready)
•Claude מציע determination יחד עם supporting materials
•reviewer אנושי מאשר או דוחה
הזמן: דקות. שיפור efficiency של פי 10-50
שותפי השקה:
•Banner Health - מערכת בריאות גדולה
•Novo Nordisk - חברת תרופות (סוכרת, השמנה)
•AbbVie - חברת תרופות (Humira, Skyrizi)
Reuse בקליניקה דרמטולוגית: למרות ש-prior auth אינו מרכזי בישראל, יש מקבילה - אישורי ועדה (יותרת, סל בריאות מורחב). ה-pattern רלוונטי: אוטומציה של תהליך coverage-checking
גישה: דרך Claude Enterprise, חיובי הכרזת Anthropic באתר הרשמי
יתרונות:
•מודלים state-of-the-art
•אין דרישת תשתית
•BAA זמין
•ISO 42001
חסרונות:
•עלות (30-100$ ומעלה למשתמש לחודש)
•הנתונים על cloud (גם עם BAA)
•Vendor lock-in (תלות בספק - קושי לעבור)
שימוש מתאים: קליניקות עם צרכי AI עקביים
On-Premise (הרצה מקומית בארגון - לא בענן) (Llama 4, MedGemma, Mistral):
יתרונות:
•שליטה מלאה בנתונים (PHI לא יוצא החוצה)
•השקעה חד-פעמית
•ללא תשלום שוטף למשתמש
•ניתן להתאמה
חסרונות:
•מודלים חלשים יותר
•דרישת תשתית (שרת GPU מעל 10,000$)
•נדרש ידע טכני
שימוש מתאים: privacy-critical, צוות טכני
Hybrid: ההגיוני ביותר. שימוש ב-Enterprise לעבודה כללית עם AI ושימוש ב-on-premise ל-PHI ברגישות גבוהה
דוגמה: תמונות ניתוח מוז - on-premise. חיפוש ספרות שוטף - cloud
בישראל ב-2026:
•רוב הקליניקות העצמאיות - cloud Enterprise
•בתי חולים גדולים - hybrid
•מחקר אקדמי - cloud בדרך כלל מספק כאשר הנתונים de-identified
💻 Claude Code - Agentic Coding
ההבדל מ-GitHub Copilot: Copilot מבצע autocomplete (מציע את השורה הבאה תוך כדי הקלדה). Claude Code פועל על codebase שלם ומבצע שינויים מרובי-שלבים (קריאת קבצים, עריכה, הרצת בדיקות, debugging - ניפוי באגים).
הקלט: terminal command. הזרימה: הקלדת 'claude' ב-terminal פותחת session ב-codebase. המשתמש כותב משימה. Claude קורא את הקבצים הרלוונטיים, מתכנן שינויים, עורך קבצים, מריץ בדיקות ומדווח חזרה.
מה שמאפשר זאת:
•Long context (1M tokens)
•Tool use - קריאה וכתיבה לקבצים, הרצת bash commands (פקודות מערכת הפעלה), חיפוש
•Project memory (CLAUDE.md - קובץ זיכרון לפרויקט)
•Reasoning - תכנון מרובה-שלבים
•Hooks (וו - חיבור פעולות אוטומטיות) לאוטומציה
שימושים מעבר ל-coding:
•ניתוח מסמכים
•עיבוד נתונים
•אוטומציה (bash commands ו-file operations)
•מחקר
•ניהול פרויקטים
המסמך הזה נכתב באמצעות Claude Code.
הפיצ'רים מתפתחים:
•MCP (Model Context Protocol - protocol של Anthropic ל-LLMs לחבר ל-tools חיצוניים)
•Plugins - הרחבות שפותחו על ידי קהילה
•Custom agents
•Settings - permissions, hooks ו-env vars (משתני סביבה)
תמחור: Claude Pro/Team/Enterprise כוללים את Claude Code ללא תשלום נוסף. עבור מי שאינם מפתחים: Claude.ai web מספק. עבור מפתחים וחוקרים: Claude Code משנה את כללי המשחק.
בקליניקה: רוב הרופאים לא ישתמשו. רופאי מחקר שמכינים scripts (קבצי הוראות אוטומטיות) לניתוח נתונים - Claude Code יכול להחליף עבודת python שלמה.
דוגמה: 'קרא CSV של נתוני מטופלים, חשב סטטיסטיקה בסיסית והפק עקומת Kaplan-Meier ב-R script'. Claude Code מבצע זאת ב-2-3 דקות לעומת 1-2 שעות של coding ידני.
אך נדרשת תחושה בסיסית של עבודה עם קבצים ו-terminal.
•ניתוח סטטיסטי - 'יש לי CSV עם 200 מטופלים ו-PASI scores בשבועות 0, 12, 24. חשב descriptive stats, paired t-test וצור גרף ב-R'. Claude מייצר R script, מריץ אותו ומציג פלט
•ניתוח survival - '50 מטופלים עם מלנומה, נתוני time-to-event. צור Kaplan-Meier curves להשוואת שתי קבוצות והרץ log-rank test'
•עיבוד תמונות - 'המר 100 תמונות דרמוסקופיה לגודל סטנדרטי 224x224 ושמור בתיקייה'
•ניקוי נתונים - 'בקובץ Excel זה יש typos, ערכים חסרים ו-formats לא עקביים. נקה אותו ודווח על הבעיות'
•הכנת מאמר - 'צור Table 1 (דמוגרפיה) מקובץ CSV זה בסגנון JAMA'
•ספרות - 'קרא 20 PDFs בתיקייה, חלץ: study design, n, intervention, primary outcome ו-results. ייצא ל-CSV'
דרישות: נוחות עם terminal ועם file folders, נכונות ללמוד CLI בסיסי
ROI: שעות נחסכות לכל ניתוח, חודשים נחסכים לכל פרויקט
אזהרה: יש לאמת את ה-code של Claude על sample data לפני שימוש על נתונים אמיתיים.
•מבוסס web, sandbox מבודד
•מעלים קבצי CSV ו-ChatGPT מריץ Python עליהם
•הפלט: code, results ו-plots
•הנתונים נמחקים בסיום ה-session
Claude Code:
•Terminal-native
•פועל על מערכת הקבצים שלך
•קורא קבצים בתיקייה שלך, עורך אותם ומריץ commands
•עובד באופן Persistent
ההבחנה: Code Interpreter = 'עבד על הקובץ ב-cloud'. Claude Code = 'עבד על הפרויקט שלי על המחשב שלי'
מתי Code Interpreter עדיף:
•ניתוח חד-פעמי
•אין צורך ב-persistence
•העדפה ל-web interface
•פחות טכני
מתי Claude Code עדיף:
•פרויקט מתמשך
•עבודה עם מספר קבצים
•צורך להריץ commands
•Developer workflow
לרוב הרופאים: Code Interpreter נגיש יותר. לרופאי מחקר מתקדמים: Claude Code מספק יותר ערך.
שלב 2 (חמש דקות): authenticate. 'claude' ב-terminal. התחברות עם חשבון Claude Pro
שלב 3 (עשר דקות): הרצה ראשונה. פתח תיקייה של פרויקט. 'claude' פותח session. שאל: 'הסבר מה נמצא בתיקייה הזו'
שלב 4 (עשר דקות): נסה משימה. 'צור CSV של 100 מטופלי דרמטולוגיה fake עם עמודות ID, age, diagnosis ו-PASI'. Claude יבצע
השקעת זמן: 30 דקות עד שעה כדי להגיע לתחושת נוחות. לאחר מכן שימוש שוטף 1-2 פעמים בשבוע. ה-ROI מצטבר עם כל משימה שנחסכת
אופציה: הגדרת CLAUDE.md, קובץ זיכרון לפרויקט. ניתן להוסיף:
•הערות workflow
•פקודות נפוצות
•מבנה הפרויקט
Learning curve: נמוך עבור משתמשים נוחים טכנית, בינוני לאחרים
מקורות:
•תיעוד ב-docs.anthropic.com/claude-code
•קהילה: r/Anthropic ו-X
📊 השוואה ל-GPT-5.5 ול-Gemini 3.1 Pro - מי הכי טוב?
•GPT-5.5 (OpenAI, 24 באפריל 2026)
•Claude Opus 4.7 (Anthropic, 16 באפריל 2026)
•Gemini 3.1 Pro (Google, 19 בפברואר 2026)
Context window:
•GPT-5.5 - מעל 1M tokens (1,050,000), max output 128K
•Claude Opus 4.7 - 1M tokens
•Gemini 3.1 Pro - context גדול
תמחור (input/output למיליון tokens):
•GPT-5.5 - 5$ / 30$ (פי 2 מ-GPT-5.4 שהיה ב-2.50$/15$). Pro Tier: 30$/180$. עבור prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output
•Claude Opus 4.7 - 5$ / 25$
•Gemini 3.1 Pro - 7$ / 21$
Benchmarks חדשים מהשקת GPT-5.5:
•Terminal-Bench 2.0 (coding agentic, real-world workflows) - GPT-5.5 82.7%, Claude Opus 4.7 69.4%, GPT-5.4 75.1%. פער של 13+ נקודות לטובת GPT-5.5
•FrontierMath Tiers 1-3 - GPT-5.5 51.7%, Claude Opus 4.7 43.8%
•FrontierMath Tier 4 (הקשה ביותר) - GPT-5.5 35.4%, Claude Opus 4.7 22.9%, Gemini 3.1 Pro 16.7%
•MRCR v2 (long-context, 1M tokens) - GPT-5.5 74.0% (קפיצה מ-36.6% ב-GPT-5.4)
•SWE-bench Verified - Claude Opus 4.7 87.6% (מוביל)
יכולות לפי קטגוריה:
•Coding ארוך-טווח (SWE-bench) - Claude Opus 4.7 מוביל
•Coding agentic (Terminal-Bench 2.0) - GPT-5.5 מוביל בפער
•Math/FrontierMath - GPT-5.5 מוביל בפער (במיוחד Tier 4)
•כתיבה ו-long-form - Claude Opus 4.7 מוביל, GPT-5.5 קרוב
•Multimodal - Gemini 3.1 Pro מוביל (טקסט, תמונה, וידאו ואודיו), GPT-5.5 חזק, Claude Opus 4.7 תומך בטקסט, תמונה ו-PDF בלבד
•Multilingual (רב-לשוני) - Gemini 3.1 Pro מוביל, Claude Opus 4.7 השתפר
•עברית - Gemini 3.1 Pro הכי טוב, Claude קרוב, GPT-5.5 בסוף
•Real-time ואינטרנט - Gemini 3.1 Pro מוביל (אינטגרציה מובנית עם Google search)
•Tool use ו-agentic - Claude Opus 4.7 יחד עם Claude Code הם המובילים בקוד ארוך-טווח, GPT-5.5 מוביל ב-terminal agentic
•Safety ו-refusals (סירובי AI - מתי המודל מסרב לענות) - Claude בדרך כלל הזהיר ביותר
•עמידות ל-hallucinations - Claude הטוב ביותר בטענות factuals
עבור medical use cases:
•Literature synthesis - Claude הטוב ביותר (1M tokens context, ציטוטים זהירים)
•Multi-document analysis - Claude
•Coding למחקר - Claude Code משנה את כללי המשחק
•Multimodal רפואי - Gemini 3.1 Pro ב-Vertex AI
•עבודה קלינית בעברית - Gemini 3.1 Pro הכי טוב במעט
•HIPAA-eligible / HIPAA-ready - כל השלושה (Claude for Healthcare מ-JPM26)
הבחירה: לרוב המשתמשים, כל אחד מהשלושה עובד.
יתרונות לפי מודל:
•Claude - long context, זהירות, SWE-bench מוביל ו-Claude Code
•GPT-5.5 - הפופולרי ביותר, ecosystem רחב, מוביל ב-Terminal-Bench וב-FrontierMath
•Gemini 3.1 Pro - multimodal, multilingual ואינטגרציה עם Google
•אם כן - Claude Opus 4.7 (1M tokens) או Gemini 3.1 Pro
•אם לא - כל מודל יתאים
שאלה 2 - 'האם אני עובד עם video או audio?'
•אם כן - Gemini 3.1 Pro (multimodal הטוב ביותר)
•אם לא - כל מודל יתאים
שאלה 3 - 'האם אני עושה coding?'
•אם כן - Claude Opus 4.7 (SWE-bench הטוב ביותר) יחד עם Claude Code
•אם לא - כל מודל יתאים
שאלה 4 - 'האם אני זקוק ל-reasoning המתקדם ביותר?'
•אם כן - GPT-5.5 או Claude Opus 4.7 עם extended thinking (כולל רמת xhigh חדשה)
•אם לא - כל מודל יתאים
שאלה 5 - 'האם התקציב מצומצם?'
•אם כן - Llama 4 או Muse Spark (חינמי, open source) או Claude Opus 4.7 (ה-premium הזול ביותר ב-5$/25$ למיליון tokens)
•אם לא - כל מודל יתאים
שאלה 6 - 'האם privacy קריטי?'
•אם כן - מסלול Enterprise של אחד המודלים או on-premise (Llama 4, MedGemma)
•אם לא - מסלול Pro
שאלה 7 - 'האם השפה הראשית עברית?'
•אם כן - Gemini 3.1 Pro מוביל במעט, Claude קרוב
•אם לא - כל מודל יתאים
בפועל: רוב הרופאים ישתמשו ב-1-2 כלים. Claude Opus 4.7 בשילוב Haiku 4.5 הזול מכסה כ-95% מהצרכים.
•Claude Opus 4.7 - 5$ למיליון input, 25$ למיליון output
•GPT-5.5 - 5$ למיליון input, 30$ למיליון output (פי 2 מ-GPT-5.4 ב-2.50$/15$). GPT-5.5 Pro - 30$/180$. ה-effective cost גבוה ב-~20% מ-GPT-5.4 (אך 40% פחות tokens per task)
נשמע זול
בפועל - עלויות נסתרות:
•Long context יקר - query של 1M tokens = 5$ ל-input בלבד. שימוש שוטף יוצא יקר
•GPT-5.5 ב-prompts מעל 272K tokens - פי 2 ב-input ופי 1.5 ב-output
•Output יקר פי 5-6 מ-input. דוחות ארוכים יקרים
•טוקניזציה (חיתוך טקסט ל-tokens) של עברית פי 3 = עלות אפקטיבית פי 3. 5$ באנגלית שווים ל-15$ בעברית. בנוסף, ב-Opus 4.7 הוצג טוקנייזר (האלגוריתם שחותך טקסט ל-tokens) חדש שמייצר עד 35% יותר tokens עבור אותו טקסט
•שיחות multi-turn (רב-סבב) - כל הסבבים הקודמים נספרים שוב בכל סבב. 10 סבבים = סכום כל הסבבים הקודמים
•Tools ו-agentic - כל tool call (קריאה לכלי חיצוני) = עוד tokens. משימות מרובות-שלבים יקרות
•Cache discount 90% - רק כשיש cache hit
•מסלולי subscription (Claude Pro 20$ לחודש) - שימוש 'unlimited' אך עם rate limit (מגבלת קצב שימוש)
•Enterprise - תמחור מותאם של 30-100$ למשתמש לחודש
הערכה: קליניקה טיפוסית עם חמישה משתמשים ב-Claude Pro = 100$ לחודש. עם Enterprise = 250-500$ לחודש
חישוב ROI (Return on Investment - תשואה על השקעה): כמה זמן ה-AI חוסך. חיסכון של 10 שעות בחודש (צנוע) ב-100$ לשעה = ערך של 1,000$ מול עלות של 100$ = ROI של פי 10. החישוב פשוט.
•81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023)
•94% משתמשים או מתעניינים
•76%+ מאמינים ש-AI משפר את הטיפול (מ-65% ב-2023)
•ממוצע use cases - 2.3 לרופא (1.1 ב-2023)
•70% רואים ב-AI כלי להפחתת burnout
Use cases מובילים (AMA 2026):
•סיכומי מחקר רפואי וסטנדרטים של טיפול - 39%
•הוראות שחרור, care plans ו-progress notes - 30%
•Documentation של billing, charts ו-visit notes - 28%
•Generation של chart summaries - 28%
•AI scribes - 29%
Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151 רופאים, 15 specialties):
•47% במרץ-אפריל 2025 → 63% בנובמבר 2025-ינואר 2026
•74% מהמשתמשים - שימוש יומי לפחות
•36% - מספר פעמים ביום
•Top use case - חיפוש ספרות (35%, מ-22% ב-אפריל 2025)
•Voice/scribes - 29% (מ-20%)
•71% חששות ראשי - דיוק ו-reliability
העדפת כלים:
•ChatGPT - 65%
•Claude - 23%
•Gemini - 18%
•Copilot - 15%
בישראל (סקר informal, דרמטולוגים, n=85, מרץ 2026):
•ChatGPT - 78%
•Claude - 28%
•Gemini - 35%
שימוש מועט יותר ב-Claude לעומת ארה״ב (ecosystem effect)
חששות שעלו:
•Hallucinations (מקום ראשון)
•פרטיות (שני)
•עלות (שלישי)
•איכות עברית (רביעי)
יתרונות שצוינו:
•חיסכון בזמן וצמצום administrative burden
•Drafts טובים יותר
•שיפור work-life balance ו-job satisfaction
•תקשורת קלה יותר עם מטופלים
המגמה: השימוש ב-AI גדל במהירות. ב-2023 היה 38% (AMA), ב-2026 הוא 81% (AMA). עד 2028 הוא צפוי לעבור 90%.
🤔 האם זו באמת מהפכה? נתוני adoption ב-2026
נתוני adoption (אימוץ - שיעור המשתמשים) ב-2026:
•AMA Physician AI Survey 2026 (מרץ 2026) - 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-38% ב-2023). 94% משתמשים או מתעניינים. 76%+ מאמינים ש-AI משפר טיפול (מ-65% ב-2023). 70% רואים ב-AI כלי להפחתת burnout.
•Doximity State of AI in Medicine 2026 (מרץ 2026, n=3,151) - 63% adoption בנובמבר 2025-ינואר 2026 (עלייה מ-47% במרץ-אפריל 2025). 74% מהמשתמשים - שימוש יומי. 36% - מספר פעמים ביום.
•סקר Clalit 2026 - כ-60% מהרופאים בישראל משתמשים ב-AI מדי שבוע
אך מה משמעות הדבר? Real impact: גם ב-2026, ה-AI:
•אינו מאבחן באופן עצמאי
•אינו מחליף דרמטולוגים
•אינו משנה משמעותית את outcomes המטופלים
•אינו מוטמע באופן רחב ב-EHR
•אינו מפחית את עלויות המערכת
מה כן השתנה:
•זמן ה-documentation ירד ב-30-60 דקות ביום (AI scribes - מתעתקי AI לפגישות מטופל)
•Prior authorization - מ-Claude for Healthcare (JPM26): מהשעות לדקות
•זמן חיפוש בספרות מהיר פי 10 (Top use case ב-Doximity 2026 - 35%)
•מכתבי תקשורת למטופלים מהירים פי 5
•גישה להוראה רפואית התרחבה
•יעילות המחקר השתפרה
•הוראת מתמחים - ה-AI מסייע
ההגדרה של 'מהפכה': בהיסטוריה הרפואית, מהפכות אמיתיות הן:
•פניצילין (1928)
•חיסונים
•הרדמה
•אנטיספסיס
•MRI
•השתלות אברים
•Monoclonal antibodies
ה-AI ב-2026 אינו ברמה הזו. עדיין. אולי בעתיד.
אך מצד שני: ה-AI ב-2026 הוא מהפכת הפרודוקטיביות הגדולה ביותר מאז המחשב (שנות ה-80) והאינטרנט (שנות ה-90). חוסך זמן משמעותי, חיוני ל-research workflow, שיפר drafting ו-communication.
ברדיולוגיה - AI screen-reading קיבל אישור FDA. בדרמטולוגיה - AI image analysis מתפתח (DermaSensor קיבל אישור FDA ב-2024) אך עדיין אינו standard of care.
הצפי ל-2027-2030:
•AI מוטמע יותר ב-EHR
•Clinical decision support בזמן אמת
•Patient triage עם AI
•במקביל הרגולציה מתהדקת (EU AI Act 2026 enforcement - אכיפת חוק ה-AI האירופי)
השורה התחתונה: Anthropic (Claude for Healthcare), OpenAI (ChatGPT Health) ו-Google מחוללים מהפכה בכלים שהרופאים משתמשים בהם, אך אין מהפכה במקצוע עצמו. הוא נשאר human-driven. ה-AI מסייע, אינו מחליף.
כלים:
•ChatGPT - 75%
•Claude - 22%
•Gemini - 18%
•AI ייעודי לדרמטולוגיה - 12%
שימושים:
•Documentation ו-scribe - 45%
•תקשורת עם מטופלים - 38%
•ספרות - 32%
•DDx - 28%
•חומרי הסברה למטופלים - 22%
•Triage של תמונות - 8%
פריסת AI ייעודי לדרמטולוגיה:
•SkinVision (CE marked - אישור התאמה אירופי) - אפליקציית מטופלים, מעל 2M משתמשים באירופה
•DermaSensor (אישור FDA 2024)
•AI scribes (Heidi, Augmedix) - 25% מקליניקות הדרמטולוגיה בארה״ב בפיילוט
ישראל: Clalit ומכבי מריצות פיילוטים בשנים 2024-2026 עם מספר משתמשים מצומצם בפועל
עתיד: AI image analysis בצמיחה, וכך גם teledermatology עם triage מבוסס AI
מגבלות:
•המודלים אומנו רובם על עור בהיר ומתקשים בגוונים כהים יותר
•אינם מתעדים היסטוריה והקשר קליני
•הרגולציה של ה-FDA עדיין מתבגרת
הצפי: ב-2027-2028 ה-AI יהיה מוטמע יותר, אך לא יחליף את הרופא.
•Wang 2024 (BMJ) - AI scribe הפחית זמן documentation ב-33%. האיכות נשמרה ו-burnout ירד, אך outcomes קליניים לא נמדדו
•Hager et al. 2024 (Nature Medicine) - 'Evaluation and mitigation of the limitations of LLMs in clinical decision-making' - LLMs מובילים מאבחנים פחות טוב מרופאים, אינם עוקבים אחר הנחיות clinical, ואינם מפרשים תוצאות מעבדה
•Smith 2025 (NEJM) - meta-analysis של 47 מחקרי clinical decision support מבוססי AI. שיפור מתון ב-metrics מסוימים (אבחון בזמן +8%), אך ללא השפעה משמעותית על mortality, readmission ו-complications
•DermaSensor RCT (2024) - מכשיר נייד לזיהוי סרטן עור ב-primary care. Sensitivity 96%, specificity 73%. היה גורם ל-25% יותר ביופסיות אך תופס 96% מהמלנומות
•מחקרי השוואה בין AI לדרמטולוג - בשנים 2017-2023 ה-AI השווה לדרמטולוג בתמונות מבודדות. במציאות (Han 2023): AI הגיע ל-73% דיוק על image set (מערך תמונות) חדש, דרמטולוג ל-85%. המציאות מאתגרת יותר
לסיכום: שיפורי efficiency מוכחים, שיפורי outcomes עם ראיות מוגבלות
הקריאה: ה-AI הוא כלי פרודוקטיביות אמיתי. ההשפעה הקלינית עדיין מתפתחת. אין למכור יתר על המידה למטופלים, ואין להמעיט בערכו מול עמיתים.
•השערה 1 (סבירה) - AI scribe יהפוך לסטנדרט. כל קליניקה בישראל ובארה״ב תשתמש ב-AI scribe ב-2030, עם חיסכון של מעל 80% בזמן ה-documentation
•השערה 2 (סבירה) - Clinical decision support יהפוך ל-mainstream. הצעות AI בזמן אמת בתוך ה-EHR
•השערה 3 (אפשרית) - AI image analysis יהפוך לכלי סטנדרטי. מכשירים ניידים ב-primary care
•השערה 4 (לא סבירה) - אבחון AI עצמאי. לא סביר עד 2030 בשל רגולציה, אחריות משפטית, קבלת המטופלים ו-edge cases
•השערה 5 (לא ודאית) - AI במחקר. אוטומציה רחבה של SR. עיצוב ניסויים קליניים מסייע ב-AI. סביר שכן
סוגיות בוערות לקראת 2030:
•רגולציה (EU AI Act ייושם במלואו, ארה״ב בעקבותיה)
•מסגרות אחריות משפטית
•Reimbursement (כיסוי ביטוחי לכלי AI)
•כוח אדם
השורה התחתונה: ה-AI הוא כלי augmentation. דרמטולוגים ב-2030 עדיין חיוניים. ה-workflow ישתנה משמעותית, אך שיקול הדעת, התקשורת והמיומנויות הפרוצדורליות יישארו ליבה אנושית.
✅ Take-aways לדרמטולוג בישראל ב-2026
ההבדל מתקופת pre-2022 ChatGPT era: בעבר ה-AI היה כלי למומחים, כיום הוא mainstream tool. אך הוא אינו משנה את ה-fundamentals של עבודת הדרמטולוג.
היכן Claude בולט:
•Long-form analysis בזכות 1M tokens context
•Coding - Claude Code משנה את כללי המשחק בניתוח נתוני מחקר
•Safety - Constitutional AI
•תמחור - 5$/25$ למיליון tokens, הזול ביותר בקטגוריית premium
•עברית - שיפור משמעותי
•Enterprise - HIPAA ו-ISO 42001 ready
היכן Claude אינו בולט:
•Multimodal - GPT-5.5 ו-Gemini 3.1 Pro חזקים
•Real-time ואינטרנט - native טוב יותר ב-Gemini
•Ecosystem (סביבת כלים והרחבות) ו-plugins - ל-GPT-5.5 יש יותר
•Brand recognition - ChatGPT הוא ה-brand הצרכני
לרופא בישראל ב-2026: יש לבחור על בסיס use case ולא נאמנות.
Stack מעשי:
•NotebookLM (חינמי)
•Claude Pro או ChatGPT Plus (20$ לחודש)
•אולי גם Gemini Pro (חינמי עם Google One במחיר נמוך לחודש)
•סך הכול כ-22$ לחודש
המיצוב הייחודי של Claude: long context, safety ו-coding הופכים אותו לכלי של חוקרים. עבור עבודה קלינית טהורה כל frontier model יעבוד דומה.
מחשבה מסכמת: אוריינות AI הופכת לחלק מהכשירות של רופא. בבתי הספר לרפואה החל מ-2030 ילמדו prompt engineering (אומנות כתיבת ההוראות ל-AI). CME credits עבור קורסי AI. ייתכן ש-accreditation (תהליך הסמכה רשמי) ידרוש כשירות AI בסיסית.
הצעדים:
•הירשמו לפחות לכלי AI מתקדם אחד (20$ לחודש)
•הקדישו 30 דקות ביום במשך 30 יום
•פתחו workflow אישי
•הישארו מעודכנים
•גלו את השימוש כשנדרש
•שמרו על חשיבה ביקורתית
ה-AI כאן כדי להישאר. צריך לאמץ אותו.
•יום 1 - רישום ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus ורישום ל-NotebookLM (חינמי)
•ימים 2-3 - תרגול שאלות בסיסיות
•ימים 4-7 - ניסיון use case ספציפי - drafting של מכתב הפניה או סיכום מאמר עדכני
שבוע 2 - Workflow:
•ימים 8-10 - שילוב בשגרה היומית. AI למשימה אחת לפחות ביום
•ימים 11-14 - פרויקט NotebookLM - העלאת 5-10 מאמרים בנושא נבחר
שבוע 3 - Optimization:
•ימים 15-18 - בניית prompt library
•ימים 19-21 - בדיקת כלים נוספים (Perplexity לחיפוש, Consensus לראיות)
שבוע 4 - Review:
•ימים 22-25 - הערכת הזמן שנחסך. אומדן וכימות
•ימים 26-28 - זיהוי כאבים מתמשכים
•ימים 29-30 - תכנון 90 הימים הבאים
השאלה המרכזית: לאחר 30 יום, האם אתה חוסך זמן? אם כן - להמשיך. אם לא - לבחון מחדש את הגישה. רוב המשתמשים אינם רואים את התועלת המלאה לפני 60-90 יום, ההתמדה משתלמת.
•אמון יתר ב-AI - דוגמה: ה-AI מצטט 'מחקר X הראה 75% efficacy' מבלי שתאמת, והמחקר אינו קיים. הפתרון: לאמת תמיד
•אי-גילוי שימוש ב-AI - ההשלכות: בעיות אתיות וסיכון retraction (משיכת מאמר שפורסם) בעת חשיפה. הפתרון: לגלות את השימוש במאמרי מחקר ובאינטראקציות עם מטופלים כשרלוונטי
•שליחת PHI ל-consumer tier (מסלול צרכני - לא ארגוני) - הפרה של חוק הגנת הפרטיות בישראל. הפתרון: de-identify לפני השליחה או שימוש במסלול Enterprise
•אינטראקציות מטופל מומצאות - ה-AI 'זוכר' שמטופל X אמר משהו, אך מדובר בהמצאה. הפתרון: AI scribes שמקליטים אודיו, אמינים יותר
•הפיכה לתלוי מדי ב-AI ושכחה לחשוב באופן ביקורתי - הפתרון: לשמור על שיקול דעת קליני כראשי
•ריבוי כלים - ניסיון להשתמש ב-ChatGPT, Claude, Gemini ובחמישה כלים נוספים. מציף את המשתמש. הפתרון: להישאר עם 2-3 כלים לכל היותר
•בעיות עברית מבלי לשים לב - ה-AI מתרגם מילולית ושמות תרופות מתעוותים. הפתרון: לסקור בקפידה
•פלטים גנריים - טקסט שמרגיש 'AI'. הפתרון: לערוך, לתת אופי אישי ולהוסיף את הקול שלך. ה-AI הוא נקודת התחלה
•הירשם ל-Claude Pro (20$ לחודש) או ל-ChatGPT Plus. כלי אחד, התחל. אחרי חודש תרגיש את ההבדל
•הוסף את NotebookLM (חינמי) לעבודה עם ספרות ול-deep dives. משלים את הכלי הראשי
•הקצב 30 דקות ביום במשך חודש. שילוב לוקח זמן, אל תצפה לקסם מיידי
•הכר את HIPAA ואת חוק הגנת הפרטיות. אין לשלוח PHI ל-consumer tiers. בצע de-identify או השתמש במסלול Enterprise
•שמור על חשיבה ביקורתית. לאמת תמיד את פלטי ה-AI, במיוחד ציטוטים, מספרים, מינוני תרופות והחלטות קליניות
•גלה את השימוש כשנדרש. גילוי במחקר, שקיפות מול המטופל כאשר רלוונטי. הנחיות ICMJE (International Committee of Medical Journal Editors - הועדה הבינלאומית של עורכי כתבי עת רפואיים) 2024 קובעות את הרף
•הישאר מעודכן. ה-AI משתנה מדי חודש. עקוב אחר @AnthropicAI, @OpenAI ומובילי AI בדרמטולוגיה ב-X. חמש דקות ביום
•Workflow עברי - צפה לבעיות. שילוב של אנגלית ועברית פעמים רבות הוא הטוב ביותר. אמת את הפלט בעברית
•אל תשווה את עצמך לעמיתים יתר על המידה. כל אחד מאמץ בקצב שלו. ה-learning curve אמיתי
•בנה את ה-workflow לאורך שנים. עד 2030 ה-AI יהיה חיוני לעבודה. התחלה עכשיו ממקמת אותך בקדמת הבמה
שורה תחתונה
Claude (ו-Anthropic בכלל) הוא אבולוציה משמעותית, לא מהפכה. Anthropic נוסדה ב-2021 על ידי חוקרים שעזבו את OpenAI, ומתמקדת ב-AI safety וב-Constitutional AI. שווי 380 מיליארד דולר לאחר Series G של פברואר 2026 (revenue run-rate מעל 30 מיליארד דולר). Claude for Healthcare הושק ב-12 בינואר 2026 ב-JPM26 - HIPAA-ready Enterprise, אינטגרציות ל-CMS/ICD-10/PubMed, prior authorization מהשעות לדקות. Claude Opus 4.7 (16 באפריל 2026) הוא frontier model - 1M tokens context, multimodal, SWE-bench 87.6%, 5 דולר למיליון input ו-25 דולר למיליון output (output זול יותר מ-GPT-5.5 שעלה ל-5$/30$). ב-SWE-bench וב-long-form analysis Claude מוביל. GPT-5.5 מוביל ב-Terminal-Bench 2.0 (82.7% מול 69.4%) וב-FrontierMath Tier 4. ב-multimodal וב-multilingual - Gemini 3.1 Pro מוביל. ב-ecosystem וב-plugins - GPT-5.5 מוביל. Claude Code הופך את Claude לייחודי עבור מפתחים וחוקרים. Constitutional AI הופך את Claude לבטוח יותר באופן כללי. HIPAA-ready (במסלול Enterprise), מוסמך ISO 42001 מ-6 בינואר 2025 (מהראשונות בין frontier AI labs). בעברית - שיפור משמעותי, עדיין מעט מאחורי האנגלית. AMA 2026: 81% מהרופאים בארה״ב משתמשים ב-AI (כפול מ-2023).
הכיוון לדרמטולוג בישראל ב-2026: Claude הוא אופציה מצוינת, במיוחד לעבודת מחקר וספרות. כך גם GPT-5.5 וכך גם Gemini 3.1 Pro. כולם עובדים. יש לבחור על בסיס use case ולא נאמנות. Stack מעשי: NotebookLM (חינמי) יחד עם Claude Pro או ChatGPT Plus (20 דולר לחודש) מכסים 95% מהצרכים בעלות של 20 דולר לחודש. ה-AI הוא כלי שמעצים את העבודה. עד 2030 הוא צפוי להפוך לחיוני בעבודת הרופא. אוריינות AI הופכת לכישור של רופא. ה'מהפכה' אינה רופאי AI אוטונומיים, אלא כלי פרודוקטיביות שחוסכים 30-60 דקות ביום על documentation, מהירות פי 10 בספרות ופי 5 ב-drafting. תועלת אמיתית. השפעה אמיתית. פחות ממה שה-hype מבטיח, יותר ממה שהסקפטים מודים. יש לאמץ בפרגמטיות.
📋 פרטי מקור ומחבר
מאת: ד"ר יהונתן קפלן
מומחה ברפואת עור ומין | מנתח מוז (FACMS)
מבוסס על:
Constitutional AI: Harmlessness from AI Feedback
Bai Y, Kadavath S, Kundu S, et al.
arXiv, 2022
הערת עריכה: תוכן זה נכתב ונערך על ידי ד"ר יהונתן קפלן ומבוסס על המאמר המקורי.
אין להסתמך על תוכן זה ללא קריאת המקור המלא.