מנוע הבינה המלאכותית צ'אט GPT אִבחן מטופלים שהובהלו לחדר המיון בדיוק שהשתווה לפחות לזה של רופאי חירום – ובמקרים מסוימים אף התעלה על רופאים אמיתיים, כך גילו חוקרים הולנדים. בינה מלאכותית יכולה, לדבריהם, "לחולל מהפכה בתחום הרפואי". אך בדו"ח המחקר שפורסם בשבוע שעבר הודגש גם שרופאי המיון לא יוחלפו במהרה, משום שהבינה המלאכותית יכולה להאיץ את מהירות האבחון אך לא להחליף את שיקול הדעת והניסיון הרפואי של בני האדם.
המדענים בחנו שלושים מקרים שטופלו בחדרי מיון בהולנד בשנת 2022. הם הזינו לצ'אט GPT את ההיסטוריה הרפואית של החולים, את תוצאות בדיקות המעבדה ואת דיווחי הרופאים עצמם על הבדיקות שערכו לחולים, וביקשו מהתוכנה שתספק חמש אבחנות אפשריות. לאחר מכן הם השוו את הרשימה הקצרה של המנוע לחמש האבחנות שהציעו רופאי מיון שקיבלו גישה לאותו מידע, ואז הצליבו את התשובות עם האבחנה הנכונה שהתבררה לאחר מעשה בכל מקרה.
הרופאים הצליחו לכלול את האבחנה הנכונה בחמישייה המובילה ב-87 אחוזים מהמקרים, לעומת -97 אחוזים שהשיג צ'אט GPT בגרסה 3.5 של התוכנה ו-87 אחוזים בגרסה 4.0. "בפשטות, מנוע הבינה המלאכותית הצליח להציע אבחנות רפואיות דומות לאלו של רופא אנושי", אומר הידה טן ברג מהמחלקה לרפואה דחופה בבית החולים הירונימוס בוש בהולנד.
לפי המחבר השותף סטאף קורסטיינס, מחשבים לא בהכרח יוכלו לנהל את חדר המיון, אבל בינה מלאכותית יכולה למלא תפקיד חיוני בסיוע לרופאים בשעת לחץ: "המסקנה החשובה ביותר היא שהבוט לא יחליף את הרופא, אבל הוא יוכל לעזור במתן אבחנה ואולי להעלות רעיונות שהרופא לא העלה בדעתו". מנועי בינה מלאכותית כמו צ'אט GPT אינם מתוכננים לשמש ככלי רפואי, הוא הדגיש, ויש גם חששות פרטיות הקשורים בהזנת נתונים רפואיים סודיים ורגישים למערכת כזאת.
כמו בתחומים אחרים, המנוע גם הפגין כמה מגבלות. תהליך הסקת המסקנות של התוכנה היה "לפעמים בלתי סביר מבחינה רפואית או לא עקבי, מה שעלול להוביל למידע מוטעה או לאבחנה שגויה", צוין בדו"ח, וכשהדבר נוגע ברפואה עלולים להיות לכך השפעות משמעותיות. המדענים גם הודו בכמה חסרונות במחקר. גודל המדגם היה קטן, עם שלושים מקרים בלבד, והמקרים שנבדקו היו פשוטים יחסית: המטופלים הציגו רק תלונה ראשונית אחת. לא ברור עד כמה הבוט יסתדר במקרים מורכבים יותר. "היעילות של צ'אט GPT במתן אבחנות מרובות ברורות לחולים עם מחלות מורכבות או נדירות נותרה בלתי מאומתת", נכתב.
התוכנה לא סיפקה את האבחנה הנכונה בין חמש האפשרויות המובילות, הסביר קורסטיינס, במיוחד במקרה של מפרצת בבטן, שמביאה להתנפחות אבי העורקים – מצב מסכן חיים. הנחמה היחידה היא שבמקרה הזה גם הרופא המטפל טעה. הדו"ח מפרט גם טעויות רפואיות פשוטות של הבוט, למשל אבחון אנמיה (רמות המוגלובין נמוכות בדם) בחולה עם ספירת המוגלובין תקינה.
הממצאים – שפורסמו בכתב העת הרפואי לרפואת חירום, יוצגו בקונגרס האירופי לרפואת חירום (EUSEM) 2023 בברצלונה.