
פסיקה דרמטית וחשובה: האם שימוש בספרים לאימון בינה מלאכותית הוא "שימוש הוגן"? (כן)
עולם המשפט ניצב מזה מספר שנים בפני שאלה מאוד מורכבת ורגיש: כיצד יש להתייחס לשימוש ביצירות מוגנות במטרה לאמן מנועי בינה מלאכותית.
עו"ד ליכטנשטיין מציע הסבר בנושא זה על בסיס על פסק דין חשוב ומפורט שניתן בבית המשפט בצפון קליפורניה בתיק Bartz v. Anthropic PBC ממש לאחרונה, ב-23.6.2025.
להרחבה בשאלה זו, ואחרות העוסקות בבינה מלאכותית וזכויות יוצרים, אתם מוזמנים לקרוא במאמר מקצועי ומרתק שכתבו עורכי הדין יורם ליכטנשטיין ואסף כהן צידון (זמן רב טרם לפסק הדין) בקישור הזה (במאמר מגיעים הכותבים למסקנה אליה הגיע בית המשפט, ומבססים אותה בצורה נוחה וקלה לקריאה).
הדיון בפסק הדין עסק באחת מפעולות הליבה של מערכות הבינה המלאכותית המתקדמות – אימון מודלים על בסיס טקסטים קיימים (בהם גם ספרים, מאמרים, תמונות וכדומה). התובעים, שלושה סופרים, טענו שחברת אנתרופיק הפרה את זכויות היוצרים שלהם כאשר העתיקה, ללא רשות, את ספריהם, ושילבה אותם בתהליך האימון של מודל השפה שלה, Claude.
השאלה היתה: האם עצם השימוש ביצירות לצורך אימון מכונה, ואפילו ללא העתקה או הפצה של היצירה, מהווה "שימוש הוגן" לפי המשפט האמריקאי (שהישראלי הולך בעקביו)?
אנתרופיק בנתה ספרייה דיגיטלית עצומה שכללה למעלה מ־7 מיליון עותקים פיראטיים שהורדו מאתרי אינטרנט פיראטיים, מיליוני ספרים פיזיים שנרכשו כדין על ידה, נסרקו והומרו לפורמט דיגיטלי ולבסוף היא שמרה את כל העותקים הסרוקים אצלה לצורך אימון עתידי של המנוע, המודל.
המודלים שאנתרופיק הפעילה, וכמובן גם חברנו Claude, אומנו על בסיס מכלול טקסטים, כולל קבוצות מאותם ספרים. אנתרופיק לא התעניינה ביצירה עצמה, בספר. אבל היא עיבדה את תכני הספרים, העבירה אותם תהליך של טוקניזציה, וניתוח סטטיסטי של מבנים לשוניים. המטרה – לאפשר לבינה המלאכותית להבין סגנונות כתיבה, תחביר, עושר לשוני ואיכות ניסוח.
ההכרעה החשובה בפסק הדין היתה כשבית המשפט קבע, באופן תקדימי, שהפעולה של אימון מודל שפה על בסיס יצירה ספרותית מהווה שימוש טרנספורמטיבי מהותי, ולכן מותרת.
"שימוש טרנספורמטיבי" הוא שימוש ביצירה שמייצר תכלית חדשה, שונה ומובחנת מהשימוש המקורי. שימוש כזה עשוי בהחלט להחשב "שימוש הוגן" במובן החוק, גם בארץ.
מודל בינה מלאכותית, כך קבע בית המשפט, הוא כמו כל קורא אנושי – קורא, מפנים, ומגיב. פעולת הקריאה עצמה אצל קורא אנושי היא שימוש מותר, או לכל הפחות הוגן. כך גם יהיה הדין ביחס לקריאת התכנים בידי הבינה המלאכותית.
בית המשפט קבע שהמודלים לא החזירו אף קטע מהיצירה למשתמשים בצורה בה הופיע ביצירה המקורית. הוא גם קבע שהמודל לא יצר חיקוי או מוצר תחליפי ליצירה. בפועל, כך קבע, פעולת אימון הבינה אינה מהווה פגיעה בשוק הפוטנציאלי של היצירה.
כלומר, מסקנת בית המשפט מלמדת אותנו שאימון בינה מלאכותית על יצירות מוגנות (גם אם מדובר בלמידה עמוקה) מהווה שימוש שונה מהשימוש המקורי של הספרים ועומד בדרישות השימוש ההוגן.
בהערת אגב נפנה למסקנה דומה אליה הגיע גם משרד המשפטים הישראלי (כבוד לעוה"ד ליטל הלמן וכרמית יוליס) עוד לפני שנתיים וחצי בחוות דעתו מה-18.12.2022.
בית המשפט הוסיף והתייחס לפעולה נוספת של אנתרופיק (הורדת ספרים באופן פיראטי לשם אימון הבינה המלאכותית ושמירתם במאגר מידע דיגיטלי). פעולה זו, כך קבע, היא – הפרת זכות יוצרים, אסורה ואינה מהווה שימוש הוגן. מצד שני, ספרים שנרכשו כדין בידי אנתרופיק, היו תקינות. אלא שהורדה פיראטית – אסורה.
בשורה התחתונה פסק הדין מציב גבולות:
- אימון LLMים ביצירות מוגנות – מותר, כל עוד נעשה באופן פנימי, טרנספורמטיבי, וללא הפצה של היצירות;
- שימוש בעותקים פיראטיים – אסור;
- המרת ספרים שנרכשו כדין לקבצים דיגיטליים ושמירתם הפנימית – מותרת.
עבור עורכי דין בתחום הקניין הרוחני, בינה מלאכותית ודיני דיגיטל – מדובר בפסק דין מכונן שיעמוד במרכזם של מאבקים רגולטוריים, משפטיים ואתיים בשנים הקרובות, ויגדיר מחדש את גבולות השימוש המותר בטקסטים מוגנים בעידן של מערכות לומדות.
דברו איתנו אם הנושא מעניין אתכם.
האמור במאמרים השונים באתר הינו הסבר כללי, אינו מהווה ייעוץ משפטי מחייב ואין להסתמך עליו בכל צורה שהיא.
בכל מקרה ספציפי יש להעזר בבעל מקצוע המתמצא בתחום והאמור באתר אינו יכול לספק פתרון לבעיה ספציפית.