בינמי גנרטיבית בנויה לסרב להגיד לנו איך להוריד סרט מנטפליקס, לייצר פצצה או לגרוד מידע מאתרי הכרויות. אפשר לעקוף את המגבלות הללו באמצעות מתקפות הזרקת פרומפטים. שי דבש ורן בר-זיק מספרים לנו איך, ומה מפתחים יכולים לעשות נגד זה
✍️ הערות התוכנית
- רן בר-זיק מספר על ניסוי הפרמשתק
- שופטת פרסמה פסק דין עם טקסט מועתק מוויקיפדיה
- שי דבש ורן בר-זיק מספרים איך הצ'טבוט של משרד העבודה מלמד להכין פצצה
- בלוג פוסט של שי דבש על מבצע סבתא
- פוסט של סטיבן וולפרם: מה זה LLM?
- סרטון של 3Blue1Brown: מה זה LLM?
- נד בלוק: תודעה, בינה מלאכותית והפילוסופיה של המיינד
- צ'טג'יפיטי מסרב לדבר על דיוויד מאייר
- מחקר: גורמים למכוניות אוטונומיות להתעלם מתמרור עצור
- הכתבה זוכת הפוליצר: יונייטד הלת' השתמשה ב-AI לדחות תביעות ביטוח רפואי
⚒️ כלים שימושיים
- כלי פאזי AI של שי דבש & רן בר-זיק
- מערכת גנדלף של לאקרה
- 10 חולשות ה-LLM המובילות של OWASP
👯 קרדיטים
🐫 מגישים: נעם רותם & עידו קינן 👥 אורחים: שי דבש, רן בר-זיק 🎙️ שירותי אולפן והקלטה: שמע פודקאסטים ויצירות סאונד 🎛️ עיצוב סאונד ומיקס: פודקאסטיקו – עומר סנש & עידו קינן 🦜 קולות וצלילים: ג'וני זילבר, שביט שפונט, קרי וויציג סאיי, עומר סנש
🥐 סייברסייבר הוא פודקאסט על האקרים ומאפים בהגשת נעם רותם & עידו קינן 🐫 מופק על ידי פודקאסטיקו & מעבדות סייברסייבר לאבז & חדר 404 (נעם רותם, עומר סנש, עידו קינן, רן בר-זיק, רן לוקאר) 🖼️ תמונת שער: הזרקת דאטה 🖼️ עיבוד של עידוק לתמונות סטאר טרק





