כרזה שחוגגת את הגעת ארכיון האינטרנט ל-10 פטהבייט של מידע מאורכב ב-2012 📷 Archive.org

האקרים תקפו את "ארכיון האינטרנט", השחיתו אותו וגנבו ממנו מידע. האתר אינו זמין כרגע (חמישי 10.10 בצהריים).

The Internet Archive, שברוסטר קייל הקים ב-1996, הוא מלכ"ר ספרייה דיגיטלית שמטרתה לספק "גישה אוניברסלית לכל הידע". מאז שאירכב את עמוד הרשת הראשון שלו ב-10.5.1996, הארכיון שומר עותקים של אתרי אינטרנט לאורך השנים – אוטומטית, ידנית ולפי בקשת גולשים, ומנגיש אותם לציבור דרך האינטרנט מאז השיק ב-2001 את ה-WayBack Machine, מנוע חיפוש ואינדוקס של אתרים. הארכיון מארכב גם תוכנות, קבצי מדיה וספרי נייר, שנשמרים הן פיזית והן בעותקים דיגיטליים. נכון לתחילת ספטמבר, האתר החזיק 866 מיליארד עמודי רשת ועשרות מיליוני קבצים ודברי דפוס. נכון לינואר השנה, הארכיון מחזיק יותר מ-99 פטהבייט של מידע.

אנשים שהתגלצ'ו ל-archive.org ביום רביעי (8.10) קיבלו פופ-עף ג'אווה סקריפט שהודיע בלשון ציורית שהאתר נפרץ:

הודעת הפריצה לארכיון האינטרנט: "האם אי פעם חשדתם שארכיון האינטרנט עובד על זרדים ונמצא תמיד על סף פירצת אבטחה קטסטרופלית? אז זה קרה עכשיו. נתראה עם 31 מיליון מכם ב-HIBP!" 📷 צילומסך: Bleeping Computer

ההאקרים התכוונו שהצליחו לגנוב 31 מיליון פרטי התחברות לארכיון האינטרנט. HIBP הם ר"ת של Have I Been Pwned?, אתר של מומחה הסייברסייבר טרוי האנט, שמחזיק מאגר מידע מתעדכן על דליפות פרטי התחברות. קבוצת האקטיביסטים בשם BlackMeta לקחה אחריות על מתקפת הדידוס והודיעה שתבצע מתקפות נוספות, מה שאכן קרה. להערכת האנט, ייתכן שמספר קבוצות תקיפה היו מעורבות במתקפות השונות.

האנט אישר ל"בליפינג קומפיוטר" שקיבל את מאגר פרטי התחברות, קובץ בשם ia_users.sql בנפח 6.4 ג"ב, ושווידא את אמיתותו מול מספר משתמשים שפרטיהם דלפו. האנט אישר גם את המספר שההאקרים נקבו בו – 31 מיליון כתובות אימייל ייחודיות של חברים רשומים באתר, וכן שמות המשתמש שלהם, מועדי שינוי סיסמאות, סיסמאות מוגנות ב-bcrypt (גיבוב והמלחה, כלומר שהגנבים יתקשו לפענח את הסיסמאות ולהשתמש בהן) ומידע פנימי נוסף.

האנט פרסם את ציר הזמן של משבר הסייבר: ההאקרים ככל הנראה גנבו את המאגר ב-28.9, חותמת הזמן המאוחרת ביותר במאגר. האנט קיבל את המאגר ב-30.9, התפנה לנתח אותו ב-5.10, וב-6.10 פנה לארכיון האינטרנט לבצע אסגרה אחראית. ב-7.10 ארכיון האינטרנט אישר שאכן נפרץ, ב-8.10 האנט פנה שוב לקבל מהם הודעת אסגרה ולהודיע שיפרסם את דבר הדליפה למחרת, ב-9.10, אבל אז ההאקרים ביצעו מתקפת DDoS והשחיתו את האתר עם הודעת הפריצה, והאנט החליט לתת לארכיון האינטרנט עוד יום של חסד לפני הפרסום.

לפי מייסד הארכיון קייל, מתקפת הדידוס הראשונה התרחשה כבר ביום שלישי 8.10, כפי שדיווח בזמן אמת: "DDOS ביום שלישי? בפעם הקודמת זה היה יום שני. ג'יז. ארכיון האינטרנט פועל להשיב את archive.org לתפקוד". למחרת עדכן ש"מתקפת ה-DDOS של אתמול על ארכיון האינטרנט חזרה על עצמה היום". אמש הרחיב כי מדובר לא רק במתקפת DDoS על האתר, אלא גם השחתתו דרך ספריית ג'אווהסקריפט (שהקפיצה את הודעת הפריצה) וחדירה למאגר שמות משתמשים, כתובות אימייל וסיסמאות מגובבות ומומלחות. לדברי קייל, ארכיון האינטרנט הדף את המתקפה, ניטרל את ספריית ה-JS, ניקה את המערכות ושידרג את הסייבראבטחה.

כשניסיתי להיכנס לארכיון האינטרנט וגיליתי שהוא לא זמין – המחשבה הראשונה שעלתה לי בראש היתה לחפש עותק מטמון שלו בארכיון האינטרנט. ארכיון האינטרנט הוא כלי חשוב לחוקרים, אקדמאים, עיתונאים, היסטוריונים והציבור הרחב. הוא אינו הגוף היחיד שמשמר את הרשת, אבל ודאי המקיף שבהם. גוגל נהגה לספק בתוצאות החיפוש לינק לעותק מטמון ששמרה של העמוד, למקרה שהוא לא זמין, חסום לגולשים או השתנה ונדרשת גישה לגירסה הקודמת. אלא שהשירות של גוגל הנגיש עותק אחד בלבד, בעוד ארכיון האינטרנט מאפשר לדפדף בין עותקים שונים ולראות שינויים שבוצעו בעמוד. בנוסף, גוגל החלו לפייד את השירות בשלהי 2023, בפברואר השנה הודיעו רשמית על סגירתו, ובחודש שעבר החלו להוסיף לתוצאות החיפוש לינק לעותק מטמון של האתר בארכיון האינטרנט.

ארכיון האינטרנט לא זמין? אז אני אחפש עותק מטמון שלו בארכיון האינ… אה, שיט 😔

הספרייה סגורה כעת

מתקפת הסייבר מצטרפת למכה משפטית שספג ארכיון האינטרנט בתחילת ספטמר, כשנאלץ להפסיק להשאיל ספרים דיגיטליים. הארכיון השיק ב-2006 את "הספרייה הפתוחה", שבמסגרתה השאיל לגולצ'ים ספרים דיגיטליים וגירסאות דיגיטליות של ספרי דפוס. ההשאלה בוצעה בשיטת Controlled Digital Lending (CDL), שבמסגרתה הושאל בכל זמן נתון רק ספר דיגיטלי אחד כנגד עותק פיזי של הספר, שנרכש או נתרם למחסני הארכיון, או נמצא על המדף באחת מ-130 הספריות הציבוריות האמריקאיות שהצטרפו לפרוייקט. במסגרת ה-CDL, הקבצים הוגדרו כך שישמידו את עצמם – כלומר יוצפנו בלי אפשרות לפתוח אותם – בתום תקופת השאלה של שבועיים. בעוד הוצאות ספרים והתאגדויות סופרים טענו שמדובר בפיראטיות, הארכיון טען שהוא פועל כספרייה אקדמית או ציבורית בהתאם לחוק האמריקאי, ואף נרשם רשמית כספרייה ציבורית.

במרץ 2020, בתקופת הקורונה, הארכיון הקים את "ספריית החירום הלאומית", תוכנית להשאלת ספרים דיגיטליים לגולצ'ים, שתוכננה להיסגר ביוני 2020 או כשמצב החירום בארה"ב יבוטל, המאוחר מביניהם. בניגוד לספרייה הפתוחה, הספרייה הדיגיטלית הסירה את המגבלה על מספר העותקים הדיגיטליים, ואיפשרה לכל גולץ' לשאול כל ספר שירצה למשך שבועיים בלי להמתין שהקורא הקודם "יחזיר" אותו. הארכיון נימק זאת בכך שהנגשת מידע לא-זמין היא שימוש הוגן לפי חוקי זכויות היוצרים, מכיוון שהיא מאפשרת לפעילויות חינוכיות להימשך גם בזמן שחנויות הספרים והספריות סגורות והגולצ'ים מסוגרים בבתיהם. הארכיון הגדיל לעשות ואיפשר לסופרים שלא רצו בכך להסיר את ספריהם מהתוכנית.

אלא שהשאלת ספרים דיגיטליים בספריות ציבוריות כפופה להסכם בין הספריות למו"לים, וכוללת הגבלה על מספר ההשאלות של עותק דיגיטלי. זאת כדי להשוות את התנאים לספר פיזי, שהספרייה נדרשת לרכוש עותק חדש שלו כשהוא מתבלה ונשחק אחרי מספר מסויים של השאלות.

ביוני 2020, הוצאת הספרים האצ'ט, הארפר-קולינס, פינגווין רנדום האוס ו-וויילי הגישו תביעה על הפרת זכויות יוצרים של 127 כותרים שלהן בספרייה הפתוחה ובספריית החירום, שנסגרה שבועיים מוקדם מהמתוכנן בגלל התביעה. ההוצאות טענו שהיעדר המגבלה על מספר ההשאלות פוגעת במכירות הספרים הדיגיטליים ובהכנסות הסופרים, שנפגעו בגלל הקורונה. אף שהמו"לים לא הציגו נתונים אמפיריים, ואילו ארכיון האינטרנט הציג מחקר שמראה שספרים מסויימים ירדו במכירות אחרי סגירת ספריית החירום – בית המשפט פסק לטובת המו"לים, ופסק הדין נותר על כנו בערעור. בעקבות כך, ארכיון האינטרנט נאלץ לחסום גישה לחצי מיליון כותרי ספרים, בהם יותר מ-1300 שהכנסתם לבתי ספר בארה"ב נאסרה או שיש דיון לגבי איסור כזה.

באוגוסט 2013 הוגשה תביעת זכויות יוצרים נוספת נגד הארכיון. יוניברסל מיוזיק גרופ, סוני מיוזיק אנטרטיינמנט וחברות מוזיקה נוספות הגישו תביעה נגד הארכיון על "Great 78 Project", שמאפשר להזרים גירסאות דיגיטליות של 400 אלף שירים מתקליטי 78 סיבובים לדקה, ובהם יצירות של פרנק סינטרה, מיילס דייויס, בילי הולידי ואלה פיצ'ג'רלד. הארכיון טוען שהוא עוזר להציל את השירים מכלייה, ואילו חברות המוזיקה טוענות שהשירים זמינים בשירותי סטרימינג בתשלום ואין סכנה שייעלמו. התביעה נקבה ב-2749 הקלטות-קול באתר שמפירות את זכויות היוצרים של התובעות, וטענה שהנזקים עשויים להגיע עד 412 מיליון דולר.