בשבוע שעבר, במהלך הימים חמישי ושישי (23-24.11.2017), התקיים בספרייה הלאומית האקתון רב משתתפים. מה זה בעצם האקתון? מקור המילה באנגלית (hackathon) והיא למעשה חיבור של שתי מילים: "האק", אשר מייצגת את תחום הפיתוח הטכנולוגי, ו"מרתון", שמייצגת את העובדה שמדובר במין מרוץ. בפועל מדובר במפגש של אנשי טכנולוגיה ודיגיטל בעיקר, שמתכנסים יחד ל-48-24 שעות כדי להמציא ולפתח כלים ומוצרים טכנולוגיים שייתנו מענה לצורך מסוים. במקרה של ההאקתון שלנו בספרייה הלאומית, הצורך הוא הנגשת התכנים הנמצאים בספרייה לקהל הרחב.
בפני המתמודדים עמדו שני אתגרים טכנולוגיים שאיתם היה עליהם להתמודד. האחד הוא אתגר הקריאייטיב (Creativeׂ) שבו היה על הצוותים למצוא דרכים יצירתיות להנגיש את התכנים שבספרייה, והשני הוא אתגר הדאטה (Dataׂ) שבו היה על הצוותים לפתח כלים לשיפור המטא-דאטה (Metadata) של הפריטים המצויים בספרייה.
'לגעת בהיסטוריה'
במקום הראשון במסלול הצוותים העצמאיים ניצח צוות Pi: צוות של ארבעה חברים, מומחי מוצר, דאטה ותכנות ווב, מחברות שונות במשק: עומר זומריך, מנהל מוצר בגוגל. מתן ליאון, חוקר בינה מלאכותית באימפרבה. עידן כהן, מהנדס ווב בטוטנגו. גיא שטר, דוקטורנט באוניברסיטת בן גוריון.

צוות Pi הציג מוצר חינוכי אינטרקטיבי המאפשר לילדים בכלל ולתלמידים בפרט לבצע מחקר אסוציאטיבי דרך סרטונים וקבצי שמע. המוצר מנגיש פריטי היסטוריה מהאוספים השונים של הספרייה הלאומית בהתאם להקשר הנחקר וכך מאפשר ׳לגעת בהיסטוריה׳ ולהמשיך את המחקר באמצעים מוחשיים בספרייה עצמה.
בבסיס המוצר כמה טכנולוגיות בינה מלאכותית ולמידת מכונה אשר חושפות סוגי מידע חדשים לחלוטין עבור הספרייה, משפרות משמעותית את המידע הקיים ופותחות אפשרויות מוצר חדשות. טכנולוגיות אלו יפתחו הזדמנויות חדשות להנגשת הספרייה לקהלים חדשים וישפרו את יכולות המחקר של חומרי הספרייה. הטכנולוגיות בבסיס המוצר כוללות זיהוי קול מסרטים וקבצי שמע, זיהוי מושגים משמעותיים בקבצים אלו ודירוגם לפי סדר חשיבות, התאמתם לפריטים אחרים באוספי הספרייה ולמידה על קשרים בין פריטים שונים לאורך זמן ובהתאם להקשרים ספציפיים על ידי הבנת המשתמשים בהם.
את המצגת שהציג צוות pi תוכלו לראות פה
ופה תוכלו לראות את ההדגמה (Demo) למוצר
מזהים את האישים ההיסטוריים
במקום הראשון במסלול החברות זכה צוות "ויקימדיה-ישראל". צוות המפתחים של ויקימדיה, הפועל בתמיכתה של עמותת ויקימדיה ישראל, מורכב מאנשים שמתעניינים באתר ויקיפדיה. נוסף על כתיבת ערכים אנציקלופדיים הם גם משפרים את התוכנה של האתר, וכך מגשימים את הגדרתה של ויקיפדיה כ"אנציקלופדיה חופשית” – חופשית הן מבחינת התוכן שלה והן מבחינת התוכנה שמפעילה אותה. המפתחים עובדים בעיקר מהבית בזמנם הפנוי. פעם בחודש מפתחי ויקימדיה ישראלים עורכים מפגשים במשרדי עמותת ויקימדיה ישראל בתל־אביב. בשנת 2016 עמותת ויקימדיה ישראל אף קיימה האקתון בינלאומי בירושלים, שבו לקחו חלק ממפתחי ויקימדיה מכל רחבי העולם.

בהאקתון הספרייה הלאומית הצוות שכלל את ערן רוז, דפנה הירשפילד, אמיר א' אהרוני, אושר ילון, חיים כהן ואורן בוצ'מן, פיתח כלי שמאפשר לזהות על פי התמונה בלבד דמויות מוכרות, כך שגם בהיעדר תיאור טוב של התמונה ניתן למצוא תמונות של אישים חשובים במאגרי הספרייה.
כלי זה יסייע לעורכים בוויקיפדיה לאתר תמונות בעלות ערך היסטורי במגוון הרב של התמונות במאגרים. בנוסף פותח כלי לטובת ויקיטקסט שמאפשר לחלק כתבי יד, שעבורם תוכנות OCR (זיהוי תווים אופטי) אינן עובדות היטב, למקטעים של מספר מילים או שורות בודדות, כאשר בעזרת צ'ט-בוט יוכלו עורכים להקליד את המקטעים דרך טלגרם או פייסבוק, ולאחר מכן להעלות זאת לויקיטקסט. כלי זה יאפשר לחוקרים ולקוראים לחפש בכתבי יד שנסרקו אך לא עברו דיגיטציה מלאה.
את המצגת שהציג צוות "ויקימדיה-ישראל" תוכלו לראות פה