Hebrew

Nadav Har'El nyh at math.technion.ac.il
Tue Sep 6 14:24:35 IDT 2011


On Tue, Sep 06, 2011, Lior Kaplan wrote:
> היי,
> 
> בשבוע שעבר פורסמה קריאה לציבור להציע הצעות למיזם לשימור וקידום השפה העברית.
> 
> http://www.pmo.gov.il/PMO/Secretarial/Govmes/2011/08/spokemazkir310811.htm
> 
> אני רוצה לאסוף מחברי העמותה כמה רעיונות לגבי שילוב של תוכנה חופשית וקידום של
> השפה העברית ולשלוח רשימה מרוכזת של הצעות.
> 
> השתיים שיש לי בראש הן:
> 1. מימון המשך פיתוח של hspell
> 2. מימון המשך פיתוח של hocr

אם אני מבין נכון את הקריאה הנ"ל (קובץ doc...), הרי שכלל לא מדובר בקול-קורא
להציע פרויקטים שהם יממנו. להבנתי הם מחפשים משהו הרבה יותר רחב: *רעיונות*
על מה ניתן לעשות כדי להעלות את מעמדה של השפה העברית, לתרום להתפתחותה ושגשוגה,
למרות מגמות גלובליזציה, אנגליזציה וכד' שמכרסמים בשפה. רעיונות שכבר היו להם
הם הענקת "פרס הלשון העברית", בול על השפה העברית (!?), וכנס שנתי לדיון על השפה
העברית העכשווית. הם מחפשים רעיונות נוספים (ואני מקווה, טובים יותר).

אני חושב שהצעות כמו "הוספת פיצ'ר x ל hspell" או "פיתוח y לפרויקט בן-יהודה"
הם צרים במקצת למה שהם מחפשים. אני מציע את הכיוונים הבאים, שדומים למה שהצעת
אך רחבים יותר:

כיוון טוב ראשון הוא אכן תמיכה מלאה בעברית בתכנה - ובעיקר בתכנה חופשית
(שהיום, אחרי ההפגנות יוקר המחייה האחרונות, ברור אף יותר מדוע היא חשובה).
לפני עשור, משתמשי מחשב התרגלו שחלק גדול ממה שהם עושים צריך להעשות באנגלית.
אצלי עד היום כל התכנות פועלות בממשק אנגלי ובשפה זו אני כותב גם את שמות כל
הקבצים, את רוב המיילים שאני שולח (גם לישראלים), ואפילו הערות שאני כותב לעצמי.
אבל זה פוגע במעמד השפה שעלולה להראות כשפה נחותה ומיושנת שלא מתאימה לעולם החדש
של המחשבים. למזלנו, המצב היום טוב בהרבה ממה שהיה - יש כתיבה דו-כיוונית ברוב
האפליקציות, יש תרגום של הרבה אפליקציות, יש בדיקת איות עברי. אבל העבודה לא
גמורה ויש עדיין חורים שצריך לסגור. משתמש ישראלי צריך להיות מסוגל להתקין הפצת
לינוקס ולא להידרש לראות אף מילה באנגלית (אלא אם כן יתחיל לחפור ב log files
וכד' - אבל זה כבר לא אנגלית אלא שפת הלינוקס שרוב האנשים לא מבינים בכל
מקרה :-) ).

כיוון שני הוא תוכן עברי חופשי. קוראי אנגלית (למשל) יכולים למצוא ברשת אלפי
ספרים חופשיים, עשרה תרגומים של התנ"ך, ויקיפדיה ענקית וכד'. המצב בעברית אינו
אסון - תודות לפרויקטים כמו בן-יהודה ויקיפדיה ישראל - אך הרבה פחות טוב
מבאנגלית. צריך לעזור לפרויקט בן-יהודה ו/או פרויקטי סריקה נוספים, צריכים
שטקסטים מכוננים יהודיים (ובראשם התנ"ך) וישראליים יהיו זמינים בחופשיות ללא
תנאי זכויות יוצרים מגבילים, צריכים להמשיך לעבוד על ויקיפדיה העברית, וכן הלאה.
ללא שיפור בנושא זה, מעמד השפה העברית נפגע כי אנשים מוצאים עצמם מעדיפים לחפש
ולקרוא טקסטים באנגלית.

כיוון שלישי הוא קידום הידע של הציבור על השפה העברית עצמה ועל השימוש הנכון,
המקובל והראוי בה. הייתי רוצה לראות הפצה חופשית של מסמכים וספרים המתארים את
השפה העברית *העכשווית*, מלמדים את כלליה, ומקלים על השימוש בה. אתן דוגמה מתחום
האיות (החביב עלי, כידוע): האם ייתכן שבוגר בית-ספר בארה"ב לא ידע האם
לכתוב flavor או flavour או flaour? בוודאי שלא - הוא ידע לבחור בראשון (השני
הוא כתיב בריטי, השלישי כתיב נורמני ארכאי). מדוע המצב שונה בעברית - יותר
ממאה שנה אחרי תחיית השפה העברית, בוגרי בית-ספר עדיין מתלבטים האם לכתוב
דוגמה או דוגמא, האם השפה היא "עברית" או "עיברית", האם משלמים "מיסים" או "מסים"
וכד'?  לפי ניסיוני, רוב האנשים לא מצליחים להסכים אפילו עם עצמם עצמם על כתיב
חסר-ניקוד קבוע.  מישהו צריך להחליט, כי בלי החלטה השפה העברית הכתובה נראית
חובבנית. ומישהו צריך ללמד ולהפיץ את הידע על החלטות אלו.
כידוע האקדמיה פרסמה החלטות לרוב בנושא זה ואחרים - אבל רוב פרסומיה *אינם*
חופשיים ורוב הישראלים מעולם לא ראו אותם, וגם מה שיש איננו מלא. כידוע אני מנסה
ב hspell ובמסמך ההסבר המצורף לו www.ivrix.org.il/niqqudless.pdf לענות בדיוק
על שאלות הללו, אך דרושה עוד הרבה עבודה - ועדיף בשיתוף עם האקדמיה (שבינתיים
לא הביעו עניין). גם האתר http://www.safa-ivrit.org/ מכיל המון אינפורמציה נוספת
ומעניינת על השפה העברית. אבל חסרה עוד המון אינפורמציה - למה אין מילון עברי
חופשי (מעבר לרשימת המילים של hspell, ואולי ויקימילון החלקי)? תכנה או לפחות
מסמך על ניקוד? מילון אטימולוגי (מקורות מילים)? מדוע לא יפורסמו כל הפרסומים
של האקדמיה בקלות ובחינם ברשת?

כיוון רביעי הוא כתיבת תכנה שקיימת בשפות אחרות אבל חסרה בעברית - ושוב עדיף
כתכנה חופשית כדי שלכל האזרחים יהיה גישה אליהן. למשל קל להשיג תכנות הקראת טקסט
בקול, קריאת (סריקת) טקסט מודפס, חיפוש איכותי בטקסט, וכד', אבל בלתי אפשרי או
מאוד יקר להשיג תכנות כאלו בעברית. היום תכנות אלו נחוצות בעיקר לבעלי מוגבליות
(עיוורים, אילמים, וכד') אבל בעתיד הלא רחוק, סביר שרוב התקשורת שלנו עם מחשבים
יהיו בצורות אלו. מעט התכנות שקיימות בתחום זה נכתבו עבור חברה מסחרית קיקיונית
(סליחה אם אני מעליב מישהו) שתוך כדי רצון להרוויח כסף פשוט "קוברת" את הטכנולוגיה
ואף אחד לא משתמש בה. רק אם הייתה תכנה חופשית כזו, יכלו היום כולם להשתמש בה,
כמו שלמשל כולם יכולים היום להשתמש בבדיקת איות עברית דרך hspell. פיתוח הכלים
הנ"ל (הקראת טקסט בקול, סריקת טקסט) יכול אכן להעשות על בסיס hspell ו hocr
בהתאמה, אך דרושה עוד הרבה עבודה.

נדב.

-- 
Nadav Har'El                        |        Tuesday, Sep  6 2011, 7 Elul 5771
nyh at math.technion.ac.il             |-----------------------------------------
Phone +972-523-790466, ICQ 13349191 |Bumper sticker on stealth bomber: "If you
http://nadav.harel.org.il           |can read this, we wasted a lot of money!"


More information about the Discussions mailing list