Niqqud

Nadav Har'El nyh at math.technion.ac.il
Tue Sep 6 14:59:35 IDT 2011


On Tue, Sep 06, 2011, Orna Agmon Ben-Yehuda:
> נקדן אוטומטי זו משימה אקדמית רצינית, שחוקרים אותה באקדמיה ובתעשיה, למשל
> בטכניון ובסטרט-אפ שעוזי אורנן מעורב בו.

חבל רק שעשרות שנים (!) אחרי שהתחילו לחקור נושא זה, עדיין אין אף תכנה מסוג
זה שזמינה לישראלי הממוצע (תקני אותי אם אני טועה). זה *לא* נובע מכך שהבעיה
קשה מאוד ועדיין "חוקרים" אותה. להפך - רוב הדרוש לבעיה זאת כבר ידוע המון שנים.
הבעיה היא שעד היום, כל חוקר שפתר את הבעיה (כמו אורנן שהזכרת) מכר את הפתרון
לחברה שהעדיפה "לקבור" את הטכנולוגיה באיזה מוצר סופר-יקר וסופר-אזוטרי במקום
להביא אותה לכלל הציבור. לדעתי, עד שלא ישב מישהו *שוב* על התחת ויכתוב תכנה
כזו ויפיץ אותה כתכנה *חופשית* - המצב לא ישתנה.

כאמור, לדעתי, אמנם דרושה עבודה לא מעטה בייצרת נקדן כזה, אך זה בהחלט אפשרי
לעשייה על ידי מתנדבים עם ראש על הכתפיים אבל ללא פרופסורה בבלשנות. הייתי מעריך
שאפשר להתחיל מבסיס הנתונים של hspell ולהגיע לנקדן סביר (במובן מסוים...)
תוך כמה שנים בודדות - בהנחת מישהו שמתלהב מהפרויקט ויש לו זמן להשקיע בו (כמו
שהיה לי בפרויקט hspell לפני שנולדו לי ילדים...).

> יש צורך בפענוח הקשר המילה כדי לדעת
> איך לנקד אותה. אין שום התחלה חופשית בתחום הזה. אבל משימת ביניים ראויה וישיגה
> היא נקדן שיציע אפשרויות. כלומר, כלי שבשילוב עזרה אנושית ינקד. כאשר אין
> אפשרויות רבות, או שניקוד כל המשמעויות השונות יוצר זהה, ינקד את האפשרות
> היחידה, וכאשר יש ריבוי אפשרויות - יציג למפעיל אפשרויות לבחירה. אפשר אפילו
> לסדר את האפשרויות לפי בחירות קודמות. (למשל, אם צריך לנקד "שמש", וקודם בקטע
> נוקדה המילה shemesh, יעדיף את shemesh  על פני shamash).

נכון. לדעתי מה שאת מציעה הוא בערך אמצע הדרך בין המצב שיש לנו היום (ניתוח
מורפולוגי של hspell) והנקדן האולטימטיבי שמבין גם דקדוק. כאמור, בהחלט לא
בלתי-אפשרי לעשות את מה שאת מציעה - צריך רק התלהבות מהנושא, וזמן.

אגב מה שאת מציאה קיים, למשל, באתר רב-מילים. החיפוש במילון הנ"ל נעשה בצורה
של הקלדת מילה לא מנוקדת, ואז הוא מציע את כל האפשרויות לקרוא אותה - ואת הניקוד
והפירוש של כל אחת.

> כלי כזה יכול לעזור למשל לפרויקט בן-יהודה, אבל גם למו"לים של ספרי ילדים. מצב
> הניקוד כיום מחפיר בספרי ילדים - הוא חלקי או שגוי, או פשוט יצירתי. לדוגמא,
> החטף פתח נעלם מן הרפרטואר, שלא לדבר על החטף סגול ועל הניקוד השונה לוו החיבור
> בהתאם למילים שהיא מחברת.

נכון. רק אתמול הקראתי לבתי ספר והזדעזעתי משגיאות הניקוד (ואפילו שגיאות
נשמעות - כמו דגש קל אחרי למ"ד השימוש). האם אי אפשר לצפות מאותו מומחה לניקוד
שהם (אני מניח) שכרו לנושא שלפחות תהיה לו תכנת בדיקת איות עם ניקוד? כנראה שלא!
כנראה *שאין* להם תכנה כזו - כמו שהרעיון ל hspell עלה כי לא הייתה לי תכנה
לבדוק את האיות בתזת המסטר שלי (שנכתבה בעברית לדרישת הטכניון...).

שגיאת הניקוד שהכי מפריעה לי כל פעם מחדש (אך כבר השתרשה גם בדיבור עד שכמעט
בלתי אפשרי לעקור אותה) היא בשיר הילדים הידוע "זאת הגברת שפנפנית" של מרים
ילן שטקליס. האם ידעת שיש לקרוא "שפנפן", "שפנפנית", "שפנפנים" וכד' עם הפ"א
השנייה דגושה - shfanpanit? זהו מקרה פשוט של דגש קל אחרי שווא נח.
אפשר לראות שמרים ילן שטקליס ידעה זאת לפי השורות:

	יש עשרת שפנפנים לי,
	מסבירים כולם פנים לי.

אגב, למרבה האירוניה בערך בויקימילון,
http://he.wiktionary.org/wiki/%D7%A9%D7%A4%D7%A0%D7%A4%D7%9F
מופיע הניקוד הנכון (פ"א דגושה) אך ה"הגייה" נרשמה כ "shfanfan".

נדב.

-- 
Nadav Har'El                        |        Tuesday, Sep  6 2011, 7 Elul 5771
nyh at math.technion.ac.il             |-----------------------------------------
Phone +972-523-790466, ICQ 13349191 |When you handle yourself, use your head;
http://nadav.harel.org.il           |when you handle others, use your heart.


More information about the Discussions mailing list