מכונה עם לב של אבן

בדיחה על תרגום מכונה

התמונה הנ"ל רצה בפורומים רבים של מתרגמים, ללא קרדיט באף אחד מהם

בטיולים בחו"ל, מי לא חולם על האפשרות לחשוב בשפה שלנו, ושזה יצא לנו מהפה בתרגום מוצלח ביותר לשפת המאזין? היה יכול להיות נהדר, נכון?

מכונת תרגום אוטומטית כזו מהמוח לפה עדיין לא הומצאה, אבל בהחלט הומצאו תוכנות תרגום למיניהן, ברמה כזו או אחרת. אני לא מתכוונת למילוניות, שעושות את פעולתו של המילון אבל בלי הצורך לדפדף ולזכור את סדר ה־abc. הכוונה היא לתוכנות שמתיימרות לתרגם משפטים ואפילו טקסטים שלמים.

אני לא מבינה כיצד התוכנות האלה פועלות. למרות זאת, ברור לי שלמכונה אין לב, אין נשמה, אין מחשבה ואין הפעלת שיקול דעת.

האם כל אלו נחוצים בתהליך התרגום?

תרגום אנושי לעומת תרגום מחשב

עבודת המתרגם איננה רק העברת מילים משפה אחת לאחרת. המתרגם האנושי בודק, חושב, מתלבט ורק אז – מחליט. הוא חייב להבין את תרבות שפת המקור ושפת היעד, והוא קולט את רוח הטקסט, ולא רק את המילה הכתובה פשוטה כמשמעותה. בזמן התרגום הוא צריך לשמר את משמעות הטקסט כולו. למילה היחידה משמעויות שונות וקונוטציות שונות, ועל המתרגם להעביר את המסר ואת האלוזיות (בעברית: הֶרְמֵזִים), בלי שהטקסט בשפת היעד יישמע מלאכותי וזר. המתרגם האנושי יכול גם לתרגם משחקי מילים – דבר שהוא מסובך במיוחד, ואין מצב שמכונה תצליח לעשות זאת.

ההבדל הוא לא רק בכיוון הכתיבה

בין כל שתי שפות יש הבדלים רבים, המתבטאים באוצר המילים, בסדר המילים במשפט, בהתייחסות למגדר, במילות יחס ועוד ועוד.

קיימים שיקולים רבים שצריך לקחת בחשבון בזמן התרגום, מלבד הבנת המילים בטקסט המקורי.

עבודת המתרגם כוללת:

  • שימוש בשפת יעד תקנית
  • בחירת המילה המתאימה מבין המילים הנרדפות
  • שמירה על חריזה ועל מקצב (בטקסטים שיריים ובסיפורי ילדים, אבל לא רק)
  • שימור הרעיון והרוח של הטקסט, בלי שהוא יישמע זר בשפת היעד
  • התאמת מבנה המשפט לשפת היעד
  • חיפוש ניבים מקבילים בשפת היעד, עבור ניבים שבשפת המקור מובנים אך בתרגום הולכים לאיבוד
  • הבנת תרבות שפת המקור, והעברתה כך שתתקבל כראוי בשפת היעד

האם מכונה יכולה להיות מתוכנתת כך שתיקח בחשבון את כל הגורמים, ותפיק טקסט מתורגם תקני, זורם וברור?

בהמשך מוצגות דוגמאות לתרגום גוגל מאנגלית לעברית, לעומת התרגום האנושי. אומנם גוגל הוא מחשב תרגום אחד מני רבים, ואולי אין הוא מעיד על הכלל, אבל הוא היה מהראשונים, והוא ברירת המחדל של רבים. לכן אני מרשה לעצמי לראות אותו כמייצג של החבורה.

מה הבעיה בתרגום מחשב?

האם לתרגום מכונה יש אפשרות להבחין בדקויות לשוניות, שיכולות להיות להן השפעות מרחיקות לכת על הכותב ו/או על הקורא?

הטקסט שאתם מפרסמים חשוב. יש לו מטרה – העברת מסר ושכנוע, מכירה, קבלה לעבודה, משמעות משפטית ועוד – והדרך להשיגה היא בטקסט שכתוב היטב. איכות התוכנות המתרגמות הולכת ומשתפרת עם הזמן, והן בהחלט מנסות להפיק תוצר מעבר לתרגום המילולי של כל מילה בנפרד. למרות זאת, לא הייתי ממליצה להסתמך על מכונה בלבד.

למה?

כי למחשב אין רגישות תרבותית

דוגמאות לתרגום מכונה

אני לא בטוחה שיהודי הקורא חומר פרסומי שבו הבטחה למי שסובל מבעיות רפואיות – "הפתרון הסופי!" – יתלהב לרכוש את התרופה.

איזו קונוטציה יש למילה "ניצולים" באוזן של היהודים? לקרוא למתמודדי תוכנית הריאליטי "ניצולים" קצת צורם באוזן היהודית, הרגילה לשמוע את המילה הזו בהקשרים של שואה ושל פיגועים.

אומנם מילולית The western wall זו החומה המערבית, אבל תרבותית הכינוי הוא "הכותל המערבי". כדי להיות הוגנת עם גוגל תרגום, התרגום ל־ The Western Wallהוא אכן, הכותל המערבי. אבל האם אנחנו מצפים מאדם שצריך תרגום למילים אלה, לדעת שצריך לכתוב זאת באותיות גדולות?

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי המחשב מתקשה להבחין בדקויות

דוגמאות לתרגום מכונה

בחומר משפטי, החיסכון בתשלום עבור מתרגם אנושי עלול לעלות למישהו כסף רב. נניח שיש לשרה שלושה ילדים: שתי בנות, ובן בסנדוויץ'. לפי הצוואה המקורית, בת הזקונים תקבל את כל הירושה. לפי התרגום של גוגל, הבן יקבל את כל הירושה.

בחומר רפואי, תרגום שגוי עלול לעלות ביוקר – לא בכסף אלא בחיים. לא ידוע לי על איזה מכשיר מדובר, אבל אם ההנחיה היא להקפיד על מרחק של 15 ס"מ לפחות, ייתכן כי מרחק של 6 ס"מ עלול להיות מסוכן. גם עניין הגובה בעייתי, אולי החולה יבין שהוא צריך לתלות את המכשיר מעליו. אשאיר לדמיון שלכם את מהות המכשיר ואת הסכנות מתלייתו בגובה.

אם היבואן של קפה Tester`s Choice יסתמך על תרגום של גוגל, יש סיכוי סביר שלא יצליח למכור כפי שציפה.

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי המחשב מתקשה להבין סלנג, צירופי מילים ומשמעויות שהן מעבר לתרגום המילולי

דוגמאות לתרגום מכונה

אומנם ניכר שגוגל מתעלה מעבר למילה היחידה, ואינו מתרגם bug כג'וק, למשל, אבל עדיין – התוצאה לוקה בחסר.

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי למחשב לא אכפת אם תתקבלו לעבודה או לא

ניסיתי לתרגם לעברית חלק מקורות החיים שלי, בעזרת גוגל תרגום.

אני לא הייתי מקבלת את עצמי לעבודה עם קורות חיים עילגים כאלה.

דוגמאות לתרגום מכונה
דוגמאות לתרגום מכונה

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי המחשב לא מפיק שפה רהוטה

במקרים רבים המחשב מתרגם מילולית, וקשה להבין את התוצר הסופי. פעמים רבות מתקבל משפט לא הגיוני ולא תקני בעברית. לא תמיד נלקחות בחשבון מילות היחס, מילות החיבור, סמיכויות וכדומה.

למשל, תרגמתי לעברית קטע מהאתר שלי, בעזרת גוגל תרגום.

דוגמאות לתרגום מכונה

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי למחשב אין שיקול דעת

אין לו רגישות לשונית בבחירת המילים המתאימות, הן מבחינת פירוש והן מבחינת דקויות ההבדלים ביניהן.

  • הוֹמוֹנִימים: מילים זהות בכתיב ובהיגוי, אך שונות במשמעות
  • הומוגרפים: מילים זהות בכתיב, אך שונות במשמעות ולפעמים גם בהיגוי
  • מילים נרדפות: מילים שונות בכתיב ובהיגוי, אך קרובות במשמעות (לא שוות ערך).
דוגמאות לתרגום מכונה
דוגמאות לתרגום מכונה
דוגמאות לתרגום מכונה

נכון שפנים ופרצוף הן מילים נרדפות, אבל הקונוטציה שונה – פרצוף משמש בדרך כלל במשמעויות שליליות. השימוש במילה "פנים" מנומס יותר, עדין יותר.

נכון שנהרגים במלחמה, אבל בעברית מכובסת מקובל לעדן את המילה, ולכתוב "נפל במלחמה".

שתי הדוגמאות האלה ממחישות שגוגל תרגום אינו מסוגל לבצע את ההבחנות הדקות האלה בשימושים ההולמים למילים הנרדפות.

גוגל מכיר את המילה "מרבד". בניסוח אחר באנגלית, הוא מתרגם את שם המבצע נכון:

The Jews from Yemen were brought to Israel in a special mission called the magic carpet

אבל כפי שמתברר, אי־אפשר לבנות על זה.

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי המחשב לא רואה את ההקשר

דוגמאות לתרגום מכונה

גוגל לא רואה את ההקשר במשפט, ולכן אינו יכול לדעת ששרה איננה אופה שעושה משלוחים, אלא היא אישה שיולדת תינוקת. אנה איננה שבורה – גם את זה גוגל לא רואה.

גוגל לא מצליח להבחין בין תיאור (כאילו "מחשבה פרודוקטיבית" שוות ערך ל"יפה") ובין פועל (חושבים פרודוקטיבית).

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי המחשב מתקשה להבחין בין זכר לנקבה

דוגמאות לתרגום מכונה

בעברית תקנית, בקהל מעורב משתמשים בלשון זכר. לכן, "ארבעה בנות ובנים" זו הצורה התקנית, גם אם היא צורמת באוזן. נראה שגוגל בוחר לפי המין הדקדוקי של המילה הראשונה, כי Four boys and girls מתורגם נכון – ארבעה בנים ובנות.

גם כשנותנים לגוגל את ההקשר, הוא לא מזהה שרוני זו בת, אולי כי סטטיסטית זהו שם של בן.

במקרה של פעמונים, כנראה גוגל פישל, כי כשבודקים עצמים אחרים באותו משפט, הוא יודע מתי לכתוב שלוש ומתי שלושה. למשל, Three dresses, Three houses אכן מתרגם נכון – שלוש שמלות, שלושה בתים.

דוגמה זו באה להוכיח שגם אם תרגום המחשב השתפר, עדיין אי־אפשר להשתמש בו בלי בדיקה של עין אנושית.

לא הייתי ממליצה להסתמך על המכונה בלבד.

למה?

כי למחשב אין חוש הומור

אחד הדברים הקשים ביותר למתרגמים הוא לתרגם בדיחות ומשחקי מילים, וברור שהמכונה לא מצליחה להתמודד עם זה.

להלן דוגמאות לבדיחות שהעוקץ שלהן אבד בקישקעס של המכונה.

דוגמאות לתרגום מכונה

לסיכום, אני מציעה לקרוא את המאמר:

The problem with machine translation: beware the wisdom of the crowd

שכתב

מה עושה תרגום מכונה בבלוג על השפה העברית?

כל טקסט שמתפרסם ברבים צריך להשיג את מטרתו, ועליו להיות איכותי – כתוב היטב, ברור וקולח.

זהו הקשר.

ראית שלטים או עלונים מביכים? נתקלת בתרגום מגוחך? אשמח לקבל צילום ולשתף עם החבר'ה.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

  אולי יעניין אותך גם

   לשירותי עריכה לשונית, עריכה ספרותית או עריכה אקדמאית 

דילוג לתוכן