• פוסטים אחרונים
    • תגיות
    • משתמשים
    • קבוצות
    • חיפוש
    • נטפרי-וויקי
    • En
    • התחברות

    גוגל לעזרת נטפרי

    מתוזמן נעוץ נעול הועבר דיונים בנושא רעיונות וחידושים בנטפרי
    21 פוסטים 10 כותבים 2.9k צפיות 1 עוקבים
    טוען פוסטים נוספים
    • מהישן לחדש
    • מהחדש לישן
    • הכי הרבה הצבעות
    תגובה
    • תגובה כנושא
    התחברו כדי לפרסם תגובה
    נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
    • יוליוסי מנותק
      יוליוס
      נערך לאחרונה על ידי

      יש לי רעיון מעניין,
      גם היום לאחר שנטפרי קיימת כבר למעלה משנתיים עדייין סינון טקסט שאינו ראוי לוקה בחסר וטעון שיפור וזה בעיני אחד מהאתגרים הגדולים ביותר.
      הקושי הגדול בין היתר הוא מציאת מילים עם מספר משמעויות שלחלקן יש משמעות לא ראויה.
      חשבתי על דרך לברר את המשמעות של המילה על ידי שימוש בגוגל טרנסטלייט כלומר שהדף יעבור כביכול תרגום לאנגלית ואם בתרגום ימצא שיש מילה שאינה ראויה זה יחסום את הדף או ישלח אותו לבדיקה.
      יש לי דוגמאות של דפים עם מילים לא ראויות שבתרגום יוצא שגיאה אבל אני לא רוצה לעלות אותם פה.

      נטפרי. הלכתחילה שבדיעבר!

      ליכטל תגובה 1 תגובה אחרונה תגובה ציטוט 3
      • ליכטל מנותק
        ליכט @יוליוס
        נערך לאחרונה על ידי ליכט

        @יוליוס אמר בגוגל לעזרת נטפרי:

        יש לי דוגמאות של דפים עם מילים לא ראויות שבתרגום יוצא שגיאה

        סתם כדי להבין. אתה טוען בעצם, שבאנגלית נטפרי הצליחו בסינון מלל, יותר מבעברית ?

        תגובה 1 תגובה אחרונה תגובה ציטוט 0
        • יוליוסי מנותק
          יוליוס
          נערך לאחרונה על ידי יוליוס

          לא, אין לי מושג מה המצב באנגלית למרות ששם בגלל שיש אותיות ניקוד אני חושב שיש פחות מילים שיש להם מספר משמעויות.
          אני מתכוון לומר שלפעמים בעברית למילה בעייתית יש משמעות גם כשרה, ואז הרובוט לא מזהה את זה כבעייתי. אבל כשמתרגמים את הטקסט לאנגלית הרובוט קולט שיש פה מילה בעייתית וחוסם.
          גוגל באמתעות השקעה רבה בבינה מלאכותית יודעים באחוז די גבוה מה המשמעות האמיתית של כל מילה לפי ההקשר של כל הקטע. נגיד המילה ישן יכול להיות גם במשמעות של שינה וגם במשמעות של עתיק. וגוגל לפי ההקשר יודעים מה המשמעות.
          לדוגמא: 'הבית הזה ממש ישן' מתורגם "This house is really old", ו'הילד שלי ישן' מתורגם "My child is asleep".
          אם ישן במובן של עתיק/זקן היתה מילה בעייתית אז מתרגום גוגל הרובוט היה עולה על זה שיש פה מילה בעייתית. אבל כיום או שהוא חוסם את שני המשמעויות או שהוא פותח.

          כואב לי שהנושא של הטקסט עדיין לא מושלם, ולכן אני חושב על פתרונות קצת הזויים אבל גם אם זה לא יעזור, לפחות זה יעורר את המודעות לנושא ויפתח פתח אולי לפתרונות אחרים טובים יותר.

          נטפרי. הלכתחילה שבדיעבר!

          תגובה 1 תגובה אחרונה תגובה ציטוט 5
          • נטפריסנ מנותק
            נטפריס
            נערך לאחרונה על ידי נטפריס

            זה בעיה, כי הסינון מלל צריך להיות מהר מהר.
            פניה לגוגל לוקחת המון המון זמן במושגים של "מייד".

            יוליוסי מ 2 תגובות תגובה אחרונה תגובה ציטוט 4
            • יוליוסי מנותק
              יוליוס @נטפריס
              נערך לאחרונה על ידי

              @נטפריס אמר בגוגל לעזרת נטפרי:

              זה בעיה, כי הסינון מלל צריך להיות מהר מהר.
              פניה לגוגל לוקחת המון המון זמן מושגים של "מייד".

              חשבתי על זה, אבל מה זה שונה מתמונה שברגע הראשון זה נחסם ואחרי מספר שניות/דקות זה נפתח.
              פה זה אמור לקחת מקסימום שתי שניות - הזמן שלוקח לגוגל לעבור על כל הדף.
              אני חושב שיש בעיה אחרת, לבודד את הקטע שהתגלה כבעייתי מתוך התרגום ולהצליבו עם הקטע בעברית. כך שלא כל הדף יחסם.
              אולי לפחות זה ישלח התראה למערכת וכך יעזור לשפר את האלגוריתם של הרובוט.

              נטפרי. הלכתחילה שבדיעבר!

              נטפריסנ תגובה 1 תגובה אחרונה תגובה ציטוט 1
              • מ מנותק
                מ. פינחסי @נטפריס
                נערך לאחרונה על ידי

                @נטפריס אמר בגוגל לעזרת נטפרי:

                זה בעיה, כי הסינון מלל צריך להיות מהר מהר.
                פניה לגוגל לוקחת המון המון זמן במושגים של "מייד".

                אין אפשרות להשיג מסד נתונים של התרגום גוגל?
                הרי בסמארטפונים יש אפשרות להוריד שפה מסויימת כך שיעבוד גם בלי חיבור.

                תגובה 1 תגובה אחרונה תגובה ציטוט 1
                • יוליוסי מנותק
                  יוליוס
                  נערך לאחרונה על ידי יוליוס

                  מאמר על שיטת התרגום של גוגל - Neural Machine Translation
                  http://amisalant.com/?p=12816

                  נטפרי. הלכתחילה שבדיעבר!

                  תגובה 1 תגובה אחרונה תגובה ציטוט 1
                  • shragaS מנותק
                    shraga
                    נערך לאחרונה על ידי

                    לדעתי הדרך היחידה לשיפור הרובוט, זה לדווח, ככך שידווחו יותר על מלל שלילי - הרובוט ישתפר.

                    קונים בעלי אקספרס? התוסף שיעזור לכם: ✅ למצוא את המחיר הכי זול למוצר בעלי אקספרס 💰, ✅ לחפש כל מוצר שמצאתם באינטרנט ישירות בעלי אקספרס 🔍, ✅ להשוות מחירים עם טימו 👈 התקינו חינם!⚡

                    נטפריסנ תגובה 1 תגובה אחרונה תגובה ציטוט 2
                    • נטפריסנ מנותק
                      נטפריס @shraga
                      נערך לאחרונה על ידי

                      @shraga אמר בגוגל לעזרת נטפרי:

                      לדעתי הדרך היחידה לשיפור הרובוט, זה לדווח, ככך שידווחו יותר על מלל שלילי - הרובוט ישתפר.

                      דרך זו עד היום תרמה גם המון בעיות ברובוט.

                      shragaS תגובה 1 תגובה אחרונה תגובה ציטוט 0
                      • נטפריסנ מנותק
                        נטפריס @יוליוס
                        נערך לאחרונה על ידי נטפריס

                        @יוליוס אמר בגוגל לעזרת נטפרי:

                        חשבתי על זה, אבל מה זה שונה מתמונה שברגע הראשון זה נחסם ואחרי מספר שניות/דקות זה נפתח.

                        בתמונות אתה מיידית מקבל תמונה חילופית. ויש תור בו נבדקים התמונות והתור הזה עולה זמן וכסף.
                        אם אתה מתכוון להעתיק את המודל הזה לכל חתיכת טקסט זה נראה לי לא מציאותי. אכן אני מסכים שיש טעם לשלוח מקרים בהם זוהה מלל שלילי.

                        yzahnY תגובה 1 תגובה אחרונה תגובה ציטוט 1
                        • shragaS מנותק
                          shraga @נטפריס
                          נערך לאחרונה על ידי shraga

                          @נטפריס אמר בגוגל לעזרת נטפרי:

                          @shraga אמר בגוגל לעזרת נטפרי:

                          לדעתי הדרך היחידה לשיפור הרובוט, זה לדווח, ככך שידווחו יותר על מלל שלילי - הרובוט ישתפר.

                          דרך זו עד היום תרמה גם המון בעיות ברובוט.

                          יתכן,
                          אך לא נראה לי שיש אפשרות אחרת טובה יותר

                          קונים בעלי אקספרס? התוסף שיעזור לכם: ✅ למצוא את המחיר הכי זול למוצר בעלי אקספרס 💰, ✅ לחפש כל מוצר שמצאתם באינטרנט ישירות בעלי אקספרס 🔍, ✅ להשוות מחירים עם טימו 👈 התקינו חינם!⚡

                          תגובה 1 תגובה אחרונה תגובה ציטוט 0
                          • yzahnY מנותק
                            yzahn @נטפריס
                            נערך לאחרונה על ידי yzahn

                            @נטפריס אמר בגוגל לעזרת נטפרי:

                            אם אתה מתכוון להעתיק את המודל הזה לכל חתיכת טקסט זה נראה לי לא מציאותי. אכן אני מסכים שיש טעם לשלוח מקרים בהם זוהה מלל שלילי.

                            זה נשמע כרעיון טוב - יתאפשר רובוט עם סטנדרטים יותר מחמירים ובמקרה של זיהוי תוכן בעייתי הדבר יישלח לבדיקה יותר מעמיקה מבלי לשבש את מבנה העמוד כמו בתמונות.
                            דרך אגב, כדי להשתמש בגוגל translate צריך לשלם (עד 2 מיליון תווים לחודש מקבלים חינם, אח"כ עולה $20 לכל מיליון תווים)

                            נטפריסנ A 2 תגובות תגובה אחרונה תגובה ציטוט 1
                            • נטפריסנ מנותק
                              נטפריס @yzahn
                              נערך לאחרונה על ידי

                              @yzahn אמר בגוגל לעזרת נטפרי:

                              דרך אגב, כדי להשתמש בגוגל translate צריך לשלם (עד 2 מיליון תווים לחודש מקבלים חינם, אח"כ עולה $20 לכל מיליון תווים)

                              אם ידיעתי וארנקי לא מתעתעים בי, אתה לא מעודכן בהקשר של ה2M הראשונים, זה בוטל וזה עולה מהתו הראשון.
                              ואגב בבינג זה עדיין קיים מלבד שהמחיר זול במחצית.
                              זה באמת יהיה עלות אבל גם התמונות זה עלות.

                              WWWW תגובה 1 תגובה אחרונה תגובה ציטוט 0
                              • A מנותק
                                aiib @yzahn
                                נערך לאחרונה על ידי

                                @yzahn ליותר ממליארד תווים יש הנחה...

                                תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                • WWWW מנותק
                                  WWW נקיפדיה @נטפריס
                                  נערך לאחרונה על ידי

                                  @נטפריס אם כבר, אפשר להשקיע לפתח קצת בינה מלאכותית לעניין.
                                  איך אומרים: 'בנטפרי השמים הם הגבול'...

                                  "עדיף להיות אדם חכם עם מכשיר טיפש,
                                  מאשר אדם טיפש עם מכשיר חכם"
                                  תגובה 1 תגובה אחרונה תגובה ציטוט 2
                                  • יהושע ב.י מנותק
                                    יהושע ב.
                                    נערך לאחרונה על ידי

                                    גא"מ לגוף הבעיה שאין סינון מלל באנגלית ברמה ההרמטית של הסינון בעברית.

                                    yzahnY תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                    • yzahnY מנותק
                                      yzahn @יהושע ב.
                                      נערך לאחרונה על ידי

                                      @יהושע-ב.

                                      @ליכט אמר בגוגל לעזרת נטפרי:

                                      סתם כדי להבין. אתה טוען בעצם, שבאנגלית נטפרי הצליחו בסינון מלל, יותר מבעברית ?

                                      @יוליוס אמר בגוגל לעזרת נטפרי:

                                      לא, אין לי מושג מה המצב באנגלית למרות ששם בגלל שיש אותיות ניקוד אני חושב שיש פחות מילים שיש להם מספר משמעויות.
                                      אני מתכוון לומר שלפעמים בעברית למילה בעייתית יש משמעות גם כשרה, ואז הרובוט לא מזהה את זה כבעייתי. אבל כשמתרגמים את הטקסט לאנגלית הרובוט קולט שיש פה מילה בעייתית וחוסם.
                                      גוגל באמתעות השקעה רבה בבינה מלאכותית יודעים באחוז די גבוה מה המשמעות האמיתית של כל מילה לפי ההקשר של כל הקטע. נגיד המילה ישן יכול להיות גם במשמעות של שינה וגם במשמעות של עתיק. וגוגל לפי ההקשר יודעים מה המשמעות.

                                      אז אתה טוען ממש הפוך מהנ"ל

                                      תגובה 1 תגובה אחרונה תגובה ציטוט 1
                                      • מ מנותק
                                        מ. פינחסי
                                        נערך לאחרונה על ידי

                                        @נטפריס
                                        אין אפשרות להשיג מסד נתונים של התרגום גוגל?
                                        הרי בסמארטפונים יש אפשרות להוריד שפה מסויימת כך שיעבוד גם בלי חיבור.

                                        תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                        • shragaS מנותק
                                          shraga
                                          נערך לאחרונה על ידי

                                          @MacroShadow אמר באמזון איטליה - עזרה דחופה:

                                          @elisha אמר באמזון איטליה - עזרה דחופה:

                                          @baruch וכאן הבן שואל למה א"א פשוט להכניס את רשימת המילים השליליות מהשפות הנ"ל ל- translate ולתרגם לאיטלקית והנה יש לנו רובוט שמבין גם איטלקית ?

                                          א. לא מדובר ברשימת מילים שליליות בלבד, מדובר בביטויים מורכבים מאוד היחודיים לכל שפה. הרובוט לא חוסם רק לפי רשימת מילים, אלא גם צירופי מילים הנמצאים בקירבה מסויימת (כפי שהוגדר לפי העניין) אחד לשני (לשלישי ולרביעי, וכן הלאה). כמו"כ יש ביטויים שלא ייחסמו אם יופיע מילה מסויימת בקירבה מסויימת (כפי שהוגדר לפי העניין). לדוגמא: ברור ש"בורא מיני בשמים" לא אמור להיחסם, למרות שיש שם מילה שאמורה להיחסם באופנים מסויימים.
                                          ב. לא ניתן לתרגם מילים גרועות מאוד בגוגל טרנסלייט.
                                          ג. אם השתמשת פעם בגוגל טרנסלייט, אתה יודע כמה הוא אמין בתרגום מדוייק...

                                          אפשר לומר שבעברית (באנגלית אני לא מתמצא) סינון המלל מקיף 99.9 מהמילים והמשמעויות הברורות שצריכות להיחסם, הבעיה היא במשפטים שאין בהם מילה בעלת אופי שלילי מובהק, בשביל כזה דבר לא יעזור שום בינה מלאכותית, הדרך היחידה היא ללמד את הרובוט ביטויים וצירופי מילים, זה דבר שיכול להתבצע רק על ידי בן אנוש.

                                          קונים בעלי אקספרס? התוסף שיעזור לכם: ✅ למצוא את המחיר הכי זול למוצר בעלי אקספרס 💰, ✅ לחפש כל מוצר שמצאתם באינטרנט ישירות בעלי אקספרס 🔍, ✅ להשוות מחירים עם טימו 👈 התקינו חינם!⚡

                                          WEB developerW תגובה 1 תגובה אחרונה תגובה ציטוט 1
                                          • WEB developerW מנותק
                                            WEB developer @shraga
                                            נערך לאחרונה על ידי

                                            @shraga חקרת את הנושא של בינה מלאכותית ולמידת מכונה?

                                            shragaS תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                            • פוסט ראשון
                                              פוסט אחרון