יצירת ספר בויקי חסום
-
החסימה היא בגלל שהפידיאף לא מסונן בנטפרי באותה רמה שהטקסט מסונן. ואני ה"אשם" בחסימה הזאת (במערכת הפניות, בעבר).
-
במאמר המוסגר רציתי להוסיף כי אני בטוח שבהמשך ימצאו נטפרי דרך לסנן גם את הפידיאפים ברמה גבוהה בשוה לסינון הטקסט שלהם, דרך ובעזרת פונקציית זיהוי תווים שתהיה מובנית בסינון, ובהמשך אולי גם OCR לתמונות המכילות תווי אות ומלל.
-
הבנתי את התשובה לחלק הראשון של השאלה, ומה בקשר לחלק השני?
-
לא הבנתי, שמה יפתחו?
-
אני רואה שכבר התיחסת לחצי השני עוד לפני שהספקתי להגיב.. טוב מאוד
לעצם הענין, אני חושב שלא עמדת על עיקר הבעיה, כי הפתרון OCR הוא פתרון ונצרך בכלל רק לספרים ישנים שהם תמונות כי חדשים הרי הם כטקסט לכל דבר בפרט ויקיטקסט שהוא נוצר מטקסט ונשמר בpdf כטקסט! -
וא"כ חוזרת השאלה למה לא, מה הבעיה מה שפתוח בויקי אפשר ספר לא?!
-
המציאות כך היתה בעבר שהרובוט היה מסנן את הטקסט באתר כמו סינון טקסט ואת הפידיאף כמו סינון פידיאף. זה לא היה מסנן אותו בשוה אותו הדבר כמו המלל.
כנראה שהדבר דורש פיתוח נוסף, וכידוע שלנטפרי אין עדיין כסף שגדל על העצים לצרכי פיתוח, ויש שורה של דברים בפיתוח כבר. -
אני כבר רציתי להציע הצעה זו כבר אולי כמה פעמים, שיפתחו רובוט מסנן בפידיאף [ובתמונות עם OCR] כמו בטקסט. עד היום לא יצא לי להציע.
-
למה צריך OCR? מה רע בשליחת תמונה לבדיקה?
-
דר"א זה גם הבעיה בגוגל בוקס וכן פתרון אולי?
-
@zvizvi אמר ביצירת ספר בויקי חסום:
למה צריך OCR? מה רע בשליחת תמונה לבדיקה?
הענין הוא ששליחת תמונה לבדיקת הגויות לא בודק את תוכן המילים, בעוד שטקסט "פתוח" נבדק על ידי הרובוט לעומק.
-
@שלום-עולם אמר ביצירת ספר בויקי חסום:
דר"א זה גם הבעיה בגוגל בוקס וכן פתרון אולי?
לדעתי גוגל בוקס לא כדאי כי זה דעות חיצוניות, אבל אני עשוי לשער שהשלב הבא יהיה בנטפרי לעשות בדיקה על זה כמו ביוטיוב.
-
יש שם ספרי קודש נדירים!