תגובה לעניין צדדי באשכול נעול
-
@magicode אמר בתגובה לעניין צדדי באשכול נעול:
תחום אפור לא נחשב לכשל בכלל. היות ומה שתעשה יהיה הגדרה נכונה עדיף שיחסמו מאשר יפתחו.
וככל הנראה כל מה שנחסם במכלול שייך לתחום אפור. תחום אפור זה למשל גברים שיש להם מראה של בת.תשובה עלובה.
א. אומרים לך ש54% אחוז מהחסימות זה כשר בוודאות ולא לבדיקה חוזרת.
ב. גם היתר שזה אולי תחום אפור, ברור שצריך להיבדק. ולא סתם לחסום כי אולי יש פסול. וברור שאם היה נבדק כמו שצריך היו נפתחוים עוד כמה אחוזים.
עדיף לקחת אחריות על המחדל ולנסות להשתפר מאשר לדחות אומטית את הנתונים.@magicode אמר בתגובה לעניין צדדי באשכול נעול:
ההסבר שלך יותר מתקבל. כי טעות אחת לכל 4000 תמונות זה הגיוני לכשל טכני. כלומר לחיצה על אישור במקום סירוב. ולהיפך. כלומר העובד לא טעה במה שרצה להגדיר אלא היד שלו טעתה.
היחס טעות הוא לא כללי. כי אם מתוך כלל הבדיקות יחס הטעות הוא 1/4000, זה אומר שכל ההחלטות לחסום הם רק טעות. מה שוודאי לא מציאותי.
וביותר, שיחס כזה גרוע הוא רק לחומרא. אנחנו לא שומעים על יחס כזה של תמונות שפתוחות בטעות.
כנראה שהעובדים מעדיפים (או על דעת עצמם או בהוראת המפעילים) שאם יש תמונה שהיא כשרה, כחצי מהפעמים לא לפתוח.
מחייב בדק בית. -
@אינו-יודע-לשאול אמר בתגובה לעניין צדדי באשכול נעול:
ש לך טעות כי נטפרי בודקים את כל ה300 אלף תמונות ומתוכם יש 0.05 שנחסם שכחצי מזה היה אמור להיחסם יוצא 0.025 אחוז שזה בכלל לא הרבה
1/4000 בערךאיך הגעת למספר הזה?? ממה שאני רואה שם יש 17,202 תמונות שנחסמו. כאשר מתוכם 54% (שזה 9,289 פסילות) פסילות מיותרות.
אז גם אם נבדקו 300000 תמונות, אז היחס של הפסילות הוא 5.73%. (שזה לא מה שכתבת. וזה לא מעט יחסית לאתר שאמור להיות מסונן מראש)
זה לא 1/4000, אלא 1/17 (בערך. סך כל החסימות) -
@III
אני גם יודע שיש המון חסימות שגויות אבל הפעם זה ממש לא ראיה
אתה לוקח אתר שאמור להיות בו 0 תמונות חסומות בנטפרי כי העורך בעצמו אמור לסנן, ובאמת בדרך כלל הוא מסנן. אז כבר הורדת עשרות אלפי תמונות ויותר שאמורות להיות חסומות לכולי עלמא מהסטטיסטיקה, פלוס כל התמונות המסופקות שלדברי מגיקוד בכוונה חוסמים אותם, וזה הגיוני מאוד.
זה יהיה ראיה אם תריץ את הבדיקה על התמונות החסומות בויקיפדיה, כמה מתוכן חסומות סתם. שזה מייצג אתר קלאסי שיש בו גם הרבה תמונות נשים. -
@צדיק-תמים אמר בתגובה לעניין צדדי באשכול נעול:
אבל הפעם זה ממש לא ראיה
אתה לוקח אתר שאמור להיות בו 0 תמונות חסומות בנטפרי כי העורך בעצמו אמור לסנן, ובאמת בדרך כלל הוא מסנן.בדיוק להיפך. אם באתר שהסבירות לתמונות פסולות הוא כ0%, בכל אופן נטפרי חוסמים 5.75%. (לרוב ללא סיבה) ק"ו בן בנו של ק"ו באתר שסביר שיהיה בו תמונות גרועות, שיחסם הרבה יותר. ובאחוזי טעות כאלו, יהיו גם יותר טעויות.
אם כבר הטיעון הזזה פורך את תגובתו של מג'יקוד:@magicode אמר בתגובה לעניין צדדי באשכול נעול:
תחום אפור לא נחשב לכשל בכלל. היות ומה שתעשה יהיה הגדרה נכונה עדיף שיחסמו מאשר יפתחו.
וככל הנראה כל מה שנחסם במכלול שייך לתחום אפור. תחום אפור זה למשל גברים שיש להם מראה של בת.שאם מדובר באתר שכנראה כבר מסונן, זה אומר שגם מה שלא נמצא כשר, חלקו הגדול כנראה באמת כן כשר.(כי זה כבר סונן) וזה אומר שבמציאות אחוז השגיעות אפילו יותר גדול.
-
@אינו-יודע-לשאול אאל"ט @III צודק שלפי המספרים שהבאת יוצא שאחד מתוך שבערך 1 מתוך כל 36 תמונות באתר נפסל בטעות (עשית חישוב של 17202 לחלק ל-330435 כאשר היית צריך לעשות הפוך)
בכל מקרה המשתמש @III בא לקנטר והוא מקנטר סידרתי פה, אני לא רואה סיבה להתייחס לדבריו בצורה נימוסית כאשר הוא לא מקפיד על כללי נימוס בסיסיים. אולי הוא לא מבין שהשיחה בפורום זה שיח בין אנשים ולא בין ניקים מעורטלי גוף ונפש
@III אם לא מתאים לך נטפרי, תעבור לסינון אחר, אם אתה רוצה לגרום לשיפור באיכות הסינון זו לא הצורה. אולי לא הכל מושלם, או שתשתלם עם זה, או תנסה לשפר בצורה מכובדת, בצורה שיהיה לך סיכוי באמת לעזור. -
@yzahn אמר בתגובה לעניין צדדי באשכול נעול:
בכל מקרה המשתמש @III בא לקנטר והוא מקנטר סידרתי פה, אני לא רואה סיבה להתייחס לדבריו בצורה נימוסית כאשר הוא לא מקפיד על כללי נימוס בסיסיים. אולי הוא לא מבין שהשיחה בפורום זה שיח בין אנשים ולא בין ניקים מעורטלי גוף ונפש
@III אם לא מתאים לך נטפרי, תעבור לסינון אחר, אם אתה רוצה לגרום לשיפור באיכות הסינון זו לא הצורה. אולי לא הכל מושלם, או שתשתלם עם זה, או תנסה לשפר בצורה מכובדת, בצורה שיהיה לך סיכוי באמת לעזור.אהבל.
אם אין לך משהו לעניין להגיד, עדיף שתשתוק.(ולא צריך להגיב לטיפשים שכמותך. אבל מה שעניתי לאינו יודע לשאול, זה בצורה מאד מנומסת ביחס לסטנדרט בפורום)
-
לאחרונה הגיעו פה אשכולות לרמות מגעילות של יחס אחד כלפי השני.
לכן אחד הדברים שכדאי להימנע מהם לא לחלק ציונים על תשובות של כל אחד.
למשל לא לכתוב את הניסוח "תשובה עלובה". זה מיותר ולא מועיל לדיון. רק הופך אותו למעליב וגורם להתנצחות אישית. צריך להקפיד פה על שיח מכבד. גם אם לא מסכימים עם הכותב.לעצם העניין של החישוב. אם אני לוקח את הנתונים של @אינו-יודע-לשאול הוא הביא 330435 שנפתחו אז להלן החישוב
17202/(330435+17202) = 0.04948
0.04948*0.54=0.02671זה 0.02671 סך הטעיות.
כדי לדעת כמה זה אחד מתוך עושים ככה
1/0.02671=37.43916136278547
כלומר טעות אחת לכל 37 תמונות.
כנראה שהיה לו טעות בחישוב והוא הוסיף כמה אפסים.אז אנחנו עוברים להסבר השני של התחום האפור.
אז אני יביא לכם דוגמא שעובד חסם תמונה של שער של התלמוד בבלי.
מי שיש לו קצת דמיון יכול להבין למה הוא חסם את השער הזה.
זה לדעתי טעות שמתקבלת בהבנה.
כי הרי מצפים ממנו לחסום גם כל מיני דברים שמסמלים בעיות.
ואנחנו כחרדים מעדיפים שיחסם על פני שיפתח לכן זה מה שיוצאכמובן שתמיד נטפרי צריכים לבדוק את עצמם בלי קשר האם התשובות שלי עלובות או לא.
-
@iii
בבקשה. אל תמחק את התגובות שלך.
שכולם יראו עם מי יש לנו עסק פה בפרום. -
@magicode כולי מלא התנצלות ובושה על שגרמתי לדיון שכזה
כוונתי היתה רק לגרום התעניינות במיזם של המכלול ולא מעבר לכך -
@613 תודה לך על הפתיחת הנושא החשוב
ואני מקוה שיצא מזה רק טוב, וד"ל -
@613 אמר בתגובה לעניין צדדי באשכול נעול:
@magicode כולי מלא התנצלות ובושה על שגרמתי לדיון שכזה
כוונתי היתה רק לגרום התעניינות במיזם של המכלול ולא מעבר לכךמה הבעיה בדיון הזה ?
(כלשעצמו, לא במקום אליו היו מי שניסו לגרור אותו).
אדרבא, אם אכן יש בעיה, צריך לבדוק ולנסות להבין אותה, לא ? -
@ליכט למעשה באה תקלה על ידי והדיון נגרר לשיח נמוך
במיוחד שאני די לא מבין מה שייך בכלל לדון על אחוזי תמונות וכד'
מישהו חושב שנרנדה חוסם בכוונה כדי לדפוק את היהודים?........
בתור אחד שבודק את התמונות החסומות במכלול אני די משועשע מהטעויות שלהם ומבין שזה מה יש... -
@613 אמר בתגובה לעניין צדדי באשכול נעול:
@ליכט למעשה באה תקלה על ידי והדיון נגרר לשיח נמוך
למה אתה מאשים את עצמך
תאשים אותי שביקשתי ממך....הכל בסדר, דיונים אינטלקטואלים הם תענוג
ואם יש קוצים
מבקשים מבעל הכרם שירחיק אותם -
הפרשנות שלי לנתונים
א. השאלה מה האחוז של התמונות החסומות במכלול
לא רלוונטית כלל ועיקר לגבי אחוז הטעות (מתוך כלל התמונות) של מערך הבדיקות,
מכיון שההודים לא בודקים את המכלול בנפרד, אלא התמונות מתערבבות בין כל התמונות שנשלחו באותו רגע
(ואם יש משמעות לנתון הזה בלי קשר למכלול, זה רק כשנדע בזמן נתון כמה תמונות בדקו בכל נטפרי, ומה החלוקה הפנימית פתוח/בטעות, חסום/בטעות).ב. יש בהחלט משמעות גדולה מאד לכך שמראש מדובר באתר נקי
כך שהגיוני מאד שרוב ככל התמונות החסומות בטעות או בצדק הם במתחם האפור
וזו הסיבה לתוצאה העצומה של 54% טעות
ממילא אין בכך שום אינדיקציה לגבי אחוז החסימה בטעות של מערך הבדיקות הכללי של נטפרימה שאנחנו למדים מהנתונים הוא
א. 95% מתוך התמונות המועלות למכלול הן נקיות לחלוטין
ב. 5% הם על גבול האפור
ג. שבנטפרי הולכים בטווח האפור על פי רוב לחומרא
ד. מבחינה סטיסטית 5% מכלל התמונות הכשרות לכאורה, בכל מאגר שהוא, הם בטווח האפור
ה. סך הטעות של נטפרי הוא 2-3 אחוז מכלל הנ”למה אנחנו לא למדים מהנתונים
א. אין שום אינדיקציה מהו יחס התמונות הכשרות לכאורה ביחס לפסולות, בכלל מאגרי הרשת שנשלחים לבדיקה
ב. אין שום אינדיקציה מהו רף הטעות בתמונות שההכרעה לגביהם חדה וברורהמה זה נותן לנו?
@צדיק-תמים אמר בתגובה לעניין צדדי באשכול נעול:
זה יהיה ראיה אם תריץ את הבדיקה על התמונות החסומות בויקיפדיה, כמה מתוכן חסומות סתם. שזה מייצג אתר קלאסי שיש בו גם הרבה תמונות נשים.
@אחד-תם אמר בלפעמים מדלגים על תמונות בחסימה:
האמת שאם רק רוצים לדעת את ההיקף
לא צריך רובוט
אפשר פשוט יום אחד (דוגמא בעלמא נקט) לשלוח את כל התמונות החסומות לבדיקה חוזרת -
@magicode אמר בתגובה לעניין צדדי באשכול נעול:
למשל לא לכתוב את הניסוח "תשובה עלובה". זה מיותר ולא מועיל לדיון. רק הופך אותו למעליב וגורם להתנצחות אישית. צריך להקפיד פה על שיח מכבד. גם אם לא מסכימים עם הכותב.
צודק. סליחה. התערבב לי הבוז על התגובה האישית של yzahn שהייתה בדיוק קודם. מתנצל. והלוואי שיום אחד באמת השיח פה יהיה ענייני ומכבד.
אני בהחלט מקבל בהבנה את זה שיש טעויות, וכן את זה שהולכים לחומרא. אני לא מסכים אם הטיעונים שזה בטווח הטעות האנושית הסטטיסטית, או שהמקרה הזה לא מספיק מייצג.הסבר: בכל אתר אחר אין איך לבחון מה היחס בין מה שהיה צריך להחסם למה שנחסם, בגלל שלא ידוע כמה היה צריך להחסם.
דווקא באתר מסונן הציפיה היא שבקושי יחסמו תמונות. וזה נקודת ייחוס.
שרואים שנחסם כ6 אחוז, זה מראה שהחסימות הם בסדר גודל גדול.
נושא שני זה לבדוק את עצם החסימות. כאשר רואים שמתוך החסימות 54% הם חסימות יתר, אפשר להשליך מזה על כל האתרים, שכפי שנאמר, הם מגיעים לבודקים בערבוב. כלומר שרוב מה שנטפרי חוסם זה חסימות יתר.
נושא שלישי זה התחום האפור. כמובן שמכל האינטרנט מגיעים לנטפרי תמונות על כל הסקאלה. לפי מה שהבנתי מאינו יודע לשאול, לפי בודקי המכלול התחום האפור כלול ב46% הנוספים. (אם מציאותית זה כן כלול ב54% הלא מוצדקות, זה לכל היותר מרכך קצת את הנתון הגרוע של רוב, ואלי רק חצי זה חסימת יתר. עדיין יש מה לשפר.הסבר אחר הגיוני שאני יכול לחשוב עליו, הוא שבשביל שאחוזי פתיחות היתר יהיו כפי שהם עכשיו 99.999%, ולא יפגעו מטווח הטעות האנושית (שהיא גבוהה יותר מ0.001%), צריך להנחות את הבודקים שכל דבר שהם לא בטוחים במליון אחוז שהוא כשר, יחסם. והגיוני שסך המקרים האלו הם 2.8% מכלל התמונות שנבדקות.
בכל אופן לא צריך לפחד מביקורת, אפילו שיוצא ממנה שנטפרי עדיין לא מושלמים. -
בנוגע לסטטיסטיקה ומספרים, באמת קצת קטנוני להתווכח על אחוז יותר או פחות, אבל למען סתם למען הדיוק (לענ"ד) -
@אינו-יודע-לשאול אמר בתגובה לעניין צדדי באשכול נעול:
ומתוך זה רק 54% היה טעות בזיהוי
המספר בדף ההוא נכון לעכשיו הוא:
49.4% נבדקו וטופלו 8,491 מתוך כ-17,202 תמונות חסומות
@magicode אמר בתגובה לעניין צדדי באשכול נעול:
אם אני לוקח את הנתונים של @אינו-יודע-לשאול הוא הביא 330435 שנפתחו אז להלן החישוב
17202/(330435+17202) = 0.04948נראה לי שהמספר 330435 זה סך כל התמונות שעברו בדיקה כולל החסומות, לכן החישוב אמור להיות 17202/330435 = 0.052
למעשה מעיון בדף המיזם לא ברור לי מה המספרים מציינים,
נבדקו וטופלו 8,491 מתוך כ-17,202 תמונות חסומות
מה הכוונה ש"נבדקו וטופלו"? האם זה אומר שנמצאו כשרים והסירו את החסימה נטפרי? האם הכוונה שהחליפו/ערכו את התמונה בתמונה כשרה? או שזה נידון לחסימה או פתיחה לעומת האחרים שעוד לא עברו את הביקורת?
@אחד-תם אמר בתגובה לעניין צדדי באשכול נעול:
השאלה מה האחוז של התמונות החסומות במכלול
לא רלוונטית כלל ועיקר לגבי אחוז הטעות (מתוך כלל התמונות) של מערך הבדיקותלא הבנתי למה לא. יש לנו עכשיו דגימה עם פריסה רנדומלית (לכאורה) של תמונות כשרות שנפסלו מתוך כלל התמונות הכשרות שעוברים בדיקה
בדיוק בגלל ש:ההודים לא בודקים את המכלול בנפרד, אלא התמונות מתערבבות בין כל התמונות שנשלחו באותו רגע
לכן אפשר ללמוד מזה על הכלל מה בערך אחוזי הפסילות הלא נכונות בשאר התמונות
המספר של 54% באמת לא רלוונטי לנושא, זה רק האחוז מתוך הלכאורה כשרים שנפסלו ולא מתוך כלל התמונות הכשרות, המספר הזה רק אומר שמתוך ה"לכאורה כשרים" היו בערך חצי שבאמת לא היו כשרים לפי סטנדרט נטפרי
-
@iii אמר בתגובה לעניין צדדי באשכול נעול:
נושא שני זה לבדוק את עצם החסימות. כאשר רואים שמתוך החסימות 57% הם חסימות יתר, אפשר להשליך מזה על כל האתרים, שכפי שנאמר, הם מגיעים לבודקים בערבוב. כלומר שרוב מה שנטפרי חוסם זה חסימות יתר.
זה חישוב לא נכון סטטיסטית
המספר 54% זה מתוך ה"לכאורה כשרים" ולא מתוך כלל הפסולים -
@yzahn אמר בתגובה לעניין צדדי באשכול נעול:
בנוגע לסטטיסטיקה ומספרים, באמת קצת קטנוני להתווכח על אחוז יותר או פחות, אבל למען סתם למען הדיוק (לענ"ד) -
אתה מביא מספר לא רלוונטי. הם לא סיימו לעבור על כל ה 17202 שנחסמו, אלא רק על 49.4% שהם 8491.
זה מספיק כמדגם מייצג שמתוך מה שהם בדקו 54% חסימת יתר. וזה דווקא כן רלוונטי.
שמחתי לעזור. -
אני מציע ש @613 יביא את הנתונים המדוייקים.
כמה תמונות יש במכלול. כמה מתוכם נחסמו וכמה מתוכם לא היה חסימה נכונה. וגם שיביא כמה דוגמאות רנדומליות לחסימות לא נכונות. שנוכל להתרשם מה ההגדרה של חסימה לא נכונה. -
@III יכול להיות שאתה צודק, לא היה ברור לי איך לקרוא את הנתונים שם, עיין לעיל שפירטתי את ספיקותיי
בכל מקרה 54% הוא מספר לא כל כך רלוונטי, זה המספר של חסימות לא נכונות מתוך חסימות במאגר תמונות "לכאורה כשרות". מתוך מאגר רנדומלי של תמונות יהיו אחוזים הרבה יותר נמוכים של חסימות יתר.כדי לקבל את אחוזי החסימות הלא נכונות מהתמונות הכלליות אפשר להשתמש עם הנתונים מהמכלול אבל צריך עוד נתון שזה אחוזי החסימות מתוך כלל התמונות הנבדקות ואז אפשר להשתמש בחוק בייס לקבל את אחוזי החסימות הלא נכונות