תגובה לעניין צדדי באשכול נעול
-
הפרשנות שלי לנתונים
א. השאלה מה האחוז של התמונות החסומות במכלול
לא רלוונטית כלל ועיקר לגבי אחוז הטעות (מתוך כלל התמונות) של מערך הבדיקות,
מכיון שההודים לא בודקים את המכלול בנפרד, אלא התמונות מתערבבות בין כל התמונות שנשלחו באותו רגע
(ואם יש משמעות לנתון הזה בלי קשר למכלול, זה רק כשנדע בזמן נתון כמה תמונות בדקו בכל נטפרי, ומה החלוקה הפנימית פתוח/בטעות, חסום/בטעות).ב. יש בהחלט משמעות גדולה מאד לכך שמראש מדובר באתר נקי
כך שהגיוני מאד שרוב ככל התמונות החסומות בטעות או בצדק הם במתחם האפור
וזו הסיבה לתוצאה העצומה של 54% טעות
ממילא אין בכך שום אינדיקציה לגבי אחוז החסימה בטעות של מערך הבדיקות הכללי של נטפרימה שאנחנו למדים מהנתונים הוא
א. 95% מתוך התמונות המועלות למכלול הן נקיות לחלוטין
ב. 5% הם על גבול האפור
ג. שבנטפרי הולכים בטווח האפור על פי רוב לחומרא
ד. מבחינה סטיסטית 5% מכלל התמונות הכשרות לכאורה, בכל מאגר שהוא, הם בטווח האפור
ה. סך הטעות של נטפרי הוא 2-3 אחוז מכלל הנ”למה אנחנו לא למדים מהנתונים
א. אין שום אינדיקציה מהו יחס התמונות הכשרות לכאורה ביחס לפסולות, בכלל מאגרי הרשת שנשלחים לבדיקה
ב. אין שום אינדיקציה מהו רף הטעות בתמונות שההכרעה לגביהם חדה וברורהמה זה נותן לנו?
@צדיק-תמים אמר בתגובה לעניין צדדי באשכול נעול:
זה יהיה ראיה אם תריץ את הבדיקה על התמונות החסומות בויקיפדיה, כמה מתוכן חסומות סתם. שזה מייצג אתר קלאסי שיש בו גם הרבה תמונות נשים.
@אחד-תם אמר בלפעמים מדלגים על תמונות בחסימה:
האמת שאם רק רוצים לדעת את ההיקף
לא צריך רובוט
אפשר פשוט יום אחד (דוגמא בעלמא נקט) לשלוח את כל התמונות החסומות לבדיקה חוזרת -
@magicode אמר בתגובה לעניין צדדי באשכול נעול:
למשל לא לכתוב את הניסוח "תשובה עלובה". זה מיותר ולא מועיל לדיון. רק הופך אותו למעליב וגורם להתנצחות אישית. צריך להקפיד פה על שיח מכבד. גם אם לא מסכימים עם הכותב.
צודק. סליחה. התערבב לי הבוז על התגובה האישית של yzahn שהייתה בדיוק קודם. מתנצל. והלוואי שיום אחד באמת השיח פה יהיה ענייני ומכבד.
אני בהחלט מקבל בהבנה את זה שיש טעויות, וכן את זה שהולכים לחומרא. אני לא מסכים אם הטיעונים שזה בטווח הטעות האנושית הסטטיסטית, או שהמקרה הזה לא מספיק מייצג.הסבר: בכל אתר אחר אין איך לבחון מה היחס בין מה שהיה צריך להחסם למה שנחסם, בגלל שלא ידוע כמה היה צריך להחסם.
דווקא באתר מסונן הציפיה היא שבקושי יחסמו תמונות. וזה נקודת ייחוס.
שרואים שנחסם כ6 אחוז, זה מראה שהחסימות הם בסדר גודל גדול.
נושא שני זה לבדוק את עצם החסימות. כאשר רואים שמתוך החסימות 54% הם חסימות יתר, אפשר להשליך מזה על כל האתרים, שכפי שנאמר, הם מגיעים לבודקים בערבוב. כלומר שרוב מה שנטפרי חוסם זה חסימות יתר.
נושא שלישי זה התחום האפור. כמובן שמכל האינטרנט מגיעים לנטפרי תמונות על כל הסקאלה. לפי מה שהבנתי מאינו יודע לשאול, לפי בודקי המכלול התחום האפור כלול ב46% הנוספים. (אם מציאותית זה כן כלול ב54% הלא מוצדקות, זה לכל היותר מרכך קצת את הנתון הגרוע של רוב, ואלי רק חצי זה חסימת יתר. עדיין יש מה לשפר.הסבר אחר הגיוני שאני יכול לחשוב עליו, הוא שבשביל שאחוזי פתיחות היתר יהיו כפי שהם עכשיו 99.999%, ולא יפגעו מטווח הטעות האנושית (שהיא גבוהה יותר מ0.001%), צריך להנחות את הבודקים שכל דבר שהם לא בטוחים במליון אחוז שהוא כשר, יחסם. והגיוני שסך המקרים האלו הם 2.8% מכלל התמונות שנבדקות.
בכל אופן לא צריך לפחד מביקורת, אפילו שיוצא ממנה שנטפרי עדיין לא מושלמים. -
בנוגע לסטטיסטיקה ומספרים, באמת קצת קטנוני להתווכח על אחוז יותר או פחות, אבל למען סתם למען הדיוק (לענ"ד) -
@אינו-יודע-לשאול אמר בתגובה לעניין צדדי באשכול נעול:
ומתוך זה רק 54% היה טעות בזיהוי
המספר בדף ההוא נכון לעכשיו הוא:
49.4% נבדקו וטופלו 8,491 מתוך כ-17,202 תמונות חסומות
@magicode אמר בתגובה לעניין צדדי באשכול נעול:
אם אני לוקח את הנתונים של @אינו-יודע-לשאול הוא הביא 330435 שנפתחו אז להלן החישוב
17202/(330435+17202) = 0.04948נראה לי שהמספר 330435 זה סך כל התמונות שעברו בדיקה כולל החסומות, לכן החישוב אמור להיות 17202/330435 = 0.052
למעשה מעיון בדף המיזם לא ברור לי מה המספרים מציינים,
נבדקו וטופלו 8,491 מתוך כ-17,202 תמונות חסומות
מה הכוונה ש"נבדקו וטופלו"? האם זה אומר שנמצאו כשרים והסירו את החסימה נטפרי? האם הכוונה שהחליפו/ערכו את התמונה בתמונה כשרה? או שזה נידון לחסימה או פתיחה לעומת האחרים שעוד לא עברו את הביקורת?
@אחד-תם אמר בתגובה לעניין צדדי באשכול נעול:
השאלה מה האחוז של התמונות החסומות במכלול
לא רלוונטית כלל ועיקר לגבי אחוז הטעות (מתוך כלל התמונות) של מערך הבדיקותלא הבנתי למה לא. יש לנו עכשיו דגימה עם פריסה רנדומלית (לכאורה) של תמונות כשרות שנפסלו מתוך כלל התמונות הכשרות שעוברים בדיקה
בדיוק בגלל ש:ההודים לא בודקים את המכלול בנפרד, אלא התמונות מתערבבות בין כל התמונות שנשלחו באותו רגע
לכן אפשר ללמוד מזה על הכלל מה בערך אחוזי הפסילות הלא נכונות בשאר התמונות
המספר של 54% באמת לא רלוונטי לנושא, זה רק האחוז מתוך הלכאורה כשרים שנפסלו ולא מתוך כלל התמונות הכשרות, המספר הזה רק אומר שמתוך ה"לכאורה כשרים" היו בערך חצי שבאמת לא היו כשרים לפי סטנדרט נטפרי
-
@iii אמר בתגובה לעניין צדדי באשכול נעול:
נושא שני זה לבדוק את עצם החסימות. כאשר רואים שמתוך החסימות 57% הם חסימות יתר, אפשר להשליך מזה על כל האתרים, שכפי שנאמר, הם מגיעים לבודקים בערבוב. כלומר שרוב מה שנטפרי חוסם זה חסימות יתר.
זה חישוב לא נכון סטטיסטית
המספר 54% זה מתוך ה"לכאורה כשרים" ולא מתוך כלל הפסולים -
@yzahn אמר בתגובה לעניין צדדי באשכול נעול:
בנוגע לסטטיסטיקה ומספרים, באמת קצת קטנוני להתווכח על אחוז יותר או פחות, אבל למען סתם למען הדיוק (לענ"ד) -
אתה מביא מספר לא רלוונטי. הם לא סיימו לעבור על כל ה 17202 שנחסמו, אלא רק על 49.4% שהם 8491.
זה מספיק כמדגם מייצג שמתוך מה שהם בדקו 54% חסימת יתר. וזה דווקא כן רלוונטי.
שמחתי לעזור. -
אני מציע ש @613 יביא את הנתונים המדוייקים.
כמה תמונות יש במכלול. כמה מתוכם נחסמו וכמה מתוכם לא היה חסימה נכונה. וגם שיביא כמה דוגמאות רנדומליות לחסימות לא נכונות. שנוכל להתרשם מה ההגדרה של חסימה לא נכונה. -
@III יכול להיות שאתה צודק, לא היה ברור לי איך לקרוא את הנתונים שם, עיין לעיל שפירטתי את ספיקותיי
בכל מקרה 54% הוא מספר לא כל כך רלוונטי, זה המספר של חסימות לא נכונות מתוך חסימות במאגר תמונות "לכאורה כשרות". מתוך מאגר רנדומלי של תמונות יהיו אחוזים הרבה יותר נמוכים של חסימות יתר.כדי לקבל את אחוזי החסימות הלא נכונות מהתמונות הכלליות אפשר להשתמש עם הנתונים מהמכלול אבל צריך עוד נתון שזה אחוזי החסימות מתוך כלל התמונות הנבדקות ואז אפשר להשתמש בחוק בייס לקבל את אחוזי החסימות הלא נכונות
-
@yzahn אמר בתגובה לעניין צדדי באשכול נעול:
@III יכול להיות שאתה צודק, לא היה ברור לי איך לקרוא את הנתונים שם, עיין לעיל שפירטתי את ספיקותיי
בכל מקרה 54% הוא מספר לא כל כך רלוונטי, זה המספר של חסימות לא נכונות מתוך חסימות של מאגר של תמונות "לכאורה כשרות". מתוך מאגר רנדומלי של תמונות יהיו אחוזים הרבה הרבה יותר נמוכים של חסימות יתר. לפי המדגם של המכלול זה יהיה משהו כמו 2%כדי לקבל את אחוזי החסימות הלא נכונות מהתמונות הכלליות צריך עוד נתון שזה אחוזי החסימות מתוך כלל התמונות הנבדקות ואז אפשר להשתמש בחוק בייס לקבל את אחוזי החסימות הלא נכונות
https://forum.netfree.link/post/132032
תקרא שוב לאט את מה שכתבתי. אם עדיין אתה לא מסכים אין לי איך לעזור.הסבר נוסף: המספר 54% הוא מספר חסימות היתר שנמצאו במדגם. ניתן בהחלט להשליך ממדגם זה לכלל החסימות של נטפרי.
חוק בייס לא רלוונטי לעניינינו בכלל. (תקרא היטב את הערך שקישרת. יש שם אפילו דוגמה טובה)שמח מאד לעזור.
-
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
לעצם עניין התחום האפור. לא הובן פה ההסבר בעניין.
אם יש לנו תמונה שהיא בתחום אפור זה אומר שבין אם יפתחו אותה ובין אם יסגרו אותה זה לא יחשב טעות. ולכן גם אם המכלול החליטו שיש חצי שגויים זה אומר שהם בחצי מהמקרים הכריעו אחרת בתחום האפור ולא שהיה פה טעות. -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק! -
פוסט זה נמחק!