סינון חיפוש גוגל
-
@נטפריס
אני אוהב פיתוחים מעניינים...
אפשר לעשות בדיקה את אחוזי ההתאמה לשאילתה.
אם לדוגמה מישהו מחפש יד 2 בגוגל, הוא עושה זאת כדי להגיע לאתר של יד 2, כנראה אין לו מושג שאפשר להקליד את הכתובת, או שהוא לא יודע את הכתובת. (מישהו פה זוכר את הכתובת של האתר תרי זוזי למשל? zuze או משה כזה...) זה שגוגל נותנים 1300000 תוצאות זה ענין שלהם.. אבל כמישהו מחפש 'שמעו עמים ירגזון' אז הוא מחפש פסוק ולא אתר.
הדינים העולים: כשמישהו מחפש מששהו שההתאמה היא קרוב לודאי (95%) באתר שחסום ואפשר לזהות את זה על פי זה שחיפוש גוגל נותן תוצאות רבות לאתר זה, כמו כשמחפשים את נטפרי משתנה הצורה של הדף בחיפוש הראשון, שיש תת תוצאות, אז אם הוא מחפש משהו חסום צריך לתת לו את זה.
אפשר מכאן והלאה לשכלל את זה, ללמוד את תוצאות החיפוש בגוגל, ולהבין מה הם חושבים שהכי מתאים, ו.. אופס! פה צריך עוד פיתוח, רשימה של אתרים שלעולם לא ייפתחו, ואתרים שלא ידועים או נחסמו ויכולים להיות בהם קישורים מתאימים. כשגוגל חושבים שאתר מסוים, על אף שהוא חסום, מתאים לתוצאות החיפוש כדאי להביא אותו ברשימה. -
@5566NEWbrs
ניתוח יפה, אך לא נראה לי נכון לגמרי, שהרי יתכן שזה שחיפש את יד2 מכיר היטב את הכתובת של יד2, אלא שהוא רצה לקבל אינפורמציה מכל מיני פורומים וכדו' מה אנשים חושבים על יד2 (הדוגמא הזאת מתאימה יותר לגבי מישהו שמחפש את 'נטפרי' למשל).ו...אופס! איך בדיוק תגיע לרשימה של אתרים שלעולם לא ייפתחו, הרי עד עכשיו הרשימה הזאת נבנתה רק לפי בקשות של אנשים, או לפי תוכן שאינו ראוי, ואז שוב לא פתרנו את הבעיה.
-
@administrators
חשבתי על רעיון!
להגדיר שכל התוצאות שכבר נבדקו ונחסמו, לא יופיעו כלל כמו שהיה עד עכשיו.
מאידך, התוצאות שעדיין לא נבדקו אלא שנחסמו עקב תוכן לא ראוי שהרובוט זיהה שם, לא יופיעו במלואם, אלא רק כתובת האתר בלבד (ללא שם האתר ושאר הפרטים) כך שעדיין יהא ניתן לשלוח את האתר לבדיקה.
אני לא מבין בתכנות, ואני לא יודע אם זה בר ביצוע, אך להציע לא עולה כסף....אגב, אם זה אכן רעיון יעיל, אפשר גם להוסיף להגדרות הנוספות בהגדרות הסינון אפשרות להגדיר האם תוצאות לא ידועות עם תוכן לא ראוי יוצגו או לא (כמו שיש היום על כל התוצאות הלא ידועות).
-
@chocolate אמר בסינון חיפוש גוגל:
שמחתי מאוד כשהתחילו לסנן את התוצאות מכיון שגוגל הוא אתר בעייתי בדיוק כמו כל אתר אחר (אם לא יותר) ולדעתי היה אחד מהיתרונות הבולטים שהיו (ועדיין קיים בשאר חברות) , אבל מה שקורה הוא אתר שנחסם משום שיש בו תוכן גם לא ראוי, לא מופיע בתוצאות החיפוש, אף אילו היתיי שולח את הקישור הספציפי לבדיקה היו פותחים אותו (קחו לדוגמא www.reddit.com או www.internetdict.com) האם יש איזה פתרון ?
בתקופה הזו שיוצאות לכולם הקרניים מהחופש, חשבתי
לרגע שכתוב בכותרת "סינון החופש הגדול"... -
@ליכט אמר בסינון חיפוש גוגל:
@administrators
חשבתי על רעיון!
להגדיר שכל התוצאות שכבר נבדקו ונחסמו, לא יופיעו כלל כמו שהיה עד עכשיו.
מאידך, התוצאות שעדיין לא נבדקו אלא שנחסמו עקב תוכן לא ראוי שהרובוט זיהה שם, לא יופיעו במלואם, אלא רק כתובת האתר בלבד (ללא שם האתר ושאר הפרטים) כך שעדיין יהא ניתן לשלוח את האתר לבדיקה.
אני לא מבין בתכנות, ואני לא יודע אם זה בר ביצוע, אך להציע לא עולה כסף....אגב, אם זה אכן רעיון יעיל, אפשר גם להוסיף להגדרות הנוספות בהגדרות הסינון אפשרות להגדיר האם תוצאות לא ידועות עם תוכן לא ראוי יוצגו או לא (כמו שיש היום על כל התוצאות הלא ידועות).
מה ה @administrators אומרים על זה ?
-
פוסט זה נמחק! -
@ליכט אמר בסינון חיפוש גוגל:
@ליכט אמר בסינון חיפוש גוגל:
@administrators
חשבתי על רעיון!
להגדיר שכל התוצאות שכבר נבדקו ונחסמו, לא יופיעו כלל כמו שהיה עד עכשיו.
מאידך, התוצאות שעדיין לא נבדקו אלא שנחסמו עקב תוכן לא ראוי שהרובוט זיהה שם, לא יופיעו במלואם, אלא רק כתובת האתר בלבד (ללא שם האתר ושאר הפרטים) כך שעדיין יהא ניתן לשלוח את האתר לבדיקה.
אני לא מבין בתכנות, ואני לא יודע אם זה בר ביצוע, אך להציע לא עולה כסף....אגב, אם זה אכן רעיון יעיל, אפשר גם להוסיף להגדרות הנוספות בהגדרות הסינון אפשרות להגדיר האם תוצאות לא ידועות עם תוכן לא ראוי יוצגו או לא (כמו שיש היום על כל התוצאות הלא ידועות).
מה ה @administrators אומרים על זה ?
חשבתי אולי אפשר להגדיר שרק אתר בעייתי לגמרי לא יופיע תוצאות אבל בכל שאר האתרים שיש דברים טובים וגם לא טובים רק יופיע התוצאות באם הרובוט לא מצא משהו לא טוב בהתוצאה
-
במילים אחרות הרעיון הוא לחלק כל האתרים בשלוש קבוצות,
-
קבוצה ראשונה = אתרים כשרים למהדרין - תמיד יופיעו בתוצאות החיפוש
-
קבוצה שנייה = אתרים שמעורב בהם טוב ורע או אתרים שעדיין לא נבדקו - יופיעו בתוצאות חיפוש גוגל בנוסף לסינון רובוט בשונה ממה שקיים עכשיו באתרים שלא נבדקו, דהיינו שאם יש משהו לא טוב בהתוצאה התוצאה לא יופיע בכלל (כמו אתרים לא טובים דהיינו x-x-x-x-x) ולא רק XXXXXXXXXXX XXXXXXXXXX XXXXX XXXXXXXXXXXXXXXXXXX XXXXXXX
-
קבוצה שלישית = אתרים לא טובים - לא יופיעו בכלל בחיפוש כמו שקיים עכשיו
-
-
@chocolate
הרובוט הוא לא כזה תלמיד חכם .
אי אפשר לסמוך עליו ,
סומכים עליו רק אחרי שעברו על התכנים מלמעלה
-
@957 אמר בסינון חיפוש גוגל:
@chocolate
הרובוט הוא לא כזה תלמיד חכם .
אי אפשר לסמוך עליו ,
סומכים עליו רק אחרי שעברו על התכנים מלמעלה
אין מה לסמוך פשוט במקום מה שקורה עכשיו XXXXXXXX XXXXXX XXXXXXXXXXX X X XXXXXXXXXXXXXXX וכו' זה לא יופיע
-
@chocolate נדמה לי שההצעה שלך היא הדרך שבה זה עובד כרגע.
ה-XXXXXXXXXXXXX הם כנראה האתרים הסגורים והבעיתיים, שהוסרו ע"י נטפרי מהדף.
לא נראה לי שאפשר להוריד גם א"ז. אי אפשר להכריח את גוגל לתת את הדף נקי, רק מסננים את מה שמקבלים מהם. -
@dLive לא חושב מכיון שלא רואים תוצאות משלל אתרים שאפילו שהאתר סגור היו פותחים לינק ספציפי
-
@chocolate
חילקת ל-3 קטגוריות:- אתרים כשרים - חיפוש פתוח.
- אתרים מעורבים ושלא נבדקו - מסונן.
- אתרים שנבדקו ונפסלו - לא מופיעים.
אולי באתרים כשרים אכן יש חיפוש, זה הדבר היחיד שמצאתי שונה בין מה שכתבת לבין המציאות.
נ.ב. למה אתה מתכוון "אתרים מעורבים"? הכוונה לאתרים שהוגדרו כדורשים סינון מלל ותמונות? -
@dLive אמר בסינון חיפוש גוגל:
נ.ב. למה אתה מתכוון "אתרים מעורבים"? הכוונה לאתרים שהוגדרו כדורשים סינון מלל ותמונות?
לא אתרים מעורבים היינו אתרים שנסגרו מחמת שמצאו בו תוכן לא ראויה אבל עדיין חלק גדול מהאתר טוב ואם אני אשלח לינק של דף ספציפי הם יפתחו את זה (עיין בפוסט ראשון ותבין ) ועכשיו המצב הוא שהתוצאה לא מופיע לי ממילא אני לא יכול לשלוח שיפתחו לי