@צדיק-תמים אמר באני לא רובוט- שמופיע בכל חיפוש גוגל:
@chv דווקא כן יש שיפור, כי במקום מודלי קלאסיפיקציה שאין לך איך לדבג ולשפר את האיכות, יש מודלי LLM עם יכולת לעבד תמונות ולהבין כללים לפתיחה/סגירה, ואפשר לדייק את הפרומפט למקרי קצה גם בלי שיש אינסוף דוגמאות איכותיות לאימון
אני עשיתי לאחרונה POC קטן והתוצאות היו פנטסטיות
אני בדקתי את GroundingDINO ואת blip2-opt והתרשמתי שיש להם הרבה פספוסים בנושא זיהוי מגדר, בפרט אם הפוקוס לא ממוקד על האובייקט
(והייתם נקיים, נבדק על תמונות משפחתיות...)