מחקר סמראש חושף: איפה מודלי שפה גדולים מוצאים מידע ואיך הצפת המשווקים פוגעת באיכות

מומחים מציינים כי יכולת החיזוי של מודלי השפה עוררה את הופעתה של מגמה שיווקית חדשה

אנליסטים של Semrush זיהו את עשרת משאבי האינטרנט הפופולריים ביותר שעליהם מסתמכים מודלי שפה גדולים (LLMs) בעת יצירת תשובות. עם זאת, רמת האמון הגבוהה של האלגוריתמים באתרים אלו יצרה בעיה חדשה: הפלטפורמות מוצפות באופן מסיבי בתוכן מלאכותי, דבר שפוגע ישירות באיכות התוצרים של הרשתות העצביות.

על פי נתונים עדכניים, בחירת מקורות המידע של הבינה המלאכותית אינה מקרית או שרירותית; היא מפולחת בקפידה. שלוש פלטפורמות מרכזיות הפכו למובילות הבלתי מעורערות באזכורים של LLMs. האתר Wikipedia משמש באופן מסורתי את האלגוריתמים כפלטפורמת בסיס לשליפת עובדות יבשות ומקורות אנציקלופדיים. Reddit הוכח כבלתי תחליפי לניתוח דיונים אנושיים אותנטיים ודעות לא רשמיות, בעוד ש- LinkedIn משמש כספק העיקרי של תוכן מומחים שאליו פונים המודלים בעת יצירת תשובות במגזר ה-B2B.

בנוסף לשלישייה הפותחת, עשרת הדומיינים המוזכרים ביותר כוללים גם את אתר שיתוף הווידאו YouTube, פלטפורמת הבלוגים Medium, המגזין Forbes, וכן המשאבים הרשמיים של Google ו-Microsoft.

 

הצד האפל של הפופולריות

מומחים מציינים כי יכולת החיזוי של מודלי השפה עוררה את הופעתה של מגמה שיווקית חדשה – GEO (אופטימיזציה למנועי יצירה – Generative Engine Optimization).

מתוך הבנה מדויקת על אילו פלטפורמות הבינה המלאכותית מסתמכת בראש ובראשונה, מומחי SEO ומותגים החלו לפרסם במכוון מאות טקסטים שנוצרו על ידי הבינה המלאכותית עצמה במשאבים אלו. המטרה העיקרית של פעולות אלו היא לאלץ את מודל השפה “לבלוע” את החומר הפרסומי הרצוי ולהתחיל לאזכר את המוצר המקודם בתשובותיו למשתמשים אמיתיים.

למרות היעילות המסחרית הגבוהה של שיטה זו, המומחים מתריעים על הסכנה. נוצר מעגל קסמים: דורות חדשים של רשתות עצביות מסתמכים יותר ויותר על “ספאם” שיווקי שנוצר קודם לכן על ידי אלגוריתמים אחרים. מכיוון שהמודלים מאומנים על הטקסטים המלאכותיים הללו, העומק, האובייקטיביות והאיכות הכוללת של תשובות ה-LLM מתחילים לרדת במהירות.

חדשות בינה מלאכותית: עדכונים נוספים מהעולם