تعتبر بيانات المستخدم مهمة في أنظمة التصنيف الخاصة بجوجل. ما تعلمناه من إعلان استئناف ليز ريد

لقد وجدت بعض الأشياء المثيرة للاهتمام في أحدث وثيقة في تجربة وزارة العدل ضد Google. استأنفت شركة جوجل الحكم الذي ينص على أنها بحاجة إلى إعطاء معلومات الملكية للمنافسين.
الوجبات السريعة الرئيسية:
- وقد أُمرت شركة Google بإعطاء المعلومات للمنافسين حتى لا تكون احتكارًا غير قانوني. لا ترغب Google في الكشف عن بياناتها الشاملة من جانب المستخدم.
- تعد بيانات Google المتعلقة بجودة الصفحة ونضارتها ملكية خاصة. إنهم لا يريدون التخلي عنها.
- يتم ترميز الصفحات التي تم فهرستها بالتعليقات التوضيحية، بما في ذلك الإشارات التي تحدد الصفحات غير المرغوب فيها.
- إذا حصل مرسلي البريد العشوائي على إشارات البريد العشوائي هذه، فسيجعل ذلك إيقاف البريد العشوائي أمرًا صعبًا.
- تعد بيانات المستخدم مهمة لنظام Google Glue يقوم بتخزين المعلومات حول كل استعلام تم البحث عنه، وما شاهده المستخدم، وكيفية تفاعله مع نتائج البحث.
- بيانات المستخدم مهمة لتدريب RankEmbed BERT – أحد أنظمة التعلم العميق وراء البحث.
حسنًا، دعنا ندخل في الأشياء المثيرة للاهتمام!
تمتلك Google إشارات خاصة بجودة الصفحة ونضارتها
هذه ليست مفاجأة حقا. لقد وجدت أنه من المثير للاهتمام أن إشارات الحداثة تقع في قلب أسرار ملكية Google.

مرة أخرى، إليك المزيد حول أهمية إشارات الحداثة الخاصة بشركة Google:

يتم تمييز الصفحات التي يتم الزحف إليها باستخدام “الصفحة الخاصة التي تفهم التعليقات التوضيحية”
يتم تمييز كل صفحة في فهرس Google بتعليقات توضيحية لمساعدته في فهم الصفحة. يتضمن ذلك إشارات لتحديد الرسائل غير المرغوب فيها والصفحات المكررة. لقد كتبت من قبل عن كيفية تحتوي كل صفحة في الفهرس على نقاط غير مرغوب فيها.

يمكن استخدام نتائج البريد العشوائي لعكس أنظمة تصنيف المهندسين
لا ترغب Google في مشاركة المعلومات مع منافسيها بشأن هذه النتائج.

إذا تم نشر نتائج الرسائل غير المرغوب فيها، فقد يؤدي ذلك إلى المزيد من الرسائل غير المرغوب فيها وزيادة الصعوبة التي يواجهها Google في مكافحة البريد العشوائي.

تقوم Google ببناء الفهرس باستخدام هذه الصفحات المرمزة
يتم تنظيم الصفحات التي أضافت Google تعليقات توضيحية لفهم الصفحة بناءً على عدد المرات التي يتوقع فيها Google الوصول إلى المحتوى ومدى حداثة المحتوى.

جزء صغير فقط من الصفحات يصل إلى فهرس Google
تزعم جوجل أن إعطاء المنافسين قائمة بعناوين URL المفهرسة سيمكنهم من “التخلي عن الزحف إلى شبكة الويب الأكبر وتحليلها، وتركيز جهودهم بدلاً من ذلك على الزحف فقط إلى جزء من الصفحات التي أدرجتها جوجل في فهرسها”. إن إنشاء هذا الفهرس يكلف Google الكثير من الوقت والمال. إنهم لا يريدون التخلي عن ذلك مجانًا.

دور بيانات المستخدم في أنظمة التصنيف في جوجل
هذا هو الجزء الأكثر إثارة للاهتمام. أشعر أننا لا نولي اهتمامًا كافيًا لاستخدام Google لبيانات المستخدم. ( تابعوني على الخاص قناة يوتيوب لأنني قريبًا على وشك إصدار مقطع فيديو مثير للاهتمام يتضمن أفكاري حول مدى أهمية البيانات من جانب المستخدم – وهو على الأرجح العامل الأكثر أهمية في أنظمة التصنيف في Google.)
يتم استخدام بيانات المستخدم لبناء نماذج GLUE وRankEmbed
يعد Google Glue جدولًا ضخمًا لنشاط المستخدم. فهو يجمع نص الاستعلامات التي تم البحث عنها، ولغة المستخدم، والموقع، ونوع الجهاز، ومعلومات حول ما ظهر في SERP، وما نقر عليه المستخدم أو مرر فوقه، ومدة بقائه في SERP، والمزيد.
يعتبر RankEmbed BERT أكثر إثارة للاهتمام. يعد RankEmbed BERT أحد أنظمة التعلم العميق التي يدعمها البحث. في باندو ناياك ومن خلال شهادتنا، علمنا أن RankEmbed BERT يُستخدم في إعادة ترتيب النتائج التي تُرجعها أنظمة التصنيف التقليدية. يتم تدريب RankEmbed BERT على بيانات النقر والاستعلام من المستخدمين الفعليين.
تتعلم أنظمة الذكاء الاصطناعي التي تقف وراء البحث باستمرار كيفية تحسين تقديم نتائج مرضية للباحثين. تنظر Google إلى ما ينقرون عليه وما إذا كانوا يعودون إلى SERPs أم لا. تجري Google أيضًا تجارب مباشرة تبحث في ما يختار الباحثون النقر عليه والبقاء فيه. تساعد هذه الإجراءات في تدريب RankEmbed BERT. ويتم ضبطه بشكل أكبر من خلال تقييمات من مقيمي الجودة. وسأقوم بنشر المزيد عن هذا قريبا. النقطة الأساسية التي أريد التركيز عليها هي أن رضا المستخدم هو إلى حد بعيد أهم شيء يجب أن نعمل على تحسينه!
من مستند Liz Reid الذي نقوم بتحليله اليوم، يمكننا أن نرى أن بيانات المستخدم تُستخدم لتدريب نماذج RankEmbed وإنشائها وتشغيلها.

مرة أخرى، نتعلم أن بيانات المستخدم المستخدمة لتدريب هذه النماذج تشمل الاستعلام والموقع ووقت البحث وكيفية تفاعل المستخدم مع ما تم عرضه لهم.

يتحدث هذا عن الإجراءات التي يتخذها المستخدمون من داخل نتائج بحث Google. ما أريد معرفته حقًا هو مقدار الدور الذي تستخدمه بيانات Chrome. هل يراقب Google ما إذا كان الأشخاص يتفاعلون مع صفحاتك، ويملؤون النماذج الخاصة بك، ويعدون وصفاتك، والمزيد؟ أعتقد أنهم يفعلون. ال خلاصة الحكم في هذه المحاكمة تشير إلى أنه يتم استخدام بيانات Chrome في أنظمة التصنيف، ولكن لا تتم مشاركة الكثير من التفاصيل.

تقول Google إنه إذا كان لدى شخص ما بيانات المستخدم Glue وRankEmbed، فيمكنه تدريب ماجستير في القانون باستخدامها
بيانات المستخدم هذه هي مفتاح نجاح Google.

ومن المفيد قراءة كاملة إعلان من ليز ريد.
المزيد من الموارد:
تم نشر هذه المقالة في الأصل على موقع ماري هاينز للاستشارات.
صورة مميزة: N Universe / Shutterstock
Source link



