محركات البحث

تعتبر بيانات المستخدم مهمة في أنظمة التصنيف الخاصة بجوجل. ما تعلمناه من إعلان استئناف ليز ريد

لقد وجدت بعض الأشياء المثيرة للاهتمام في أحدث وثيقة في تجربة وزارة العدل ضد Google. استأنفت شركة جوجل الحكم الذي ينص على أنها بحاجة إلى إعطاء معلومات الملكية للمنافسين.

حقوق الصورة: ماري هاينز

الوجبات السريعة الرئيسية:

  • وقد أُمرت شركة Google بإعطاء المعلومات للمنافسين حتى لا تكون احتكارًا غير قانوني. لا ترغب Google في الكشف عن بياناتها الشاملة من جانب المستخدم.
  • تعد بيانات Google المتعلقة بجودة الصفحة ونضارتها ملكية خاصة. إنهم لا يريدون التخلي عنها.
  • يتم ترميز الصفحات التي تم فهرستها بالتعليقات التوضيحية، بما في ذلك الإشارات التي تحدد الصفحات غير المرغوب فيها.
  • إذا حصل مرسلي البريد العشوائي على إشارات البريد العشوائي هذه، فسيجعل ذلك إيقاف البريد العشوائي أمرًا صعبًا.
  • تعد بيانات المستخدم مهمة لنظام Google Glue يقوم بتخزين المعلومات حول كل استعلام تم البحث عنه، وما شاهده المستخدم، وكيفية تفاعله مع نتائج البحث.
  • بيانات المستخدم مهمة لتدريب RankEmbed BERT – أحد أنظمة التعلم العميق وراء البحث.

حسنًا، دعنا ندخل في الأشياء المثيرة للاهتمام!

تمتلك Google إشارات خاصة بجودة الصفحة ونضارتها

هذه ليست مفاجأة حقا. لقد وجدت أنه من المثير للاهتمام أن إشارات الحداثة تقع في قلب أسرار ملكية Google.

حقوق الصورة: ماري هاينز

مرة أخرى، إليك المزيد حول أهمية إشارات الحداثة الخاصة بشركة Google:

حقوق الصورة: ماري هاينز

يتم تمييز الصفحات التي يتم الزحف إليها باستخدام “الصفحة الخاصة التي تفهم التعليقات التوضيحية”

يتم تمييز كل صفحة في فهرس Google بتعليقات توضيحية لمساعدته في فهم الصفحة. يتضمن ذلك إشارات لتحديد الرسائل غير المرغوب فيها والصفحات المكررة. لقد كتبت من قبل عن كيفية تحتوي كل صفحة في الفهرس على نقاط غير مرغوب فيها.

حقوق الصورة: ماري هاينز

يمكن استخدام نتائج البريد العشوائي لعكس أنظمة تصنيف المهندسين

لا ترغب Google في مشاركة المعلومات مع منافسيها بشأن هذه النتائج.

حقوق الصورة: ماري هاينز

إذا تم نشر نتائج الرسائل غير المرغوب فيها، فقد يؤدي ذلك إلى المزيد من الرسائل غير المرغوب فيها وزيادة الصعوبة التي يواجهها Google في مكافحة البريد العشوائي.

حقوق الصورة: ماري هاينز

تقوم Google ببناء الفهرس باستخدام هذه الصفحات المرمزة

يتم تنظيم الصفحات التي أضافت Google تعليقات توضيحية لفهم الصفحة بناءً على عدد المرات التي يتوقع فيها Google الوصول إلى المحتوى ومدى حداثة المحتوى.

حقوق الصورة: ماري هاينز

جزء صغير فقط من الصفحات يصل إلى فهرس Google

تزعم جوجل أن إعطاء المنافسين قائمة بعناوين URL المفهرسة سيمكنهم من “التخلي عن الزحف إلى شبكة الويب الأكبر وتحليلها، وتركيز جهودهم بدلاً من ذلك على الزحف فقط إلى جزء من الصفحات التي أدرجتها جوجل في فهرسها”. إن إنشاء هذا الفهرس يكلف Google الكثير من الوقت والمال. إنهم لا يريدون التخلي عن ذلك مجانًا.

حقوق الصورة: ماري هاينز

دور بيانات المستخدم في أنظمة التصنيف في جوجل

هذا هو الجزء الأكثر إثارة للاهتمام. أشعر أننا لا نولي اهتمامًا كافيًا لاستخدام Google لبيانات المستخدم. ( تابعوني على الخاص قناة يوتيوب لأنني قريبًا على وشك إصدار مقطع فيديو مثير للاهتمام يتضمن أفكاري حول مدى أهمية البيانات من جانب المستخدم – وهو على الأرجح العامل الأكثر أهمية في أنظمة التصنيف في Google.)

يتم استخدام بيانات المستخدم لبناء نماذج GLUE وRankEmbed

يعد Google Glue جدولًا ضخمًا لنشاط المستخدم. فهو يجمع نص الاستعلامات التي تم البحث عنها، ولغة المستخدم، والموقع، ونوع الجهاز، ومعلومات حول ما ظهر في SERP، وما نقر عليه المستخدم أو مرر فوقه، ومدة بقائه في SERP، والمزيد.

يعتبر RankEmbed BERT أكثر إثارة للاهتمام. يعد RankEmbed BERT أحد أنظمة التعلم العميق التي يدعمها البحث. في باندو ناياك ومن خلال شهادتنا، علمنا أن RankEmbed BERT يُستخدم في إعادة ترتيب النتائج التي تُرجعها أنظمة التصنيف التقليدية. يتم تدريب RankEmbed BERT على بيانات النقر والاستعلام من المستخدمين الفعليين.

تتعلم أنظمة الذكاء الاصطناعي التي تقف وراء البحث باستمرار كيفية تحسين تقديم نتائج مرضية للباحثين. تنظر Google إلى ما ينقرون عليه وما إذا كانوا يعودون إلى SERPs أم لا. تجري Google أيضًا تجارب مباشرة تبحث في ما يختار الباحثون النقر عليه والبقاء فيه. تساعد هذه الإجراءات في تدريب RankEmbed BERT. ويتم ضبطه بشكل أكبر من خلال تقييمات من مقيمي الجودة. وسأقوم بنشر المزيد عن هذا قريبا. النقطة الأساسية التي أريد التركيز عليها هي أن رضا المستخدم هو إلى حد بعيد أهم شيء يجب أن نعمل على تحسينه!

من مستند Liz Reid الذي نقوم بتحليله اليوم، يمكننا أن نرى أن بيانات المستخدم تُستخدم لتدريب نماذج RankEmbed وإنشائها وتشغيلها.

حقوق الصورة: ماري هاينز

مرة أخرى، نتعلم أن بيانات المستخدم المستخدمة لتدريب هذه النماذج تشمل الاستعلام والموقع ووقت البحث وكيفية تفاعل المستخدم مع ما تم عرضه لهم.

حقوق الصورة: ماري هاينز

يتحدث هذا عن الإجراءات التي يتخذها المستخدمون من داخل نتائج بحث Google. ما أريد معرفته حقًا هو مقدار الدور الذي تستخدمه بيانات Chrome. هل يراقب Google ما إذا كان الأشخاص يتفاعلون مع صفحاتك، ويملؤون النماذج الخاصة بك، ويعدون وصفاتك، والمزيد؟ أعتقد أنهم يفعلون. ال خلاصة الحكم في هذه المحاكمة تشير إلى أنه يتم استخدام بيانات Chrome في أنظمة التصنيف، ولكن لا تتم مشاركة الكثير من التفاصيل.

حقوق الصورة: ماري هاينز

تقول Google إنه إذا كان لدى شخص ما بيانات المستخدم Glue وRankEmbed، فيمكنه تدريب ماجستير في القانون باستخدامها

بيانات المستخدم هذه هي مفتاح نجاح Google.

حقوق الصورة: ماري هاينز

ومن المفيد قراءة كاملة إعلان من ليز ريد.

المزيد من الموارد:


تم نشر هذه المقالة في الأصل على موقع ماري هاينز للاستشارات.


صورة مميزة: N Universe / Shutterstock


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى