تشرح Google سبب تجاهل الزاحف الخاص بها لتلميحات الموارد الخاصة بك

استخدم غاري إليس ومارتن سبليت من Google إحدى حلقات البودكاست Search Off the Record للتعرف على كيفية تعامل زاحف Google مع HTML. كشفت المحادثة عن اختلافات بين كيفية معالجة المتصفحات وGooglebot لنفس الصفحة.
غطت المناقشة تلميحات الموارد، ووضع بيانات التعريف، والتحقق من صحة HTML. تتحدى العديد من تفسيرات إلييس الافتراضات المتعلقة بالتغييرات التقنية التي تساعد في البحث.
لماذا لا تساعد تلميحات الموارد Googlebot
ميزات أداء المتصفح مثل dns-prefetch, preload, prefetchو preconnect حل مشكلات زمن الاستجابة التي لا توجد في البنية الأساسية لـ Google.
قال إليس إن حل DNS الخاص بـ Google لا يحتاج إلى المساعدة التي تحاول معظم المواقع تقديمها.
قال:
“من المفيد جدًا إجراء الجلب المسبق لنظام أسماء النطاقات (DNS) على سبيل المثال، إذا كان لديك إنترنت رديء. وفي حالتنا، لا نحتاج إلى ذلك لأنه يمكننا التحدث بسرعة كبيرة مع جميع خوادم DNS المتتالية.”
وأضاف أن Google يقوم بتخزين موارد الصفحة مؤقتًا بشكل منفصل ولا يجلبها في الوقت الفعلي كما يفعل المتصفح. وقال إليس إن جوجل تفعل ذلك لتقليل النطاق الترددي وتحميل الخادم على المواقع التي تزحف إليها.
قال إليس:
“نفس الشيء مع التحميل المسبق. إذا لم نكن متزامنين، فلن نحتاج بشكل خاص إلى الاستماع والنظر إلى التحميل المسبق.”
تستخدم Google واجهة برمجة التطبيقات لقواعد المضاربة لتسريع نقرات نتائج البحث لمستخدمي Chrome. يعمل هذا النظام لأنه يعمل على مستوى المتصفح، حيث يكون زمن الوصول بين المستخدم والخادم مهمًا. يعمل Googlebot من داخل البنية التحتية الخاصة بشركة Google، حيث لا توجد تلك الاختناقات.
كان كل من Illyes وSplitt واضحين في أن هذه التلميحات لا تزال تساعد المستخدمين. يؤدي التحميل السريع للصفحات إلى تحسين معدل الاحتفاظ بالصفحات والتحويل. والفرق هو أن هذه التغييرات تؤثر على تجربة المتصفح، وليس الزحف أو الفهرسة.
البيانات الوصفية تنتمي إلى الرأس
شارك Splitt حالة حيث قامت علامة نصية متوافقة مع المواصفات في الرأس بإدخال إطار iframe، مما أدى إلى سلوك إغلاق المتصفح. أدى ذلك إلى دفع علامات رابط hreflang إلى النص، حيث قال سبليت إن أنظمة Google تجاهلتها بشكل صحيح.
وأوضح إليس سبب صرامة Google في هذا الشأن. أ meta name="robots" العلامة، وفقًا لمعايير HTML المعيشية، يمكن أن تظهر فقط في الرأس. الأمر نفسه ينطبق على rel=canonical عناصر الارتباط.
قال:
“أود أن أزعم أنه من الخطر جدًا وجود عناصر ربط تحمل بيانات وصفية في الجسم.”
ومنطقه هو أنه إذا قبلت Google العلامات الأساسية في النص، فسيكون من الممكن الاستيلاء على الصفحة الأساسية وإزالتها من نتائج البحث عن طريق حقن العلامات.
عرض Illyes سابقًا إرشادات حول تحليل HTML وتنفيذ rel-canonical، ونصح بتوضيح مسار عنوان URL الكامل في العلامات الأساسية لتجنب غموض المحلل اللغوي. هذه هي نفس الفكرة، فالوضع الواضح في الرأس يزيل التخمين.
صلاحية HTML لا تساوي ميزة التصنيف
لقد كان Illyes مباشرًا بشأن سبب عدم اعتبار لغة HTML الصالحة إشارة تصنيف. الصلاحية كثنائية، مما يعني أنها إما صالحة أو لا يوجد مكان بينهما. قال إليس إنه من الصعب القيام بأي شيء ذي معنى باستخدام مقياس النجاح/الفشل.
“من الصعب جدًا القول بأن شيئًا ما يقترب من الصحة. وبعد ذلك، ماذا تفعل هناك عندما يكون هناك شيء قريب من الصحة”.
لقد أعطى مثالاً على أن علامة الإغلاق المفقودة تجعل HTML للصفحة غير صالح من الناحية الفنية، ولكن كما قال إليس، “لن يغير ذلك أي شيء بالنسبة للمستخدم”.
وافق سبليت على ذلك، مشيرًا إلى أن العلامات الدلالية مثل التسلسل الهرمي للعناوين المناسبة والعناصر الهيكلية لـ HTML5 لا تحمل وزنًا ذا معنى لمحركات البحث أيضًا، على الرغم من أنها مفيدة لإمكانية الوصول وتجربة المستخدم.
لماذا هذا مهم؟
قد تشير عمليات التدقيق الفنية إلى فرص تلميحات الموارد وأخطاء التحقق من صحة HTML. إن معرفة أي منها يؤثر على زاحف Google وأيها يؤثر على المتصفحات يمكن أن يساعدك في تحديد أولويات ما يجب إصلاحه.
عندما لا تعمل علامات hreflang أو الروابط الأساسية أو توجيهات برامج الروبوت الوصفية كما هو متوقع، فإن أول مكان يجب التحقق منه هو ما إذا كانت ستنتهي في النص الأساسي بعد أن يقوم المتصفح بتحليل الصفحة. يمكن أن تنتهي العلامة التي تبدو صحيحة في مصدر HTML الخاص بك في موقع خاطئ إذا أدى البرنامج النصي أو إطار iframe إلى إغلاق الرأس مبكرًا.
قام روجر مونتي بتغطية إرشادات التخزين المؤقت للزاحف المحدثة من Google، والتي توصي برؤوس ETag لتقليل الزحف غير الضروري. يتوافق هذا التوجيه مع ما وصفه إليس في هذه الحلقة.
التطلع إلى الأمام
ذكر سبليت أن تلميحات العميل كانت الموضوع الأصلي الذي أراد تغطيته، وأن مناقشة تحليل HTML كانت أساسًا لحلقة مستقبلية. إذا حدثت هذه الحلقة، فقد تغطي كيفية تعامل Googlebot مع الإصدار الأحدث Accept-CH و Sec-CH-UA الرؤوس التي تحل محل سلاسل وكيل المستخدم التقليدية.
المحادثة الكاملة متاحة على YouTube وApple Podcasts.
Source link



