إعلانات Google تستخدم نموذج الذكاء الاصطناعي الجديد للقبض على المعلنين المحتالين

نشرت Google ورقة بحثية حول نموذج الذكاء الاصطناعي الجديد لاكتشاف الاحتيال في نظام إعلانات Google، وهو ما يمثل تحسينًا قويًا عما كانوا يستخدمونه سابقًا. المثير للاهتمام هو أن الورقة البحثية، المؤرخة في 31 ديسمبر 2025، تقول إنه تم نشر الذكاء الاصطناعي الجديد، مما أدى إلى تحسن في معدل الاكتشاف بأكثر من 40 نقطة مئوية وتحقيق دقة بنسبة 99.8% في سياسات محددة.
ALF: نموذج الأساس الكبير للمعلن
يُطلق على الذكاء الاصطناعي الجديد اسم ALF (نموذج الأساس الكبير للمعلن)، وتم نشر تفاصيله في 31 ديسمبر 2025. ALF هو نموذج أساس كبير متعدد الوسائط يقوم بتحليل النص والصور والفيديو، إلى جانب عوامل مثل عمر الحساب وتفاصيل الفواتير ومقاييس الأداء التاريخية.
يوضح الباحثون أن العديد من هذه العوامل بمعزل عن بعضها البعض لن تشير إلى حساب ما باعتباره مشكلة محتملة، ولكن مقارنة كل هذه العوامل معًا توفر فهمًا أفضل لسلوك المعلن ونواياه.
يكتبون:
“إن التحدي الأساسي في هذا النظام البيئي هو فهم نوايا المعلنين وسلوكهم بدقة وكفاءة. ويعد هذا الفهم أمرًا بالغ الأهمية للعديد من التطبيقات الرئيسية، بما في ذلك مطابقة المستخدمين بالإعلانات وتحديد الاحتيال وانتهاكات السياسة.
يتطلب التصدي لهذا التحدي اتباع نهج شامل، ومعالجة أنواع مختلفة من البيانات بما في ذلك معلومات الحساب المنظمة (على سبيل المثال، عمر الحساب، وتفاصيل الفواتير)، وأصول تصميمات الإعلانات متعددة الوسائط (النصوص والصور ومقاطع الفيديو)، ومحتوى الصفحة المقصودة.
على سبيل المثال، قد يكون لدى أحد المعلنين حساب تم إنشاؤه مؤخرًا، ولديه إعلانات نصية ومصورة لعلامة تجارية كبيرة ومعروفة، وتم رفض دفعة من بطاقة الائتمان مرة واحدة. وعلى الرغم من أن كل عنصر يمكن أن يوجد ببراءة في عزلة، إلا أن هذا المزيج يشير بقوة إلى وجود عملية احتيالية.
ويتناول الباحثون ثلاثة تحديات لم تتمكن الأنظمة السابقة من التغلب عليها:
1. البيانات غير المتجانسة وعالية الأبعاد
تشير البيانات غير المتجانسة إلى حقيقة أن بيانات المعلنين تأتي بتنسيقات متعددة، وليس بنوع واحد فقط. يتضمن ذلك البيانات المنظمة مثل عمر الحساب ونوع الفوترة والبيانات غير المنظمة مثل الأصول الإبداعية مثل الصور والنصوص والفيديو. تشير البيانات عالية الأبعاد إلى مئات أو آلاف نقاط البيانات المرتبطة بكل معلن، مما يتسبب في أن يصبح التمثيل الرياضي لكل واحدة عالي الأبعاد، مما يمثل تحديات للنماذج التقليدية.
2. مجموعات غير محدودة من الأصول الإبداعية
يمكن أن يمتلك المعلنون الآلاف من الأصول الإبداعية، مثل الصور، ويخفيوا واحدة أو اثنتين من الأصول الخبيثة من بين آلاف الأصول البريئة. لقد طغى هذا السيناريو على النظام السابق.
3. الموثوقية والجدارة بالثقة في العالم الحقيقي
يجب أن يكون النظام قادرًا على توليد درجات ثقة جديرة بالثقة تشير إلى أن الشركة لديها نوايا خبيثة لأن النتيجة الإيجابية الخاطئة قد تؤثر على معلن بريء. يجب أن يُتوقع أن يعمل النظام دون الحاجة إلى إعادة ضبطه باستمرار لاكتشاف الأخطاء.
الخصوصية والأمان
على الرغم من أن ALF تقوم بتحليل الإشارات الحساسة مثل تاريخ الفواتير وتفاصيل الحساب، يؤكد الباحثون على أن النظام مصمم بضمانات خصوصية صارمة. قبل أن يقوم الذكاء الاصطناعي بمعالجة أي بيانات، يتم إزالة جميع معلومات التعريف الشخصية (PII). ويضمن ذلك أن يحدد النموذج المخاطر بناءً على الأنماط السلوكية بدلاً من البيانات الشخصية الحساسة.
الصلصة السرية: كيف تكتشف القيم المتطرفة
يستخدم النموذج أيضًا تقنية تسمى “الانتباه بين العينات” لتحسين مهارات الكشف لديه. بدلاً من تحليل معلن واحد في فراغ، تنظر ALF إلى “مجموعات كبيرة من المعلنين” لمقارنة تفاعلاتهم مع بعضهم البعض. يسمح ذلك للذكاء الاصطناعي بمعرفة شكل النشاط الطبيعي عبر النظام البيئي بأكمله وجعله أكثر دقة في اكتشاف القيم المتطرفة المشبوهة التي لا تتناسب مع السلوك الطبيعي.
ألف يتفوق على معايير الإنتاج
يوضح الباحثون أن اختباراتهم تظهر أن ALF يتفوق على خط الإنتاج الأساسي الذي تم ضبطه بشكل كبير:
“تُظهر تجاربنا أن ALF يتفوق بشكل كبير على خط أساس الإنتاج الذي تم ضبطه بشدة بينما يؤدي أيضًا أداءً قويًا وفقًا للمعايير العامة. في الإنتاج، يحقق ALF مكاسب كبيرة ومتزامنة في الدقة والاستدعاء، مما يعزز الاستدعاء بأكثر من 40 نقطة مئوية في سياسة مهمة واحدة مع زيادة الدقة إلى 99.8% في سياسة أخرى.”
توضح هذه النتيجة أن ALF يمكنها تحقيق مكاسب قابلة للقياس عبر معايير تقييم متعددة في ظل ظروف الإنتاج الفعلية في العالم الحقيقي، وليس فقط في البيئات غير المتصلة بالإنترنت أو البيئات المعيارية.
في مكان آخر يذكرون المقايضات في السرعة:
“تم التحقق من فعالية هذا النهج مقابل خط أساس إنتاجي قوي بشكل استثنائي، وهو في حد ذاته نتيجة بحث مكثف عبر مختلف البنى والمعلمات الفائقة، بما في ذلك شبكات DNN والمجموعات وGBDTs والانحدار اللوجستي مع استكشاف الميزات المشتركة.
على الرغم من أن زمن استجابة ALF أعلى نظرًا لحجم الطراز الأكبر، إلا أنه يظل ضمن النطاق المقبول لبيئة الإنتاج لدينا ويمكن تحسينه بشكل أكبر باستخدام مسرعات الأجهزة. تظهر التجارب أن ALF يتفوق بشكل كبير على خط الأساس في مهام الكشف عن المخاطر الرئيسية، وهو ما يمثل تحسينًا في الأداء مدفوعًا بقدرته الفريدة على تصميم نماذج شاملة لتضمين المحتوى، والتي كافحت البنى الأبسط للاستفادة منها. يتم تبرير هذه المقايضة من خلال نشرها الناجح، حيث تخدم ALF ملايين الطلبات يوميًا.
يشير زمن الاستجابة إلى مقدار الوقت الذي يستغرقه النظام لإنتاج استجابة بعد تلقي الطلب، وتظهر بيانات الباحث أنه على الرغم من أن ALF تزيد وقت الاستجابة هذا مقارنة بخط الأساس، إلا أن زمن الاستجابة يظل مقبولاً لاستخدام الإنتاج ويعمل بالفعل على نطاق واسع مع تقديم أداء أفضل بكثير في الكشف عن الاحتيال.
تحسين كشف الاحتيال
يقول الباحثون إن ALF تم نشره الآن في نظام أمان إعلانات Google لتحديد المعلنين الذين ينتهكون سياسات إعلانات Google. ولا يوجد ما يشير إلى أن النظام يُستخدم في مكان آخر مثل البحث أو الملفات الشخصية للأعمال على Google. لكنهم قالوا إن العمل المستقبلي يمكن أن يركز على العوامل المستندة إلى الوقت (“الديناميكيات الزمنية”) لالتقاط الأنماط المتطورة. وأشاروا أيضًا إلى أنه قد يكون مفيدًا لنمذجة الجمهور والتحسين الإبداعي.
اقرأ النسخة الأصلية بصيغة PDF من الورقة البحثية:
ALF: نموذج الأساس الكبير للمعلن لفهم المعلن متعدد الوسائط
صورة مميزة بواسطة Shutterstock / تسجيل الدخول
Source link



