تريد Google تقديم TW-BERT لتحسين البحث

بالتأكيد أنت تعرف ذلك بالفعلجوجل يغير باستمرار خوارزمية التصنيف الخاصة به لتقديم أفضل النتائج الممكنة للمستخدمين.

أعلن محرك البحث في 7 أغسطس 2023 أنه يبحث في إطار تصنيف جديد يسمى Term Weighting BERT (TW-BERT) يهدف إلى تحسين نتائج البحث.

من خلال هذه المقالة، نتعرف على ما هو TW-BERT وكيف يمكن أن يساعد Google في تحسين نتائج البحث الخاصة به.

إعلان جوجل عن إطار البحث TW-BERT

قامت شركة جوجل بتطويرورقة ابحاث والذي يتميز بإطار رائع يعرف باسم TW-بيرت. وتتمثل مهمتها الرئيسية في تحسين تصنيفات البحث دون إجراء تعديلات جوهرية.

يعتبر TW-BERT نفسه بمثابة سياق ترجيح مصطلح الاستعلام الذي يجمع بين نموذجين لرفع نتائج البحث.

وهو يتوافق مع نماذج توسيع الاستعلام الموجودة بالفعل مع زيادة كفاءتها. علاوة على ذلك، فإن إدخاله في إطار جديد لا يتطلب سوى تعديلات طفيفة.

يعد Term Weighting BERT (TW-BERT) إطار تصنيف مثير للإعجاب كشفت عنه Google. يعمل على تحسين نتائج البحث ويمكن دمجه بسهولة في أنظمة التصنيف الحالية.

على الرغم من أن Google لم تؤكد تشغيل TW-BERT، إلا أن هذا الإطار الجديد يمثل خطوة كبيرة إلى الأمام من شأنها تحسين عمليات التصنيف في مجالات مختلفة، بما في ذلك توسيع الاستعلام.

من بين المساهمين البارزين في TW-BERT، لدينامارك ناجورك، باحث بارز في Google DeepMind والمدير الأول السابق لهندسة الأبحاث في Google Research.

تو بيرت – ما الذي نتحدث عنه؟

TW-BERT هو سياق تصنيف يعطي درجات، تسمى أيضًا الأوزان، للكلمات في استعلام البحث. الهدف هو تحديد الصفحات المحددة ذات الصلة بهذا الاستعلام بشكل أكثر دقة.

عندما يتعلق الأمر بتوسيع الاستعلام، يكون TW-BERT مفيدًا جدًا. هذا التوسيع عبارة عن عملية إعادة صياغة استعلام بحث أو إضافة كلمات إليه (على سبيل المثال، إضافة كلمة “المنزل” إلى البحث عن “تمارين القوة”.“) لغرض مطابقة استعلام البحث مع المستندات بشكل أكثر ملاءمة.

تتحدث الورقة البحثية عن طريقتين مختلفتين للبحث: إحداهما تعتمد على الإحصائيات والأخرى تركز على نماذج التعلم العميق.

كماالباحثين,

تتيح طرق الاستخراج القائمة على الإحصائيات إجراء بحث فعال يتناسب مع حجم المجموعة ويعمم على المجالات الجديدة. ومع ذلك، يتم ترجيح المصطلحات بشكل مستقل ولا تأخذ في الاعتبار سياق الاستعلام بأكمله.

بالنسبة لهذه المشكلة، يمكن لنماذج التعلم العميق إجراء هذا السياق على الاستعلام لتوفير تمثيل أفضل للمصطلحات الفردية.

لتوضيح أهمية مصطلحات البحث من خلال TW-BERT، يأخذ الباحثون مثال الاستعلام “أحذية الجري Nike”. يحصل كل مصطلح في هذا الطلب على درجة، أو “ترجيح”، مما يجعل من الممكن فهم الطلب كما أرسله المستخدم.

وبهذا الرسم التوضيحي تعتبر كلمة “نايكي” مهمة. وبطبيعة الحال، سوف تحصل هذه الكلمة على درجة أعلى. ويختتم الباحثون بالتأكيد على أهمية التأكد من إعطاء كلمة “نايكي” الوزن الكافي أثناء عرض أحذية الجري في النتائج النهائية.

التحدي الآخر هو فهم العلاقة بين كلمتي “العرق” و”الأحذية”. وهذا يعني أنه ينبغي زيادة الوزن عند دمج الكلمتين لتكوين عبارة “حذاء الجري”، بدلا من وزن كل كلمة على حدة.

TW-BERT: الحل لقيود الأطر الحالية

تتحدث الورقة البحثية عن القيود المتأصلة في الترجيح الحالي عندما يتعلق الأمر بتباين الاستعلام وتشير إلى أن أساليب الترجيح القائمة على الإحصاءات تؤدي إلى أداء ضعيف في مواقف “الصفر إطلاق النار”.

يشير التعلم من الصفر إلى قدرة النموذج على حل مشكلة لم يتم تدريبه عليها.

كما قدم الباحثون ملخصًا للقيود الكامنة في طرق توسيع المصطلح الحالية.

يشير توسيع المصطلح إلى استخدام المرادفات للعثور على المزيد من الإجابات لاستعلامات البحث أو عند استنتاج كلمة أخرى.

على سبيل المثال، عندما يبحث أحد الأشخاص عن “حساء الدجاج”، فهذا يعني “وصفة حساء الدجاج”.

يصف الباحثون أوجه القصور في الأساليب الحالية بالمصطلحات التالية:

“…لا تأخذ وظائف التسجيل المساعدة هذه في الاعتبار خطوات الترجيح الإضافية التي يتم تنفيذها بواسطة وظائف التسجيل المستخدمة في المستخرجات الموجودة، مثل إحصائيات الاستعلام، وإحصائيات المستندات، وقيم المعلمات الفائقة.

وقد يؤدي ذلك إلى تغيير التوزيع الأصلي للأوزان المخصصة للمصطلحات أثناء التقييم النهائي والاسترجاع“.

بعد ذلك، يرى الباحثون أن التعلم العميق له تحدياته الخاصة في شكل تعقيد النشر والسلوك غير المتوقع عندما يواجه مجالات جديدة لم يتم تدريبه عليها مسبقًا.

هذا هو المكان الذي يأتي فيه TW-BERT.

ما هي مصلحة TW-BERT؟

يبدو الحل المقترح وكأنه نهج هجين.

يكتب الباحثون:

ولسد هذه الفجوة، نستفيد من قوة المستخلصات المعجمية الموجودة مع التمثيلات السياقية للنص التي توفرها النماذج العميقة.

يقوم المستخرجون المعجميون بالفعل بتعيين أوزان لمصطلحات n-gram الخاصة بالاستعلام أثناء البحث.

نحن نستخدم النموذج اللغوي في هذه المرحلة من المسار لتعيين الأوزان المناسبة لمصطلحات n-gram الخاصة بالاستعلام.

تم تحسين طريقة BERT Term Weighting (TW-BERT) عالميًا باستخدام نفس وظائف التسجيل المستخدمة في خط الأنابيب لضمان الاتساق بين التدريب والاستخراج.

يؤدي ذلك إلى تحسين إمكانية البحث عند استخدام أوزان المصطلحات التي ينتجها نموذج TW-BERT مع الحفاظ على بنية أساسية لاسترجاع المعلومات مماثلة لنظيرها الإنتاجي الحالي.“.

تقوم خوارزمية TW-BERT بتعيين أوزان للاستعلامات لتوفير درجة صلة أكثر دقة يمكن لبقية عملية التصنيف العمل عليها بعد ذلك.

كيف يبدو نظام البحث المعجمي القياسي

يوضح هذا الرسم البياني تدفق البيانات في نظام البحث المعجمي القياسي.

système de recherche lexicale standard

مصدر :مجلة محرك البحث 

كيف يبدو نظام البحث مع TW-BERT

يوضح هذا الرسم البياني كيف تتناسب أداة TW-BERT مع إطار البحث.

 système de recherche

مصدر :مجلة محرك البحث

سهولة نشر TW-BERT

إحدى مزايا TW-BERT هي أنه يمكن إدخاله بسهولة في عملية تصنيف البحث عن المعلومات الحالية، كمكون للتوصيل والتشغيل.

يتيح لنا ذلك نشر أوزان مصطلحاتنا مباشرةً في نظام استرجاع المعلومات عند البحث.

وهذا يختلف عن طرق الوزن السابقة التي تتطلب ضبطًا إضافيًا لمعلمات المستخرج لتحقيق أداء الاستخراج الأمثل، حيث إنها تعمل على تحسين أوزان المصطلحات التي تم الحصول عليها عن طريق الاستدلال بدلاً من التحسين الشامل.“.

أحد العوامل الرئيسية في سهولة نشر TW-BERT هو أنه لا يتطلب استخدام برامج متخصصة أو تحديثات الأجهزة. هذه القدرة تجعل دمج TW-BERT فيخوارزميةتصنيف بسيط.

هل أضافت Google بالفعل TW-BERT إلى خوارزمية التصنيف الخاصة بها؟

فيما يتعلق بإمكانية تطبيقها على خوارزمية التصنيف الخاصة بجوجل، تشير سهولة تكامل TW-BERT إلى أن جوجل ربما اعتمدت هذه الآلية في هيكل الخوارزمية الخاص بها.

يمكن دمج الإطار في نظام تصنيف الخوارزمية دون الحاجة إلى تحديث الخوارزمية الأساسية بالكامل.

بالإضافة إلى ذلك، فإن بعض الخوارزميات غير الفعالة أو التي لا تقدم أي تحسينات، على الرغم من أنها مثيرة للاهتمام في تصميمها، قد لا يتم الاحتفاظ بها في خوارزمية التصنيف في Google. ومن ناحية أخرى، فإن الخوارزميات الفعالة بشكل خاص، مثل TW-BERT، تجتذب الاهتمام.

لقد أثبت TW-BERT فعاليته الكبيرة في تحسين قدرات أنظمة التصنيف الحالية، مما يجعله مرشحًا صالحًا للتكيف بواسطة Google.

إذا كانت جوجل قد نفذت بالفعل TW-BERT، فقد يفسر ذلك تقلبات التصنيف التي أبلغت عنها أدوات مراقبة تحسين محركات البحث ومجتمع التسويق عبر البحث خلال الشهر الماضي.

على الرغم من أن Google تعلن عن عدد محدود فقط من تغييرات التصنيف، تلك التي لها تأثير كبير، إلا أنه لا يوجد تأكيد رسمي لتكامل TW-BERT من قبل Google حتى الآن.

لا يمكننا التكهن باحتمالية حدوث ذلك إلا بناءً على التحسينات الملحوظة في دقة نظام استرجاع المعلومات وسهولة استخدامه.

في ملخص

يعد TW-BERT ابتكارًا كبيرًا في مجال المراجع الطبيعية، والذي يمكن أن يغير الطريقة التي يقوم بها Google بتحليل وتصنيف صفحات الويب. لم يتم دمج TW-BERT رسميًا في خوارزمية Google، ولكن قد يتم ذلك في المستقبل القريب.

التصنيفات SEO

أضف تعليق