Skip to content
العودة إلى المدونة
ai5 دقيقة قراءة

شرح الاسترجاع المعزّز بالتوليد (RAG) لفرق الأعمال

ما هو RAG، وكيف يؤسّس نماذج LLM على بياناتك عبر البحث المتجهي، وأين يبرع وأين يتعثّر. دليل عملي مبسّط.

SummationWorks
شرح الاسترجاع المعزّز بالتوليد (RAG) لفرق الأعمال

اسأل نموذجًا لغويًا كبيرًا (LLM) عاديًا متى تغيّرت سياسة الإرجاع في شركتك في الربع الماضي، وسيجيبك بثقة تامة ومعرفة معدومة عن عملك. فالنموذج دُرِّب على لقطة من النصوص العامة تجمّدت قبل أشهر أو سنوات. لم يرَ قط كتالوج منتجاتك، ولا تذاكر الدعم لديك، ولا دليلك الداخلي. فيفعل ما تجيده هذه النماذج حين تعوزها الحقائق: يخترع شيئًا يبدو منطقيًا.

الاسترجاع المعزّز بالتوليد، أو ما يُختصر بـ RAG، هو الحل الأكثر عملية لهذه المشكلة. فبدلًا من أن تأمل أن النموذج يعرف معلوماتك أصلًا، تجلب الحقائق ذات الصلة في لحظة طرح السؤال وتسلّمها للنموذج مع الـ prompt. عندها تصبح الإجابة مبنية على بياناتك الفعلية، لا على ذاكرة النموذج الضبابية عن الإنترنت.

ماذا يفعل RAG فعلًا

يعمل الـ LLM المجرّد مثل امتحان بكتاب مغلق. يجيب النموذج اعتمادًا على ما استوعبه أثناء التدريب، وبمجرد انتهاء التدريب تتوقف تلك المعرفة عن التحدّث. أي شيء أحدث أو خاص أو متعلق بمؤسستك يقع ببساطة خارج متناوله.

يحوّل RAG هذا إلى امتحان بكتاب مفتوح. قبل أن يكتب النموذج كلمة واحدة، يبحث النظام في مصدر معرفي تتحكم فيه أنت، ويعثر على المقاطع الأكثر صلة بالسؤال، ويُدرجها ضمن السياق الذي يقرؤه النموذج. ثم يصوغ النموذج إجابته معتمدًا على تلك المقاطع باعتبارها مصدر الحقيقة.

الفوائد ملموسة:

  • معلومات محدّثة. حدّث مستنداتك فتتحدّث الإجابات معها، دون أي إعادة تدريب.
  • معرفة خاصة. يستطيع النموذج الاستدلال على بيانات لم يُدرَّب عليها قط، مثل العقود أو السياسات أو مواصفات المنتجات.
  • اختلاق أقل. يقلّل تأسيس الإجابة على نص مُسترجَع بشكل كبير من الهراء الواثق الذي اشتهرت به نماذج الـ LLM.
  • قابلية للتتبّع. لأنك تعرف أي المستندات استُرجِعت، يمكنك أن تعرض للمستخدمين المصادر التي تقف خلف الإجابة.

كيف تُبنى منظومة RAG

تتكوّن منظومة RAG من مرحلتين. واحدة تحدث مرة واحدة مسبقًا، والأخرى تحدث في كل مرة يطرح فيها المستخدم سؤالًا.

المرحلة الأولى: فهرسة معرفتك

تبدأ من مادتك الخام: مقالات المساعدة، وملفات PDF، وسجلات قواعد البيانات، والمحادثات السابقة، وأي شيء يحمل الإجابات. يُقسَّم هذا المحتوى إلى أجزاء أصغر تُسمى chunks، عادةً بضع فقرات لكل جزء، لأن حشر دليل من 80 صفحة في prompt واحد ليس ممكنًا ولا مفيدًا.

ثم يمرّ كل جزء عبر نموذج تضمين (embedding model)، يحوّل النص إلى قائمة من الأرقام، أي متجه (vector)، يلتقط معناه. فينتهي مقطعان يتحدثان عن مواعيد استرداد الأموال بمتجهين متقاربين حتى لو لم يتشاركا أي كلمة بعينها. تُخزَّن هذه المتجهات في قاعدة بيانات متجهات مثل Pinecone أو Weaviate أو Qdrant أو امتداد pgvector لقاعدة Postgres.

المرحلة الثانية: الإجابة عن السؤال

حين يسأل المستخدم شيئًا، يحوّل نموذج التضمين نفسه سؤاله إلى متجه. ثم ينفّذ النظام بحثًا متجهيًا (vector search) ليجد الأجزاء التي تقع متجهاتها أقرب إلى متجه السؤال، أي الأقرب في المعنى. تُسحَب هذه المطابقات الأعلى، وتُلحَق بسؤال المستخدم داخل prompt مكتوب بعناية، وتُرسَل إلى الـ LLM. يقرأ النموذج السياق المُسترجَع وينتج إجابة مؤسَّسة على الحقائق.

تعتمد جودة النظام كله اعتمادًا كبيرًا على الاسترجاع. فإن أعاد البحث المتجهي الأجزاء الخطأ، فسيقدّم حتى أفضل نموذج إجابة واثقة مبنية على مادة غير ذات صلة. RAG الجيد هو في معظمه استرجاع جيد.

لماذا يتفوق البحث المتجهي على البحث بالكلمات المفتاحية

البحث التقليدي يطابق الكلمات. فإن كتب العميل "استرداد المبلغ" بينما يقول مستند السياسة لديك "استرجاع"، قد لا يُرجع نظام الكلمات المفتاحية شيئًا. أما البحث المتجهي فيطابق المعنى، فتقع عبارات مثل "استرداد المبلغ" و"استرجاع" و"إعادة دفعتي" كلها قرب المقاطع نفسها.

عمليًا، تجمع أقوى الأنظمة بين الاثنين. يشغّل النهج الهجين البحث بالكلمات المفتاحية والبحث المتجهي معًا، ثم يدمج النتائج. يُتقن البحث بالكلمات المفتاحية المصطلحات الدقيقة مثل أكواد المنتجات والأسماء والاختصارات؛ بينما يتعامل البحث المتجهي مع الطريقة الفوضوية الطبيعية التي يصوغ بها الناس أسئلتهم فعلًا. وللمنتجات متعددة اللغات تزداد أهمية هذا، إذ قد يسأل العميل بالعربية عن محتوى مخزّن بالإنجليزية، وبإمكان نموذج تضمين مختار بعناية أن يجسر تلك الفجوة.

فيمَ يبرع RAG، وأين يتعثّر

RAG هو الأداة الصحيحة كلما احتاجت ميزة ذكاء اصطناعي إلى التحدّث بدقة عن معلومات محددة أو متغيّرة أو خاصة. ومن التطبيقات الشائعة عالية القيمة:

  • مساعدو دعم العملاء الذين يجيبون من توثيقك الحقيقي بدلًا من التخمين.
  • أدوات المعرفة الداخلية التي تتيح للموظفين الاستعلام عن السياسات والإجراءات والمشاريع السابقة بلغة طبيعية.
  • تحليل المستندات عبر العقود أو التقارير أو الأبحاث، مع إسناد المصدر بالاستشهاد.
  • بحث التجارة الإلكترونية والمنتجات حيث يصف المتسوّقون ما يريدونه بدلًا من كتابة أكواد SKU بدقة.

لكنه ليس علاجًا لكل شيء. يجيب RAG عن الأسئلة التي توجد إجاباتها في مكان ما داخل مستنداتك؛ ولن يؤدي استدلالًا معقدًا متعدد الخطوات لم تحتوِه المادة المصدر أصلًا. ويتعثّر في الأسئلة التي تتطلب تجميعًا عبر آلاف السجلات، وهو ما يعالجه استعلام قاعدة بيانات أفضل بكثير. وهو لا يجود إلا بقدر المحتوى الذي خلفه: فالمستندات الفوضوية أو المتناقضة أو القديمة تنتج إجابات فوضوية ومتناقضة وقديمة. وغالبًا ما يُكسَب أكثر القيمة الحقيقية في العمل غير البرّاق المتمثل في تنظيف قاعدة معرفتك وهيكلتها.

وهناك أيضًا بُعد التكلفة والكُمون (latency). فكل استعلام يشغّل خطوة تضمين وبحثًا وخطوة توليد، لذا قد يكون التصميم المتهاون بطيئًا ومكلفًا. أما التقسيم الحكيم للأجزاء والـ caching وحدود الاسترجاع فتُبقيه سريعًا وفي المتناول.

أهم النقاط

  • يؤسّس RAG الـ LLM على بياناتك الخاصة باسترجاع الحقائق ذات الصلة وقت السؤال وتغذيتها للنموذج، فيحوّل امتحان الكتاب المغلق إلى امتحان بكتاب مفتوح.
  • تتكوّن المنظومة من مرحلتين: فهرسة محتواك في قاعدة بيانات متجهات مسبقًا، ثم استرجاع الأجزاء الأكثر مطابقة لكل سؤال.
  • يطابق البحث المتجهي المعنى لا الكلمات الحرفية، والمزج بين البحث المتجهي والكلمات المفتاحية هو الأكثر موثوقية عادةً، خصوصًا عبر اللغات.
  • يبقي RAG الإجابات محدّثة، ويتيح للنموذج استخدام معرفة خاصة، ويقلّل الاختلاق، ويجعل المصادر قابلة للتتبّع.
  • تعتمد النتائج على جودة الاسترجاع وجودة المحتوى أكثر بكثير من اختيار النموذج؛ فقاعدة معرفة نظيفة ومُهيكَلة جيدًا هي الأساس الحقيقي.

إن كنت توازن بين مساعد ذكاء اصطناعي أو أداة بحث داخلية أو منتج واعٍ بالمستندات، فإن RAG هو عادةً الطريق الموثوق من عرض تجريبي برّاق إلى شيء يستطيع فريقك وعملاؤك الوثوق به فعلًا. في SummationWorks نصمّم هذه الأنظمة ونبنيها من البداية إلى النهاية، من استراتيجية التضمين والبحث المتجهي إلى تجربة المنتج المحيطة بها. استكشف خدماتنا، أو شاهد أعمالنا، أو تواصل معنا لنتحدث عن الشكل الذي قد تتخذه ميزة ذكاء اصطناعي مؤسَّسة على بياناتك في عملك.

عن الكاتب

SummationWorks

SummationWorks is a software development company building web apps, mobile apps, and AI tools for startups and growing businesses across the US, UK, and GCC.

المزيد عنّا

لديك مشروع في ذهنك؟

لنحوّل فكرتك إلى برمجيات جاهزة للإنتاج.

ابدأ مشروعًا