ظهر المنشور بعنوان "Gemma من Google تتصرف بالفعل مثل Gemini—شخص ما جعلها تفكر مثل Claude Opus أيضاً" على موقع BitcoinEthereumNews.com. إذا كنت تتابع المحليظهر المنشور بعنوان "Gemma من Google تتصرف بالفعل مثل Gemini—شخص ما جعلها تفكر مثل Claude Opus أيضاً" على موقع BitcoinEthereumNews.com. إذا كنت تتابع المحلي

جيما من Google تعمل بالفعل مثل Gemini—شخص ما جعلها تفكر مثل Claude Opus أيضًا

2026/04/15 12:28
5 دقيقة قراءة
للحصول على ملاحظات أو استفسارات بشأن هذا المحتوى، يرجى التواصل معنا على [email protected]

إذا كنت تتابع مشهد الذكاء الاصطناعي المحلي، فمن المحتمل أنك تعرف Qwopus - النموذج مفتوح المصدر الذي حاول تقطير تفكير Claude Opus 4.6 في Qwen من Alibaba، حتى تتمكن من تشغيل شيء يشبه Opus على أجهزتك الخاصة مجانًا. لقد نجح بشكل مفاجئ. العيب الواضح: Qwen هو نموذج صيني، وليس الجميع مرتاحين لذلك.

استمع Jackrong، المطور المستعار نفسه وراء هذا المشروع، إلى الملاحظات. إجابته هي Gemopus - عائلة جديدة من التعديلات الدقيقة بأسلوب Claude Opus مبنية بالكامل على Gemma 4 مفتوح المصدر من Google. الحمض النووي الأمريكي بالكامل، نفس الفكرة: التفكير على مستوى الحدود الأمامية، يعمل محليًا على الأجهزة التي تمتلكها بالفعل.

تأتي العائلة بنكهتين. Gemopus-4-26B-A4B هو الخيار الأثقل - نموذج مزيج من الخبراء يحتوي على 26 مليار معامل إجمالي ولكنه ينشط حوالي 4 مليارات فقط أثناء الاستنتاج، مما يعني أنه يقدم أداءً أعلى بكثير من وزنه على الأجهزة المحدودة.

المعاملات هي ما يحدد قدرة الذكاء الاصطناعي على التعلم والتفكير وتخزين المعلومات. وجود 26 مليار معامل إجمالي يمنح النموذج اتساعًا هائلاً من المعرفة. ولكن من خلال "إيقاظ" 4 مليارات معامل فقط ذات الصلة بمطالبتك المحددة، فإنه يقدم نتائج عالية الجودة لذكاء اصطناعي ضخم مع بقائه خفيفًا بما يكفي للعمل بسلاسة على الأجهزة اليومية.

الآخر هو Gemopus-4-E4B، نموذج حافة بـ 4 مليارات معامل مصمم للعمل بشكل مريح على iPhone حديث أو MacBook رفيع وخفيف - لا يتطلب GPU.

اختيار النموذج الأساسي مهم هنا. Gemma 4 من Google، الذي تم إصداره في 2 أبريل، مبني مباشرة من نفس الأبحاث والتقنية مثل Gemini 3 - قالت الشركة ذلك صراحة عند الإطلاق. هذا يعني أن Gemopus يحمل شيئًا لا يمكن لأي تعديل دقيق قائم على Qwen ادعاؤه: الحمض النووي لنموذج Google المغلق المتطور الخاص تحت الغطاء، ملفوفًا بأسلوب تفكير Anthropic في الأعلى. الأفضل من كلا العالمين، إلى حد ما.

ما يجعل Gemopus مختلفًا عن موجة التعديلات الدقيقة الأخرى لـ Gemma التي تغمر Hugging Face الآن هو الفلسفة وراءه. اختار Jackrong عمدًا عدم إجبار آثار تفكير سلسلة التفكير الخاصة بـ Claude في أوزان Gemma - وهو اختصار تتخذه معظم الإصدارات المنافسة.

حجته، المدعومة بالبحوث الحديثة، هي أن حشو نموذج طالب بنص تفكير سطحي للمعلم لا ينقل في الواقع القدرة على التفكير الحقيقي. إنه يعلم التقليد، وليس المنطق. "لا حاجة للخيال المفرط أو التكرار الخرافي لسلسلة التفكير بأسلوب Claude،" تقرأ بطاقة النموذج. بدلاً من ذلك، ركز على جودة الإجابة والوضوح الهيكلي والطبيعية المحادثة - إصلاح نبرة ويكيبيديا الصارمة لـ Gemma وميله لإلقاء محاضرات عليك حول أشياء لم تطلبها.

أجرى مهندس البنية التحتية للذكاء الاصطناعي Kyle Hessling معايير مستقلة ونشر النتائج مباشرة على بطاقة النموذج. كان حكمه على متغير 26B إيجابيًا جدًا. "سعيد بأنني اختبرت هذا بشكل مكثف وهو تعديل دقيق ممتاز لنموذج استثنائي بالفعل،" كتب على X. "إنه رائع في الطلبات أحادية الاستجابة عبر سياقات طويلة، ويعمل بسرعة لا تصدق بفضل بنية MOE (مزيج الخبراء)."

اجتاز متغير E4B الأصغر جميع اختبارات الكفاءة الأساسية الـ 14 - اتباع التعليمات، الترميز، الرياضيات، التفكير متعدد الخطوات، الترجمة، السلامة، التخزين المؤقت - وتجاوز جميع اختبارات السياق الطويل الـ 12 عند 30K و 60K رمز. في استرجاع الإبرة في كومة القش، اجتاز 13 من أصل 13 مسبارًا بما في ذلك اختبار تمديد عند مليون رمز مع YaRN 8× RoPE scaling.

يمتد 26B بشكل أصلي إلى سياق 131K وصولاً إلى 524K مع YaRN، والذي اختبره Hessling أيضًا تحت الضغط: "لقد سحق أيضًا اختبارات الإبرة في كومة القش البسيطة الخاصة بي وصولاً إلى سياق ممتد 524k!"

على الأجهزة الطرفية، E4B سريع حقًا. يبلغ Jackrong عن 45-60 رمزًا في الثانية على iPhone 17 Pro Max، و 90-120 رمزًا في الثانية على MacBook Air M3/M4 عبر MLX. تعني بنية 26B MoE أنها تفرغ بأمان على أنظمة الذاكرة الموحدة أو وحدات معالجة الرسومات بأقل من 10GB من VRAM. أطلق عليها Hessling توصيته للاستخدام اليومي للإعدادات التي تعاني من نقص VRAM.

كلا النموذجين متاحان بتنسيق GGUF، مما يعني أنه يمكنك إسقاطهما مباشرة في LM Studio أو llama.cpp دون تكوين. كود التدريب الكامل ودليل التعديل الدقيق خطوة بخطوة موجودان على GitHub الخاص بـ Jackrong - نفس خط الأنابيب الذي استخدمه لـ Qwopus، نفس إعداد Unsloth و LoRA، قابل للتكرار على Colab.

Gemopus ليس خاليًا من الحواف الخشنة. لا يزال استدعاء الأدوات معطلاً عبر سلسلة Gemma 4 بأكملها في llama.cpp و LM Studio - فشل الاستدعاء، عدم تطابق التنسيق، الحلقات - لذلك إذا كان سير عملك يعتمد على وكلاء يستخدمون أدوات خارجية، فهذا ليس نموذجك بعد. يطلق عليه Jackrong نفسه "مرجع استكشاف هندسي بدلاً من حل جاهز للإنتاج بالكامل،" ويوصي بسلسلة Qwopus 3.5 الخاصة به لأي شخص يحتاج إلى شيء أكثر استقرارًا لأعباء العمل الحقيقية.

ولأن Jackrong تجنب عمدًا التقطير العدواني لسلسلة التفكير بأسلوب Claude، لا تتوقع أن يشعر بعمق تفكير Opus مثل Qwopus - كان هذا مقايضة واعية من أجل الاستقرار، وليس إهمالًا.

بالنسبة لأولئك الذين يرغبون في التعمق في التعديل الدقيق لـ Gemma للتفكير على وجه التحديد، هناك أيضًا مشروع مجتمعي منفصل يستحق المشاهدة: Ornstein من قبل المطور المستعار DJLougen، والذي يأخذ نفس قاعدة Gemma 4 26B ويركز على وجه التحديد على تحسين سلاسل التفكير الخاصة به دون الاعتماد على منطق أو أسلوب أي نموذج طرف ثالث محدد.

تحذير صادق واحد: ديناميكيات تدريب Gemma أكثر فوضى من Qwen للمعدلين الدقيقين - تقلبات خسارة أوسع، حساسية أكبر للمعاملات الفائقة. يقول Jackrong ذلك بنفسه. إذا كنت بحاجة إلى نموذج محلي أكثر اختبارًا في المعركة لسير عمل الإنتاج، فإن سلسلة Qwopus 3.5 الخاصة به تظل أكثر صلابة في التحقق. ولكن إذا كنت تريد نموذجًا أمريكيًا بلمسة أسلوب Opus، فإن Gemopus هو حاليًا أفضل خيار متاح لك. متغير Gemopus 31B أكثر كثافة موجود أيضًا في خط الأنابيب، مع Hessling يشوقه على أنه "رائع بالتأكيد."

إذا كنت تريد تجربة تشغيل النماذج المحلية على أجهزتك الخاصة، تحقق من دليلنا حول كيفية البدء بالذكاء الاصطناعي المحلي.

النشرة الإخبارية اليومية

ابدأ كل يوم بأهم الأخبار الآن، بالإضافة إلى ميزات أصلية وبودكاست ومقاطع فيديو والمزيد.

المصدر: https://decrypt.co/364344/gemopus-gemma-4-claude-opus-style-local-ai

فرصة السوق
شعار 4
4 السعر(4)
$0.01068
$0.01068$0.01068
+0.07%
USD
مخطط أسعار 4 (4) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني [email protected] لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.

حفل USD1: صفر رسوم + %12 APR

حفل USD1: صفر رسوم + %12 APRحفل USD1: صفر رسوم + %12 APR

للمستخدم الجديد: خزّن لتربح %600 APR. لفترة محدودة!