جيما من Google تعمل بالفعل مثل Gemini—شخص ما جعلها تفكر مثل Claude Opus أيضًا

إذا كنت تتابع مشهد الذكاء الاصطناعي المحلي، فمن المحتمل أنك تعرف Qwopus - النموذج مفتوح المصدر الذي حاول تقطير تفكير Claude Opus 4.6 في Qwen من Alibaba، حتى تتمكن من تشغيل شيء يشبه Opus على أجهزتك الخاصة مجانًا. لقد نجح بشكل مفاجئ. العيب الواضح: Qwen هو نموذج صيني، وليس الجميع مرتاحين لذلك.

استمع Jackrong، المطور المستعار نفسه وراء هذا المشروع، إلى الملاحظات. إجابته هي Gemopus - عائلة جديدة من التعديلات الدقيقة بأسلوب Claude Opus مبنية بالكامل على Gemma 4 مفتوح المصدر من Google. الحمض النووي الأمريكي بالكامل، نفس الفكرة: التفكير على مستوى الحدود الأمامية، يعمل محليًا على الأجهزة التي تمتلكها بالفعل.

تأتي العائلة بنكهتين. Gemopus-4-26B-A4B هو الخيار الأثقل - نموذج مزيج من الخبراء يحتوي على 26 مليار معامل إجمالي ولكنه ينشط حوالي 4 مليارات فقط أثناء الاستنتاج، مما يعني أنه يقدم أداءً أعلى بكثير من وزنه على الأجهزة المحدودة.

المعاملات هي ما يحدد قدرة الذكاء الاصطناعي على التعلم والتفكير وتخزين المعلومات. وجود 26 مليار معامل إجمالي يمنح النموذج اتساعًا هائلاً من المعرفة. ولكن من خلال "إيقاظ" 4 مليارات معامل فقط ذات الصلة بمطالبتك المحددة، فإنه يقدم نتائج عالية الجودة لذكاء اصطناعي ضخم مع بقائه خفيفًا بما يكفي للعمل بسلاسة على الأجهزة اليومية.

الآخر هو Gemopus-4-E4B، نموذج حافة بـ 4 مليارات معامل مصمم للعمل بشكل مريح على iPhone حديث أو MacBook رفيع وخفيف - لا يتطلب GPU.

اختيار النموذج الأساسي مهم هنا. Gemma 4 من Google، الذي تم إصداره في 2 أبريل، مبني مباشرة من نفس الأبحاث والتقنية مثل Gemini 3 - قالت الشركة ذلك صراحة عند الإطلاق. هذا يعني أن Gemopus يحمل شيئًا لا يمكن لأي تعديل دقيق قائم على Qwen ادعاؤه: الحمض النووي لنموذج Google المغلق المتطور الخاص تحت الغطاء، ملفوفًا بأسلوب تفكير Anthropic في الأعلى. الأفضل من كلا العالمين، إلى حد ما.

ما يجعل Gemopus مختلفًا عن موجة التعديلات الدقيقة الأخرى لـ Gemma التي تغمر Hugging Face الآن هو الفلسفة وراءه. اختار Jackrong عمدًا عدم إجبار آثار تفكير سلسلة التفكير الخاصة بـ Claude في أوزان Gemma - وهو اختصار تتخذه معظم الإصدارات المنافسة.

حجته، المدعومة بالبحوث الحديثة، هي أن حشو نموذج طالب بنص تفكير سطحي للمعلم لا ينقل في الواقع القدرة على التفكير الحقيقي. إنه يعلم التقليد، وليس المنطق. "لا حاجة للخيال المفرط أو التكرار الخرافي لسلسلة التفكير بأسلوب Claude،" تقرأ بطاقة النموذج. بدلاً من ذلك، ركز على جودة الإجابة والوضوح الهيكلي والطبيعية المحادثة - إصلاح نبرة ويكيبيديا الصارمة لـ Gemma وميله لإلقاء محاضرات عليك حول أشياء لم تطلبها.

أجرى مهندس البنية التحتية للذكاء الاصطناعي Kyle Hessling معايير مستقلة ونشر النتائج مباشرة على بطاقة النموذج. كان حكمه على متغير 26B إيجابيًا جدًا. "سعيد بأنني اختبرت هذا بشكل مكثف وهو تعديل دقيق ممتاز لنموذج استثنائي بالفعل،" كتب على X. "إنه رائع في الطلبات أحادية الاستجابة عبر سياقات طويلة، ويعمل بسرعة لا تصدق بفضل بنية MOE (مزيج الخبراء)."

اجتاز متغير E4B الأصغر جميع اختبارات الكفاءة الأساسية الـ 14 - اتباع التعليمات، الترميز، الرياضيات، التفكير متعدد الخطوات، الترجمة، السلامة، التخزين المؤقت - وتجاوز جميع اختبارات السياق الطويل الـ 12 عند 30K و 60K رمز. في استرجاع الإبرة في كومة القش، اجتاز 13 من أصل 13 مسبارًا بما في ذلك اختبار تمديد عند مليون رمز مع YaRN 8× RoPE scaling.

يمتد 26B بشكل أصلي إلى سياق 131K وصولاً إلى 524K مع YaRN، والذي اختبره Hessling أيضًا تحت الضغط: "لقد سحق أيضًا اختبارات الإبرة في كومة القش البسيطة الخاصة بي وصولاً إلى سياق ممتد 524k!"

على الأجهزة الطرفية، E4B سريع حقًا. يبلغ Jackrong عن 45-60 رمزًا في الثانية على iPhone 17 Pro Max، و 90-120 رمزًا في الثانية على MacBook Air M3/M4 عبر MLX. تعني بنية 26B MoE أنها تفرغ بأمان على أنظمة الذاكرة الموحدة أو وحدات معالجة الرسومات بأقل من 10GB من VRAM. أطلق عليها Hessling توصيته للاستخدام اليومي للإعدادات التي تعاني من نقص VRAM.

كلا النموذجين متاحان بتنسيق GGUF، مما يعني أنه يمكنك إسقاطهما مباشرة في LM Studio أو llama.cpp دون تكوين. كود التدريب الكامل ودليل التعديل الدقيق خطوة بخطوة موجودان على GitHub الخاص بـ Jackrong - نفس خط الأنابيب الذي استخدمه لـ Qwopus، نفس إعداد Unsloth و LoRA، قابل للتكرار على Colab.

Gemopus ليس خاليًا من الحواف الخشنة. لا يزال استدعاء الأدوات معطلاً عبر سلسلة Gemma 4 بأكملها في llama.cpp و LM Studio - فشل الاستدعاء، عدم تطابق التنسيق، الحلقات - لذلك إذا كان سير عملك يعتمد على وكلاء يستخدمون أدوات خارجية، فهذا ليس نموذجك بعد. يطلق عليه Jackrong نفسه "مرجع استكشاف هندسي بدلاً من حل جاهز للإنتاج بالكامل،" ويوصي بسلسلة Qwopus 3.5 الخاصة به لأي شخص يحتاج إلى شيء أكثر استقرارًا لأعباء العمل الحقيقية.

ولأن Jackrong تجنب عمدًا التقطير العدواني لسلسلة التفكير بأسلوب Claude، لا تتوقع أن يشعر بعمق تفكير Opus مثل Qwopus - كان هذا مقايضة واعية من أجل الاستقرار، وليس إهمالًا.

بالنسبة لأولئك الذين يرغبون في التعمق في التعديل الدقيق لـ Gemma للتفكير على وجه التحديد، هناك أيضًا مشروع مجتمعي منفصل يستحق المشاهدة: Ornstein من قبل المطور المستعار DJLougen، والذي يأخذ نفس قاعدة Gemma 4 26B ويركز على وجه التحديد على تحسين سلاسل التفكير الخاصة به دون الاعتماد على منطق أو أسلوب أي نموذج طرف ثالث محدد.

تحذير صادق واحد: ديناميكيات تدريب Gemma أكثر فوضى من Qwen للمعدلين الدقيقين - تقلبات خسارة أوسع، حساسية أكبر للمعاملات الفائقة. يقول Jackrong ذلك بنفسه. إذا كنت بحاجة إلى نموذج محلي أكثر اختبارًا في المعركة لسير عمل الإنتاج، فإن سلسلة Qwopus 3.5 الخاصة به تظل أكثر صلابة في التحقق. ولكن إذا كنت تريد نموذجًا أمريكيًا بلمسة أسلوب Opus، فإن Gemopus هو حاليًا أفضل خيار متاح لك. متغير Gemopus 31B أكثر كثافة موجود أيضًا في خط الأنابيب، مع Hessling يشوقه على أنه "رائع بالتأكيد."

إذا كنت تريد تجربة تشغيل النماذج المحلية على أجهزتك الخاصة، تحقق من دليلنا حول كيفية البدء بالذكاء الاصطناعي المحلي.

النشرة الإخبارية اليومية

ابدأ كل يوم بأهم الأخبار الآن، بالإضافة إلى ميزات أصلية وبودكاست ومقاطع فيديو والمزيد.

المصدر: https://decrypt.co/364344/gemopus-gemma-4-claude-opus-style-local-ai

جيما من Google تعمل بالفعل مثل Gemini—شخص ما جعلها تفكر مثل Claude Opus أيضًا

النشرة الإخبارية اليومية

قد يعجبك أيضاً

إعلان شراكة كبرى بين XRP وعملاق التجارة الإلكترونية الياباني Rakuten – "مليارات الدولارات من الإمكانات المحتملة"

EtherFi تلتزم بـ 3 مليار دولار من ETH لسوق ETHGas

نمو شرق أفريقيا يتصدر القارة بنسبة 7.52% في 2026

الأخبار الرائجة

البنك الأوروبي لإعادة الإعمار والتنمية يمول مشروع متميز للطاقة الشمسية بقدرة 200 ميجاوات في الصحراء الغربية بمصر

صك عملة USDC يشير إلى ارتفاع السيولة في الكريبتو

توقعات سعر XRP: مجلس الشيوخ يعود للانعقاد مع قانون CLARITY على جدول الأعمال لكن البيع المسبق لـ Pepeto قد يتفوق في الأداء

متداولو XRP منخفضون بنسبة 41% في المتوسط – لماذا يتحول البعض إلى البيع المسبق للعملة المشفرة من BMIC

مراجعة Word 2 Kindle: هل خدمة التنسيق هذه موثوقة؟

أخبار مباشرة على مدار 24/7

أسعار الكريبتو