Connect with us

گوغل تكشف عن Gemini 3 Pro مع أداء كاسح للbenchmarks

إعلانات

گوغل تكشف عن Gemini 3 Pro مع أداء كاسح للbenchmarks

mm

أصدرت Google اليوم Gemini 3 Pro، مما يُعد أكثر نماذج الذكاء الاصطناعي تقدمًا حتى الآن مع سجلات كاسحة ومنصة تطوير جديدة تسمى Antigravity. ويتجاوز النموذج 1501 Elo على LMArena، متجاوزًا 1451 لجيميني 2.5 برو ومتحصلًا على المركز الأول عبر معايير تقييم الذكاء الاصطناعي الرئيسية.

يأتي الإطلاق بعد أشهر من التوقع في صناعة الذكاء الاصطناعي، حيث تم إطلاق النموذج بشكل هادئ إلى مستخدمين منتخبين في 22 أكتوبر قبل الإعلان العام. الإصدار الموجه للمطورين من Google يُشدد على قدرات البرمجة والوظيفة المستقلة للوكيل، مما يضع الشركة في موضع تنافس أكثر شراسة مع أداء كلود في البرمجة وأدوات التطوير من OpenAI.

يدعم Gemini 3 Pro نافذة سياق تبلغ مليون رمز -约 750,000 كلمة – مع عدة مستويات تقدم 200K و 1M رمز لمختلف الحالات. ويُظهر النموذج قدرات استثنائية متعددة الوسائط، مع معالجة النصوص والصور والفيديو والصوت مع تحسين العقل البصري وتوليد الرسومات. وتشمل التكامل نطاق منتجات Google، بما في ذلك Workspace و Chrome و Android.

أداء Benchmark كاسح للأساطير

يحقق Gemini 3 Pro دقة 91.8% على معيار MMLU، وهو تحسين بنسبة 5 نقاط عن 89.5% لجيميني 2.5 برو. ويُظهر النموذج قوة خاصة في الأسئلة متعددة التخصصات، حيث يسجل 92% في المهام التي تشمل مجالات معرفية متعددة، بينما انخفض جيميني 2.5 إلى 65% في تحديات مماثلة.

على معايير الترميز الخاصة، سجل Gemini 3 Pro 76.2% على SWE-bench Verified، مما يُperformه بشكل كبير من سابقه، ولكنه يتراجع عن 77.2% لكلود 4.5. ويُتصدر النموذج قائمة ترتيب WebDev Arena ب 1487 Elo، مما يُظهر قدرات استثنائية في تطوير الويب. على Terminal-Bench 2.0، الذي يقيس استخدام الأدوات وتشغيل الكمبيوتر عبر الطرفية، حقق Gemini 3 Pro 54.2%.

يُقدم النموذج استدلالًا أسرع بمقدار 2 ضعف تقريبًا من جيميني 2.5 برو عبر أحجام المهام. تكتمل المهام الصغيرة مثل البرامج النصية البايثونية التي تبلغ 50 سطرًا في 12 ثانية مقابل 25 ثانية، بينما تكتمل المهام الكبيرة التي تشمل 10,000 صف من البيانات في 15 دقيقة و 30 ثانية، مقارنة بـ 32 دقيقة و 15 ثانية من قبل.

كما قدمت Google وضع Gemini 3 Deep Think، وهو قدرةreasoning محسّنة يُقدم أداءً أعلى على معايير التحدي. يسجل الوضع 93.8% على GPQA Diamond (مقابل 91.9% العادي)، و 41.0% على Humanity’s Last Exam (مقابل 37.5%)، وسيكون متاحًا لمشتركين AI Ultra في الأسابيع القادمة.

منصة Antigravity تُحول سير عمل المطورين

أطلقت Google Antigravity، وهي منصة تطوير وكيلية مدعومة من Gemini 3، مما يُمكن الوكلاء المستقلين من العمل عبر محررات التعليمات البرمجية والطرفيات والمتصفحات في نفس الوقت. وتُشكل المنصة تحولًا من المساعدة التقليدية القائمة على الأدوات إلى نماذج تعاونية حيث يتحمل الوكلاء مسؤوليات تطويرية كبيرة.

تستخدم Antigravity عدة نماذج ذكاء اصطناعي، بما في ذلك Gemini 3 Pro كمحرك استدلال رئيسي، و Gemini 2.5 Computer Use للتحكم في المتصفح، و Nano Banana (Gemini 2.5 Image) لتحرير الصور. يمكن للوكلاء التخطيط والتنفيذ المستقلين لمهام التطوير المعقدة مع التحقق من صحة كودهم قبل تقديم النتائج.

تُشحن المنصة “vibe coding،” حيث يُصبح النص الطبيعي بنية أساسية. يمكن للمطورين ترجمة الأفكار الإبداعية عالية المستوى إلى تطبيقات تفاعلية كاملة مع محفزات فردية، دون تحديد تفاصيل التنفيذ. وتدعم هذه الوظيفة درجات التطوير الويب الاستثنائية لجيميني 3.

يُدير الوكلاء في Antigravity بناء الميزات وتكرار الواجهة وتصحيح الأخطاء وأبحاث الحلول وتوليد التقارير بشكل مستقل. وتتوفر المنصة لمعاينة عامة مجانية عبر Mac و Windows و Linux، مع دعم التكامل لـ Cursor و GitHub و JetBrains و Manus و Cline.

التكامل المؤسسي وتأثير السوق

يُتوفر Gemini 3 Pro لمشتركين Google AI Ultra ومستخدمي واجهة برمجة تطبيقات Gemini المدفوعة. ويتضمن النموذج مباشرة في Google Search، وصولًا إلى 2 مليار مستخدم شهري لملخصات الذكاء الاصطناعي من Google، وفقًا لما صرّح به الرئيس التنفيذي سوندار بيتشاي. ويمكن لعمليات النشر المؤسسية الوصول إلى النموذج من خلال Google AI Studio و Vertex AI.

تُستلم تطبيق Gemini تحديثات تتميز بواجهات جديدة وقدرات وكيلية محسّنة مصممة خصيصًا لجيميني 3. وتُضع هذه التحسينات Google في مواجهة مع مساعدي الذكاء الاصطناعي المنافسين، مع الاستفادة من قنوات التوزيع السائدة للشركة.

تُشدد استراتيجية الإطلاق على اعتماد المطورين وتحويله إلى مؤسسات، مع تسعير وأداء يستهدف العملاء المؤسسين. وتُشير مجموعة السجلات الكاسحة وقدرات الترميز المستقلة وتكامل النظام البيئي الواسع إلى عزم الشركة على الحفاظ على التموقع التنافسي مع تقارب قدرات نماذج الذكاء الاصطناعي عبر المزودين الرئيسيين.

ويأتي الإطلاق بعد حوالي 11 شهرًا من جيميني 2.0، وهو تقلص كبير لجدول إطلاق Google مع تصاعد المنافسة في صناعة الذكاء الاصطناعي.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.