جوجل تطلق Gemini Omni — نموذج الذكاء الاصطناعي الذي يفهم العالم ويصنع الفيديو بالمحادثة
مقدمة: حين يرى الذكاء الاصطناعي العالم كما نراه
تخيل أنك تجلس أمام شاشتك، تُشغّل مقطع فيديو لمنزلك المفضل، ثم تقول بكل بساطة: "حوّل هذا الكرسي إلى قطعة مصنوعة من الزجاج السائل، مع الحفاظ على الإضاءة الطبيعية والظلال." ثم تُشاهد وأنت ذاهل كيف يتحول الكرسي أمام عينيك تماماً كما طلبت، بينما يبقى كل شيء آخر في المشهد على حاله.
هذا ليس خيالاً علمياً بعد الآن. هذا ما يفعله Gemini Omni، أحدث وأجرأ ما كشفت عنه جوجل في مؤتمر Google I/O 2025. لكن ما يجعل هذا النموذج استثنائياً ليس قدرته على توليد الفيديو فحسب — بل هو الطريقة التي يفهم بها العالم من حوله.
ما هو Gemini Omni؟ وما معنى "World Model"؟
معظم نماذج الذكاء الاصطناعي التي نعرفها متخصصة: هذا النموذج للنصوص، وذاك للصور، وآخر للأصوات. لكن البشر لا يفهمون العالم بهذه الطريقة. حين نجلس في حديقة، نسمع صوت الريح ونرى الأوراق تتحرك ونشم الهواء ونقرأ الكتاب أمامنا — كل ذلك في آنٍ واحد، ونفهمه كوحدة متكاملة.
جوجل صممت Gemini Omni لكي يفكر بنفس الطريقة. ولهذا أطلقت عليه اسم World Model أو "نموذج فهم العالم".
بشكل عملي، هذا يعني أن Gemini Omni يستطيع:
فهم ومعالجة كل هذه المدخلات في وقت واحد: النص المكتوب، والصور الثابتة، ومقاطع الفيديو المتحركة، والمحادثات الصوتية — لا يعالجها كل واحدة على حدة، بل يقرأها جميعاً معاً ويفهم العلاقات بينها.
إنتاج مخرجات بكل هذه الأشكال: يمكنه أن يرد عليك بنص، أو يولّد صورة، أو يُنشئ مقطع فيديو كامل، أو يُعدّل فيديو موجود — كل ذلك بناءً على ما تطلبه بكلماتك العادية.
الفرق الجوهري عن كل ما سبق هو أن Gemini Omni لا يُترجم طلبك إلى أوامر تقنية — بل يفهم المعنى الحقيقي وراء الطلب، ويُنفّذه بوعي بالسياق المحيط.
الميزة التي غيّرت كل شيء: التعديل بالمحادثة
لو سألتني ما هو الشيء الذي ميّز Gemini Omni عن كل ما جاء قبله، سأقول لك دون تردد: التعديل بالمحادثة أو ما تسميه جوجل Conversational Editing.
كيف تعمل هذه الميزة؟
الطريقة التقليدية للتعامل مع برامج تحرير الفيديو تتطلب منك أن تتعلم أدوات معقدة، تفهم طبقات الترتيب، تعرف كيف تعزل عنصراً عن آخر، وتُجري عشرات التعديلات اليدوية للحصول على نتيجة واحدة.
Gemini Omni يُلغي كل هذا التعقيد. إليك كيف يعمل:
أنت تُشغّل مقطع فيديو أمام النموذج. تُشير بأصبعك — حرفياً — إلى عنصر معين في الفيديو. ثم تقول له بلغتك العادية ما تريده. والنموذج يُنفّذ.
أمثلة حقيقية من المؤتمر:
المثال الأول — تحويل المواد: في عرض المؤتمر، أشار أحد المقدمين إلى تمثال في مقطع فيديو وقال: "اجعل هذا التمثال مصنوعاً من الفقاعات." والنتيجة كانت مذهلة — تحول التمثال إلى كتلة من الفقاعات المتلألئة، مع الحفاظ التام على شكله الأصلي وحركة الكاميرا والإضاءة الطبيعية.
المثال الثاني — احترام قوانين الفيزياء: ما يُدهشك ليس مجرد التحويل البصري، بل أن Gemini Omni يفهم الفيزياء. حين تطلب منه تحويل سائل إلى مادة أخرى، يعلم كيف تتصرف تلك المادة تحت الجاذبية، كيف تنعكس عليها الأضواء، كيف تتفاعل مع ما حولها. الفقاعات تتحرك كما تتحرك الفقاعات حقاً، لا كما تبدو في رسوم متحركة ساذجة.
المثال الثالث — الحفاظ على الأشخاص: حين يكون في المشهد أشخاص يتحركون، يُعدّل Gemini Omni ما طُلب منه تعديله، مع الحفاظ الكامل على حركة هؤلاء الأشخاص وتصرفاتهم. الفيديو يبقى متماسكاً ومنطقياً، لا يبدو مُلصَّقاً أو مُعدَّلاً بشكل مصطنع.
من يمكنه استخدام Gemini Omni الآن؟
جوجل أطلقت النموذج على مراحل مدروسة، وإليك الصورة الكاملة:
للمشتركين في الخطط المدفوعة: النسخة الأولى Gemini Omni Flash متاحة الآن للمشتركين في خطط Gemini المدفوعة. هذه النسخة تمنحك الوصول الكامل لقدرات التعديل بالمحادثة وتوليد الفيديو.
للجمهور العام — مجاناً عبر يوتيوب: هنا الخبر الذي سيغير حياة ملايين صانعي المحتوى: جوجل أعلنت أن Gemini Omni سيكون متاحاً مجاناً هذا الأسبوع في منصتين:
الأولى هي YouTube Shorts، المنصة التي تضم مئات الملايين من المستخدمين يومياً والتي باتت تُنافس TikTok بقوة. المستخدمون سيتمكنون من استخدام Gemini Omni مباشرة لإنشاء ريمكس ذكية ومبتكرة على مقاطع Shorts الموجودة.
والثانية هي YouTube Create، تطبيق جوجل المخصص لصانعي المحتوى، حيث ستتوفر أدوات التعديل المدعومة بـ Gemini Omni لتحويل المقاطع العادية إلى محتوى احترافي لافت للنظر.
لماذا يُعدّ هذا تحولاً حقيقياً في صناعة المحتوى؟
إزالة الحواجز أمام الإبداع
حتى الآن، لإنتاج فيديو عالي الجودة مع تأثيرات بصرية مميزة، كنت بحاجة إلى إما ميزانية ضخمة لتوظيف متخصصين، أو سنوات من التعلم على برامج معقدة مثل After Effects وPremiere. Gemini Omni يُحوّل هذه المعادلة رأساً على عقب — الفكرة الجيدة وبضع كلمات باللغة العادية تكفي لإنتاج محتوى كان يستغرق أسابيع من العمل.
ثورة في محتوى يوتيوب وشورتس
مع وصول Gemini Omni إلى YouTube Shorts وYouTube Create، نحن على أعتاب موجة جديدة من المحتوى الرقمي. المبدعون الذين كانوا يحلمون بأفكار كبيرة لكنهم يفتقرون للأدوات التقنية، سيجدون الآن في أيديهم قدرات كانت حكراً على الاستوديوهات الكبرى.
التأثير على الصناعة الإبداعية
لا يمكن الحديث عن هذه الثورة دون الإشارة إلى الجانب الآخر من الصورة: تأثير هذه التقنية على المصممين والمونتيرين والمؤثرات البصرية التقليدية. الصناعة ستتغير بالتأكيد، لكن التاريخ يُعلّمنا أن كل ثورة تقنية تُغلق بعض الأبواب وتفتح أبواباً أخرى أوسع وأكثر تنوعاً.
مقارنة Gemini Omni بالمنافسين
| الميزة | Gemini Omni | Sora (OpenAI) | Runway ML |
|---|---|---|---|
| التعديل بالمحادثة | نعم — ثوري | محدود | نعم لكن أبطأ |
| فهم الفيزياء الواقعية | ممتاز | جيد جداً | متوسط |
| الدمج مع منصات المحتوى | يوتيوب مباشرة | لا يوجد | لا يوجد |
| التوفر المجاني | نعم عبر يوتيوب | لا | لا |
| معالجة متعددة الوسائط | صوت+صورة+فيديو+نص | نص+فيديو فقط | فيديو+نص |
ماذا يعني هذا للمستقبل القريب؟
الإعلان عن Gemini Omni يُلمّح إلى مستقبل ليس بعيداً، حيث:
صانع المحتوى الفردي سيتمكن من إنتاج أفلام قصيرة ذات جودة سينمائية من غرفته. المعلمون سيصنعون مواد تعليمية تفاعلية بالكلام وبضع لقطات. الشركات الصغيرة ستُنتج إعلانات احترافية بتكلفة لا تُذكر. والمبدعون في كل مكان سيجدون أن القيود التقنية لم تعد عائقاً بين فكرتهم والعالم.
الخلاصة: بداية حقبة جديدة
Gemini Omni ليس مجرد أداة جديدة تُضاف إلى قائمة أدوات الذكاء الاصطناعي الطويلة. إنه يُمثّل نقلة فلسفية في كيفية تفاعل الذكاء الاصطناعي مع العالم ومع البشر.
حين يستطيع نموذج ما أن يفهم فيديو بكل تفاصيله الفيزيائية والبصرية والصوتية، وأن يُجري عليه تعديلات محادثاتية طبيعية مع احترام قوانين الفيزياء والحفاظ على تماسك المشهد — فنحن لسنا أمام تطور تدريجي، بل أمام قفزة حقيقية نحو ذكاء اصطناعي يفهم العالم فعلاً.
مع انتشاره المجاني عبر يوتيوب هذا الأسبوع، ستكون تجربته بيدك أنت. وهذا ربما هو أروع ما في الأمر.
الوسوم: Gemini Omni · Google AI · World Model · توليد فيديو · YouTube Shorts · Google I/O 2025 · ذكاء اصطناعي · تعديل فيديو

