لقد وعدتنا شركة Apple بتقديم Siri أكثر ذكاءً وقدرة في مؤتمر WWDC 2024. وكان العرض مقنعًا: Siri الذي يفهم سياقك الشخصي، ويبحث في رسائلك ورسائل بريدك الإلكتروني، وينفذ إجراءات داخل تطبيقاتك، ويتطور ليصبح مساعدًا حقيقيًا.
وبعد مرور عامين، لا يزال هذا الحلم حلما. ولكن هنا الشيء الذي قد يغير مسار مساعد أبل. وفقًا للتقارير، لم يعد Siri مرتبطًا بعقل واحد يعمل بالذكاء الاصطناعي. تعمل Apple على تصميمه ليكون مرنًا وقادرًا على توجيه الطلبات إلى أي طراز خارجي يقوم بالمهمة بشكل أفضل.
وهذا جعلني أطرح سؤالاً. إذا كان بإمكان Siri استخدام أي ذكاء اصطناعي، فما هو الذكاء الاصطناعي الذي يجب أن يستخدمه؟ النموذج الخارجي الافتراضي حاليًا هو ChatGPT. لكنني أزعم أن الجوزاء هو الخيار الأكثر منطقية، وهذا هو السبب.
سيري هو محرك بحث
فكر في كيفية استخدامك لـ Siri فعليًا بشكل يومي. أنت تسأل عن الطقس اليوم. أنت تسأل عن أقرب المطاعم القريبة منك. تطلب منه البحث عن الأشياء على الويب. يتضمن جزء كبير من استخدام Siri عمليات بحث أو استعلامات شبيهة بالبحث، ولا توجد شركة على هذا الكوكب تقوم بالبحث بشكل أفضل من Google.

لقد أمضت جوجل عقودًا من الزمن في بناء أقوى محرك بحث، وتتدفق هذه الخبرة الآن مباشرةً إلى برج الجوزاء. عندما تسأل برج الجوزاء شيئًا ما، فهو لا يستمد فقط من نموذج اللغة. فهو يستخرج البيانات من فهرس الويب في الوقت الفعلي لـ Google، وخرائط Google، وGoogle Shopping، والمزيد.

سيؤدي استخدام ذلك لتشغيل قدرة بحث Siri إلى الارتقاء إلى آفاق جديدة لا يمكن لأي موفر LLM آخر أن يضاهيها.
لقد وعدت شركة أبل بالذكاء الشخصي، لكن برج الجوزاء يحقق ذلك
كانت إحدى أكبر نقاط الحديث في إعلان Apple عن مؤتمر WWDC 2024 هي الذكاء الشخصي. عرضت شركة Apple على Siri معلومات سياقية من خلال تطبيقاتك، وأجاب على أسئلة مثل “متى تهبط رحلة أمي؟” أو “أرني صور ستايسي في معطفها الوردي من نيويورك.”

لقد كان مثيرًا للإعجاب حقًا في شكل تجريبي. ومع ذلك، إذا طلبت منه أن يريني صورة لي وأنا أرتدي قميصًا أسود، فإنه يعرض صورًا عشوائية لأشخاص من الويب يرتدون قمصانًا سوداء. أنا لا أبالغ عندما أقول إن ميزة الذكاء الشخصي في سيري كانت فاشلة ذريعاً.

وفي الوقت نفسه، طرحت شركة Gemini بهدوء ميزة الذكاء الشخصي الخاصة بها. فهو ينقر على Gmail، والتقويم، وصور Google، وDrive، والمزيد للتفكير في بياناتك الشخصية والإجابة على الأسئلة المعقدة المتعلقة بسياق الحياة. إنها ليست مثالية، لكنها على الأقل تعمل.

وهذا تقريبًا ما كانت شركة Apple تعرضه حرفيًا كقدرة مستقبلية لـ Siri، باستثناء أن Gemini تفعل ذلك اليوم. إذا أرادت شركة Apple تسريع عملية تقديم هذه الميزات للمستخدمين، فقد يكون Gemini هو الاختصار الذي يحتاجون إليه.
الجوزاء يفعل بالفعل ما وعد به سيري
تنشر Apple Intelligence نموذجًا مدمجًا وقويًا للذكاء الاصطناعي عبر تطبيقات النظام، وتجمع بين المعالجة على الجهاز لتحقيق الخصوصية مع الحوسبة السحابية للقيام بمهام أكثر تطلبًا. إن جوانب المعالجة والخصوصية على الجهاز هي ما يميز Apple عن المنافسة. لكنها ليست وحدها الآن.

تقوم Gemini Nano بذلك بالفعل على أجهزة Pixel وSamsung Galaxy. فهو يدعم التلخيص دون الاتصال بالإنترنت، والردود الذكية، والميزات السياقية، كل ذلك دون الحاجة إلى اتصال بالإنترنت. في هواتف Pixel 9 والإصدارات الأحدث، يعد Gemini Nano متعدد الوسائط ويمكنه معالجة الصور والنصوص واللغات مباشرة على الجهاز.

تعمل شركة Apple على بناء ما قامت Google بشحنه بالفعل. وبدلاً من إعادة اختراع هذه العجلة، فإن استخدام نشر Nano الموجود في Gemini كأساس لميزات Siri على الجهاز من شأنه أن يوفر على Apple الكثير من الصداع والمال.
مجموعة أدوات Gemini الإبداعية مليئة
هنا يصبح الأمر مثيرًا حقًا. الجوزاء ليس مجرد نموذج نصي. إنه يأتي مع نظام بيئي إبداعي كامل يمكن لشركة Apple الاستفادة منه.
يتعامل Veo مع إنشاء فيديو بدقة تصل إلى 1080 بكسل، بأنماط ومقاطع سينمائية أطول من دقيقة. تتولى Lyria، من Google DeepMind، عملية توليد الموسيقى والصوت. بالنسبة للصور، تلقت Nano Banana (خدمة إنشاء الصور من Google) مؤخرًا ترقية كبيرة، مع تحسين عرض النص واتساق الموضوع ودعم أي نسبة عرض إلى ارتفاع.

أطلقت Apple مؤخرًا Creator Studio الخاص بها، مما يتيح للمستخدمين الوصول إلى الأدوات الإبداعية مقابل اشتراك شهري ثابت. إذا كانت الشركة جادة في التنافس مع أمثال أدوبي، فإنها تحتاج إلى تقديم قدرات إنتاجية. خمن ماذا، تمتلك Gemini بالفعل كل هذه القدرات، وسيكون من المنطقي تمامًا دمجها في مجموعة Apple الإبداعية.

الشراكة موجودة بالفعل
لم تتم مناقشة هذه النقطة بما فيه الكفاية. يقال إن جوجل تدفع لشركة أبل حوالي 20 مليار دولار سنويًا لتظل محرك البحث الافتراضي في Safari. هذه واحدة من صفقات التوزيع الأكثر قيمة في تاريخ التكنولوجيا. العلاقة بين أبل وجوجل عميقة وطويلة الأمد وضخمة ماليًا لكلا الشركتين.
إن توسيع هذه العلاقة من “جوجل يدعم بحث سفاري” إلى “جيميني يدعم ميزات الذكاء الاصطناعي لسيري” لا يشكل قفزة هائلة. إنه تطور طبيعي للشراكة التي تدير نصف ما يحدث عندما تفتح متصفحًا على جهاز iPhone الخاص بك.
إذن ما هو النموذج الذي سألتزم به؟
يعد كلود ممتازًا لقراءة السياق الطويل والتفكير الدقيق. يتمتع ChatGPT بنظام بيئي ضخم وأدوات قوية للتشفير والوكلاء. كلاهما يعمل بشكل رائع كمتخصصين يختارهم المستخدم. أنا شخصياً أستخدم كلود على جهاز الكمبيوتر الخاص بي.
ولكن كمحرك افتراضي تحت غطاء سيري؟ إنهم ليسوا الاختيار الصحيح. يعمل Gemini على مستوى نظام التشغيل على الهاتف المحمول، ويفهم عمليات البحث والسياقات الشخصية، ويوجد في شكل عامل Nano على الجهاز، ويقع في قلب العلاقة التجارية الأكثر أهمية التي تربط Apple مع أي شركة تقنية.
القطع كلها هناك. إنها ليست مسألة ما إذا كان بإمكان الجوزاء تشغيل سيري أكثر ذكاءً. إنها مسألة ما إذا كان بإمكان شركتي جوجل وأبل التوصل إلى صفقة متبادلة المنفعة. وإذا كانت هناك شائعات، فقد تسير الأمور في هذا الاتجاه بالفعل.

التعليقات