يقال إن جوجل تعمل على تطوير كبير لمساعدها الاصطناعي Gemini الذي يمكن أن يحوله من كونه مساعدًا للمحادثة في المقام الأول إلى شيء أقرب إلى وكيل عمل واقعي. في عملية تفكيك تجريبية حديثة لكود تطبيق Google بواسطة 9to5Googleاكتشف المطورون سلاسل تشير إلى ميزة تُعرف داخليًا باسم “أتمتة الشاشة”. وتشير إلى أن Gemini قد تتخذ قريبًا إجراءات مباشرة نيابة عنك داخل بعض تطبيقات Android، مثل تقديم الطلبات أو حجز الرحلات، دون مطالبة المستخدم بالنقر يدويًا عبر الشاشات.

وبينما يقوم Gemini بالفعل بتشغيل مهام المحادثة مثل صياغة رسائل البريد الإلكتروني أو إنشاء خطط بحثية، يبدو أن هذه الترقية مهيأة للسماح له بالتفاعل حرفيًا مع واجهات التطبيق، والنقر على الأزرار والتنقل بين الشاشات لإنهاء المهام التي تقوم بها عادةً بنفسك. تشير الأدلة المبكرة من الإصدار التجريبي إلى أن هذه القدرات ستقتصر في البداية على عدد قليل من التطبيقات المدعومة وستؤكد على إشراف المستخدم، مع تحذير جوجل من أن “جيميني يمكن أن يرتكب أخطاء” وأن المستخدمين يظلون مسؤولين عن الإجراءات المتخذة نيابة عنهم.
كيف تنقل هذه الترقية الذكاء الاصطناعي من المساعد إلى الوكيل
يعد المفهوم الكامن وراء أتمتة الشاشة خطوة رئيسية نحو منح الذكاء الاصطناعي مزيدًا من الاستقلالية في سير العمل الرقمي اليومي. بدلاً من مجرد اقتراح ما يمكنك فعله، قد يقوم Gemini قريبًا بتنفيذ هذه الاختيارات مباشرةً داخل التطبيقات نيابةً عنك. تشير سلاسل التعليمات البرمجية المبكرة من الإصدار التجريبي من Google أيضًا إلى احتياطات الخصوصية، مثل نصح المستخدمين بعدم إدخال معلومات تسجيل الدخول أو الدفع في محادثات الذكاء الاصطناعي والتحذير من إمكانية مراجعة لقطات الشاشة لتحسين الميزة. تقدم Google بالفعل بعض إمكانيات الوكيل من خلال منصة Gemini Agent الخاصة بها في Workspace والويب، حيث يمكن للذكاء الاصطناعي التعامل مع سير العمل المعقد والتنسيق عبر الخدمات، ولكن أتمتة الشاشة يمكن أن تجلب هذه القدرات مباشرة إلى الهواتف الذكية والاستخدام اليومي للتطبيقات.

إذا تم طرح هذه الميزات على نطاق واسع، فقد يمثل ذلك تحولًا في كيفية تفاعل الأشخاص مع الأجهزة المحمولة، من النقر والتمرير على أنفسهم إلى منح أدوات الذكاء الاصطناعي الإذن بالتصرف نيابة عنهم. وهذا قد يجعل الأعمال الروتينية اليومية أسهل، ولكنه يثير أيضًا تساؤلات حول التحكم والأمن والرقابة، خاصة عندما تمس الأتمتة مهام حساسة مثل الحجوزات أو الأوامر المالية.
يقال إن جوجل تضع هذه الترقيات على أنها اختيارية وخاضعة للإشراف، مما يسمح للمستخدمين بإيقاف Gemini أو تجاوزه في أي وقت. في الوقت الحالي، لا تزال ميزة أتمتة الشاشة قيد التطوير ولم تصل بعد إلى إصدارات مستقرة.

التعليقات