
- تقول Sarvam AI إن نموذج Sarvam Vision الخاص بها يتفوق على Gemini وChatGPT في معايير التعرف الضوئي على الحروف الرئيسية
- تركز الشركة الناشئة على جميع اللغات الهندية الرسمية البالغ عددها 22 لغة
- ويهدف نهج “الذكاء الاصطناعي السيادي” الذي تتبعه إلى بناء تكنولوجيا مصممة خصيصا لتلبية احتياجات الهند
غالبًا ما تكون روبوتات الدردشة ChatGPT وGemini وغيرها من برامج الدردشة الآلية جيدة جدًا في قراءة اللغة الإنجليزية والعديد من اللغات الأخرى، ولكن على الرغم من قدرتها على ترجمة اللغة الهندية، إلا أنها تبدأ في التذبذب عندما تواجه نصوصًا أكثر تعقيدًا أو فروقًا إقليمية دقيقة بين اللغات الهندية.
الآن، تتقدم شركة ناشئة في بنغالورو تدعى Sarvam AI بنماذج تقول إنها يمكن أن تتفوق على المنافسين العالميين عندما يتعلق الأمر بالتعرف البصري على الحروف (OCR) والكلام متعدد اللغات، خاصة عندما يتعلق الأمر بألسنة شبه القارة الهندية.
بالنسبة للغات الهندية، يعد Sarvam Vision هو النموذج الأفضل على الإطلاق، مع دعم جميع اللغات الهندية المجدولة البالغ عددها 22 pic.twitter.com/nM4Ujz0wvP5 فبراير 2026
تم تصميم طرازي Sarvam Vision وBulbul V3 مع أخذ التعقيد اللغوي الهندي في الاعتبار. يستطيع Sarvam Vision تفسير الجداول المعقدة، وفهم المخططات، والتعرف على النص في مشاهد العالم الحقيقي، وإنشاء التسميات التوضيحية، بينما يتعامل Bulbul V3 مع نظام تحويل النص إلى كلام. إنهم يدعمون جميع اللغات الهندية الرسمية البالغ عددها 22 لغة.
بفضل 35 صوتًا، يستطيع بلبل أن يبدو دائمًا وكأنه أحد السكان المحليين. كما يعلم العديد من المستخدمين متعددي اللغات، فإن الإحراج المتمثل في سماع لغتهم تنطق كما لو كانت لغة قريبة من اللغة الإنجليزية يمكن أن يجعل الشخص مترددًا في تجربة هذه التكنولوجيا. إن نموذج تحويل النص إلى كلام المدرب جيدًا والذي يلتقط الإيقاع والنبرة بدقة أكبر يمكن أن يجعل الناس يشعرون براحة أكبر عند استخدامه.
وعلى الرغم من أن تقنية التعرف الضوئي على الحروف (OCR) قد لا تبدو رائعة، إلا أنها تعمل بهدوء على تشغيل كل شيء بدءًا من مسح مستند ضوئيًا بهاتفك، أو تحميل ملف PDF، أو تحويل سجل قديم إلى صيغة رقمية. يمكن أن تكون الأحرف المشوهة والأسماء الخاطئة والسياق المفقود مشكلة حقيقية. يقول Sarvam إنه سيساعد أصحاب الأعمال الصغيرة والمكاتب الحكومية على تحويل السجلات إلى أرشيفات قابلة للبحث بشكل أسرع وأكثر دقة من الممكن.
الذكاء الاصطناعي السيادي
تطلق شركة Sarvam AI على نفسها اسم منشئ الذكاء الاصطناعي السيادي. والفكرة هي تمييز نفسها عن المنصات الأجنبية. ومع انتشار نماذج الذكاء الاصطناعي في مختلف قطاعات الحكومة وقطاع الأعمال والتعليم، أصبحت الأسئلة المتعلقة بمن يبنيها ومن يفهم بياناته ذات أهمية كبيرة. يريد Sarvam الحصول على أدوات مصممة خصيصًا للهند.
كما أن ظهور سارفام أثار نقاشاً أوسع نطاقاً حول مصدر الابتكار. غالبًا ما تم تأطير طفرة الذكاء الاصطناعي على أنها سباق بين عدد قليل من اللاعبين المهيمنين. ومع ذلك، تأتي الإنجازات بشكل متزايد من خلال فرق مركزة تعمل على حل مشكلات محددة. يبدو أن سارفام قد حدد فجوة في أنظمة التعرف الضوئي على الحروف وأنظمة الكلام عالية الجودة والغنية باللغات للنصوص الهندية.
لا شك أن المعايير هي مجرد لقطات وليست ضمانات للأداء، وخاصة في العالم الحقيقي. والدليل على تأثير سارفام سوف يكمن في التبني. بالإضافة إلى ذلك، إذا صحت ادعاءات سارفام، فستشعر شركات الذكاء الاصطناعي الكبرى بالضغط لتحسين دعمها لمزيد من اللغات والنصوص.
في أفضل حالاتها، تتجاوز قصة Sarvam AI مجرد التغلب على Gemini أو ChatGPT على لوحة المتصدرين وتصبح وسيلة لعرض التكنولوجيا التي تعكس الأشخاص الذين يستخدمونها. إذا كان الذكاء الاصطناعي سيشكل العقد القادم من الحياة الرقمية، فسوف يحتاج إلى التحدث بالعديد من اللغات بطلاقة وقراءة أكثر من مجرد نص باللغة الإنجليزية.
ويراهن سارفام على أن الاهتمام بالتفاصيل والخصوصية الثقافية يمكن أن ينافس الحجم الهائل. بالنسبة لملايين المستخدمين الذين شعروا بعدم حصولهم على خدمات كافية من أدوات الذكاء الاصطناعي السائدة، قد يبدو هذا الرهان أمرًا أكيدًا.
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

التعليقات