أعلنت Nvidia عن نظام يعمل عن طريق الذكاء الصنعي لمؤتمرات الفيديو Nvidia Maxine تدعي أنها تستطيع إصلاح بعض المشاكل الأكثر شيوعًا في مكالمات الفيديو.
سيعالج نظام Maxine المكالمات في السحابة باستخدام وحدات معالجة الرسومات من Nvidia ويعزز جودة الاتصال بعدة طرق بمساعدة الذكاء الصنعي.
باستخدام الذكاء الصنعي، يمكن لـ Maxine إعادة تنظيم وجوه المتصلين ونظراتهم بحيث ينظرون دائمًا مباشرة إلى الكاميرا الخاصة بهم. ويقلل متطلبات النطاق الترددي للفيديو “إلى عُشر متطلبات معيار ضغط الفيديو المتدفق H.264” فقط. وذلك عن طريق نقل “نقاط الوجه الرئيسية” ورفع مستوى دقة مقاطع الفيديو.
تشمل الميزات الأخرى المتوفرة في Maxine إعادة إضاءة الوجه ، والترجمة والنسخ في الوقت الفعلي ، والصور الرمزية المتحركة.
تأمل Nvidia بلا شك أن نفوذها في الحوسبة السحابية وعملها المثير للإعجاب في البحث والتطوير بالذكاء الاصطناعي سيساعدها على التفوق على منافسيها.
ومع ذلك ، فإن الاختبار الحقيقي هو معرفة ما إذا كانت أي من شركات مؤتمرات الفيديو الكبيرة ستتبنى تقنية Nvidia.
Maxine ليست منصة للمستهلكين ولكنها مجموعة أدوات لشركات الطرف الثالث لتحسين برامجها الخاصة. لم تعلن Nvidia حتى الآن عن أي شركاء سيستخدمون Maxine في المستقبل. على الرغم من أنها تدعي أنها “قيد المناقشة” مع العديد منهم.
تقول Nvidia إن ميزة الضغط الخاصة بها تستخدم طريقة الذكاء الصنعي المعروفة باسم شبكات الخصومة التوليدية أو شبكات GAN لإعادة بناء وجوه المتصلين جزئيًا في السحابة.
قالت الشركة في منشور على مدونة: “بدلاً من دفق شاشة البكسل بأكملها ، يحلل برنامج الذكاء الاصطناعي نقاط الوجه الرئيسية لكل شخص في مكالمة ثم يعيد بذكاء تحريك الوجه في الفيديو على الجانب الآخر. هذا يجعل من الممكن بث الفيديو مع تدفق بيانات أقل بكثير ذهابًا وإيابًا عبر الإنترنت.”