جوجل تطلق Gemini 3.5 Live Translate للترجمة الفورية للكلام بواسطة Investing.com
Investing.com – أعلنت شركة جوجل اليوم عن إطلاق نموذج Gemini 3.5 Live Translate، وهو نموذج صوتي يتيح ترجمة فورية شبه آنية من كلام إلى كلام عبر أكثر من 70 لغة. يكتشف النموذج اللغات تلقائياً ويولّد الكلام المترجم مع الحفاظ على نبرة المتحدثين وإيقاعهم وطبقة أصواتهم.
يولّد Gemini 3.5 Live Translate الكلام بشكل متواصل دون انتظار انتهاء المتحدث قبل الاستجابة، إذ يبقى متأخراً بضع ثوانٍ عن المتحدث طوال الجلسة. يعالج النموذج الكلام أثناء بثه ويتعامل مع المدخلات متعددة اللغات دون الحاجة إلى إعداد يدوي. وأكدت جوجل أن قدرة النموذج على تحمّل الضوضاء تتيح له العمل في البيئات الصاخبة وغير المتوقعة.
يُطرح النموذج اليوم عبر منتجات جوجل المختلفة، بما في ذلك معاينة عامة للمطورين عبر Gemini Live API وGoogle AI Studio، ومعاينة خاصة للمؤسسات في Google Meet بدءاً من هذا الشهر، فضلاً عن إتاحته عبر Google Translate على نظامَي Android وiOS. كما تعمل منصات المطورين بما فيها Agora وFishjam وLiveKit وPipecat وVision Agents على دمج هذه التقنية لتمكين تطبيقات الترجمة الصوتية.
تختبر شركة Grab النموذج لتمكين التواصل متعدد اللغات بين السائقين والمسافرين عند نقاط الاستقلال. ويُجري مستخدمو الشركة أكثر من 10,000,000 مكالمة صوتية شهرياً عبر Grab. وقال فيليب كاندال، المدير التنفيذي للمنتجات في Grab، إن الشركة تُقدّر قدرة النموذج على الكشف التلقائي عن لغات متعددة وترجمة الكلام بدقة مع زمن استجابة منخفض.
سيستخدم Google Meet نموذج 3.5 Live Translate لترجمة الكلام، مما يوفر دعماً لأكثر من 70 لغة مقارنةً بالحد السابق البالغ خمس لغات، مما يتيح إجراء محادثات عبر أكثر من 2,000 تركيبة لغوية في اجتماع واحد. ويحمل جميع الصوت الذي يولّده النموذج علامة مائية من خلال SynthID، وهي علامة مائية غير محسوسة مُدمجة في المخرجات الصوتية للمساعدة في منع انتشار المعلومات المضللة.
هذه المقالة مترجمة بمساعدة برنامج ذكاء اصطناعي وخضعت لمراجعة أحد المحررين.. لمزيد من التفاصيل يُرجى الرجوع للشروط والأحكام الخاصة بنا



