تُعد تقنية النماذج اللغوية الصوتية الكبيرة على الأجهزة المتنقلة من أحدث الابتكارات التي حققتها HONOR في هاتفها Magic V5 الدولي، حيث جمعت بين الأداء العالي والخصوصية في معالجة الكلام المتعدد اللغات والترجمة الفورية دون الحاجة للسحابة الخارجية، ما يغير قواعد اللعبة في تكنولوجيا الذكاء الاصطناعي الصوتي على الأجهزة.
حلول تقنية النماذج اللغوية الصوتية الكبيرة على الأجهزة: مواجهة تحديات الخصوصية والأداء
غالبًا تعتمد تقنيات الترجمة الصوتية التقليدية على السحابة الإلكترونية، وهذا يثير قلق المستخدمين بشأن حماية خصوصيتهم خاصةً في المكالمات الحساسة؛ في المقابل، تقدم النماذج اللغوية الصوتية الكبيرة على الأجهزة من HONOR حلاً مبتكرًا يتخطى هذه العقبات. فبدلًا من الاعتماد على اتصال خارجي، يتيح النظام أداء مضاهياً للخدمات السحابية مباشرة على الهاتف نفسه؛ مما يعزز الخصوصية بشكل واضح، فضلًا عن تحقيق سرعة استجابة ودقة عالية في التعرف على الكلام. وعلى عكس الحلول القديمة التي تضعف الأداء بسبب قيود الموارد المخصصة للهاتف المحمول، نجحت HONOR في دمج الذكاء الاصطناعي المتقدم مع تحسينات تقنية تؤمن سرعة وكفاءة لا تضاهى.
الاستفادة القصوى من النماذج اللغوية الصوتية الكبيرة على الأجهزة: تقليل استهلاك الذاكرة والزيادة في سرعة الترجمة
تميزت تقنية HONOR الجديدة في مجالات استخدام الذاكرة والتشغيل السلس، حيث نجحت في تقليص حجم الذاكرة المستخدمة من بين 3 إلى 4 جيجابايت إلى قرابة 800 ميجابايت فقط، أي بخفض نحو 75% من مساحة التخزين المطلوبة. كما تم دمج 6 حزم لغوية متعددة تتضمن العربية، الصينية، الإنجليزية، الألمانية، الفرنسية، الإسبانية، والإيطالية في حزمة واحدة بدلًا من تحميل ستة حزم منفصلة بحجم 500 ميجابايت لكل منها، ما يوفر أكثر من 2.78 جيجابايت من المساحة. والأهم من ذلك، أن الترجمة الفورية تتم “أثناء التحدث”، حيث تقفز سرعة الاستنتاج بنسبة 38% مع تحسين دقة الترجمة بنسبة 16%، مما يتيح تواصلاً فوريًا وأكثر طبيعية دون انتظار انتهاء الجملة أو العبارة.
تسليط الضوء على أبحاث النماذج اللغوية الصوتية الكبيرة على الأجهزة في مؤتمر INTERSPEECH 2025
سلطت أوراق HONOR البحثية المعتمدة في مؤتمر INTERSPEECH 2025 الضوء على الإنجازات التقنية لتقنية النماذج اللغوية الصوتية الكبيرة على الأجهزة، حيث تناول البحث الأول “MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition” تطوير متنبئ يجمع بين آلية CIF واستراتيجية Wait-k لتقديم استجابة منخفضة الكمون ودقة عالية في مجال التعرف التلقائي على الكلام. وقد تمكن الفريق من تحويل استراتيجية مستخدمة عادةً في النصوص إلى تطبيق ناجح على الصوت عبر تقسيم الإشارات المستمرة إلى قرارات حاسمة، محققًا بذلك نجاحًا في تطبيقها على الجهاز المحمول مباشرة.
أما الورقة الثانية، “Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation”، فركزت على تسريع عملية الاستدلال في الزمن الحقيقي باستخدام نموذج طفيلي مزدوج المقياس عبر العينة التخمينية بالتعاون مع جامعة شنغهاي جياو تونغ، مما أتاح زيادة سرعة الترجمة بنسبة 38% دون التضحية بدقة الأداء، ويعزز ذلك القدرة على تشغيل النماذج اللغوية الكبيرة على الأجهزة ذات الموارد المحدودة بكفاءة ملحوظة.
تؤكد هذه التقنيات المتقدمة أن تقنية النماذج اللغوية الصوتية الكبيرة على الأجهزة ستواصل تعزيز تجربة التواصل بين الإنسان والتكنولوجيا، بتوفير أداء عالي وخصوصية محكمة، ما يفتح آفاقًا جديدة أمام الاستخدامات الذكية في الهواتف المحمولة الحديثة.
«تغير مفاجئ» سعر الدولار اليوم الجمعة 15 أغسطس 2025 في البنوك والسوق الموازية
رسميًا بحضور وزير قطاع الأعمال.. تخرج دفعة جديدة في الدراسات العليا للإدارة اليوم
خسارة مفاجئة لمنتخب مصر الأولمبي في كرة السلة أمام البحرين الثلاثاء 29/07/2025.. ما الذي حدث؟
برشلونة يعلن جدول جولة آسيا الصارم استعدادًا للموسم الجديد وتأثيره على اللاعبين
بث مباشر.. شاهد مباريات الدوري السعودي 2025 بجودة فائقة دون انقطاع
عودة غير متوقعة في الحلقة 191 من مسلسل عثمان اليوم.. صراع محتدم وحرب كبرى تشعل الأحداث