خفضت Pinterest تكاليف الذكاء الاصطناعي بنسبة 90% عن طريق تدمير طبقة الرؤية للنموذج الحدودي

مع وجود 620 مليون مستخدم شهريًا، فإن استدعاء النموذج الحدودي لكل توصية بالصورة ليس استراتيجية – بل هو حساب التفاضل والتكامل. قام مات مادريجال، كبير مسؤولي التكنولوجيا في Pinterest، بحل هذه المشكلة عن طريق تدمير طبقة الرؤية Qwen3-VL وإعادة بنائها باستخدام تضمينات خاصة، مما أدى إلى تقليل التكاليف بنسبة 90% وزيادة الدقة بنسبة 30%.يستثمر فريق Madrigal بكثافة في تكييف النماذج مفتوحة المصدر “داخل الشركة بشكل أساسي”.وأوضح مادريجال في مقال نشر مؤخرًا: “إذا كانت لديك بيانات فريدة حقًا يمكنك تنقيحها وتحويلها إلى نموذج مفتوح المصدر، فبصراحة، ستتجاوز جودة البيانات حجم النموذج أو تفوقه”. VB Beyond the Pilot Podcast.

كيف قامت Pinterest بتكييف Qwen للاكتشاف البصري

استخدمت شركة Pinterest، التي تضم حوالي 620 مليون مستخدم نشط شهريًا، نماذج مفتوحة المصدر للبحث والاكتشاف المرئي منذ فترة طويلة، بدءًا من BERT من Google وCLIP من OpenAI. قامت الشركة بتحسين Pin CLIP الخاص بها في الأخير من خلال تضمين العناصر المرئية الخاصة والبيانات الوصفية للصور.تم إنشاء مساعد التسوق التحادثي من Pinterest، Navigator 1، على Qwen3-VL وتم تخصيصه بطريقة “مهمة إلى حد ما”. قام فريق مادريجال بشكل أساسي “بإزالة” طبقة تشفير رؤية Qwen وتحسين النموذج بناءً على التضمينات متعددة الوسائط الخاصة. وقد مكنهم ذلك من التقاط البيانات الوصفية حول الدبابيس والصور، والتي يمكن بعد ذلك حسابها مسبقًا دون الاتصال بالإنترنت وتدريبها بانتظام على المعلومات الجديدة لتقديم تجارب مخصصة.وقال مادريجال: “النماذج مفتوحة المصدر، خاصة مع تراخيص Apache المفتوحة حيث يمكنك حقًا تخصيص الكثير من المقاييس المفتوحة وتكييفها مع حالات الاستخدام الفريدة الخاصة بك – وهذا هو المكان الذي وجدنا فيه أن المصادر المفتوحة قوية جدًا بالنسبة لنا”.يتيح تقديم تضميناته الخاصة لفريقه الحصول على سياق حول البيانات التعريفية والدبابيس والصور؛ ومن الجدير بالذكر أيضًا أن النموذج يعمل بشكل أفضل في وقت التشغيل والاستدلال. بدون هذه الرواسب، سيتعين على المطورين استدعاء وترميز كل صورة يتم إرجاعها في وقت التشغيل، واحدة تلو الأخرى. وقال مادريجال إنه من وجهة نظر استدلالية، فإن زمن الوصول “أكبر 20 مرة”.وقال: “إذا كان شيئًا سيكون ذا أهمية بالغة للمستخدمين النهائيين لدينا، وسيؤدي إلى زيادة المشاركة ويحتاج إلى توسيع نطاقه ليشمل أكثر من 600 مليون مستخدم نشط شهريًا، فمن المحتمل إما أن نبنيه أو نستخدم مصدرًا مفتوحًا ونخصصه”.

اقرأ أيضاً
مزود بمعالج رائد.. أوبو تعلن عن جهاز لوحي جديد

مزود بمعالج رائد.. أوبو تعلن عن جهاز لوحي جديد

تحويل VB · 14-15 يوليو · مينلو بارك · التنسيق الوكيل

أعادت شركة Intuit بناء نظامها متعدد الوكلاء خلال 60 يومًا. ماذا تغيروا – ولماذا؟

شاهد أيضاً
«Activision» تكشف عن موعد إطلاق «Call of Duty»

«Activision» تكشف عن موعد إطلاق «Call of Duty»

في كتاب Transform، يصف قادة الهندسة من Intuit وTarget وInstacart كيف يعيدون تصميم بنيات التنسيق الخاصة بهم لتحقيق الموثوقية والحجم والعملاء الحقيقيين. انظر جدول الأعمال الكامل →

كيف يُظهر مخطط الذوق الاهتمامات المتغيرة

لتوجيه المستخدمين من الإلهام إلى الشراء، أنشأ فريق Madrigal “رسمًا بيانيًا للذوق”: تمثيل ديناميكي لما يحبه المستخدمون الفرديون بالفعل، وليس فقط ما ينقرون عليه. وقال “إنه تمثيل للأذواق المتغيرة لمليارات من الناس”.يستخدم الأشخاص محرك البحث جوجل أو محركات البحث الأخرى عندما تكون لديهم فكرة واضحة عما يريدون؛ وقال مادريجال إن موقع Pinterest مخصص للأشخاص الذين ما زالوا في مرحلة الاكتشاف. هدف Pinterest هو تشجيع “الاستكشاف الجانبي” وتحويل الاكتشاف إلى نية (أي النقر على الإعلانات أو إجراء عمليات شراء).تحت الغطاء، تجمع البنية بين بنية الرسم البياني والتعلم التمثيلي. تعكس عمليات تضمين المستخدم أذواق المستخدم المتغيرة. ويتم تحديثها باستمرار بناءً على النشاط والمحتوى والإشارات الجديدة. قال مادريجال: “إنه ليس رسمًا بيانيًا اجتماعيًا”. “إنه أقرب إلى مخطط تفضيلات: ما الذي يلهمك؟ ما الذي تحاول القيام به بعد ذلك؟”على سبيل المثال، قد يكون أحد المستخدمين مهتمًا بالتصميمات الحديثة في منتصف القرن؛ قد يفضل آخر جمالية نانتوكيت. سيتم تسجيل هذه التفضيلات في تسويات المستخدم، ونتيجة لذلك، سيعرض الرسم البياني للذوق منتجات محددة وذات صلة.قال مادريجال: “تنتقل من أعلى القمع، لتكتشف الإلهام، وصولاً إلى القمع السفلي”.استمع إلى البودكاست الكامل لمعرفة المزيد عن:كيف تستخدم Pinterest صناديق الحماية لتشجيع الإبداع بطريقة آمنة ومغلقة؛لماذا يمكن لحلقة التغذية الراجعة المستمرة أن تمنع الأخطاء البصرية التي يرتكبها الذكاء الاصطناعي؛أهمية المقارنة المرجعية المستمرة لقياس تفاعل المستخدم والأداء ووقت الاستجابة والمزيد.يمكنك أيضًا الاستماع والاشتراك باستثناء الطيار على سبوتيفي, تفاحة أو أينما تجد ملفات البودكاست الخاصة بك.

كاتب المقال

صحفي لدي موقع سبورت ليب أهتم بالشأن العام واتمني اثراء المحتوي العربي ونشر الأخبار الحصرية لكل ما هو جديد