لمنافسة ChatGPT.. أمازون تكشف عن الذكاء الاصطناعي الصوتي Nova Sonic
تاريخ النشر: 10th, April 2025 GMT
كشفت شركة أمازون Amazon، عن نموذجها الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي Nova Sonic، وهو قادر على معالجة الصوت وتوليد كلام طبيعي أقرب إلى المحادثات البشرية.
وتدعي أمازون أن أداء Nova Sonic قادر على منافسة أبرز النماذج الصوتية المتقدمة من شركتي OpenAI وجوجل، وفقا لمعايير التي تقيس السرعة والتعرف على الكلام وجودة المحادثة.
يأتي Nova Sonic كـ نموذج صوتي من أمازون منافسا للنماذج الصوتية الحديثة، مثل وضع الصوت في شات جي بي تي، الذي بات أكثر سلاسة مقارنة بالنماذج السابقة، مثل الإصدارات الأولى من أليكسا وسيري.
ويتوفر نموذج Nova Sonic عبر منصة أمازون Bedrock المخصصة للمطورين لبناء تطبيقات الذكاء الاصطناعي للمؤسسات، وذلك من خلال واجهة برمجة تطبيقات API جديدة تتيح البث الصوتي في الاتجاهين.
وفي بيان صحفي، وصفت أمازون هذا النموذج بأنه الأكثر كفاءة من ناحية التكلفة في السوق، مشيرة إلى أنه أقل من حيث التكلفة بحوالي 80% مقارنة بنموذج GPT-4o من OpenAI.
وتعمل مكونات Nova Sonic على تشغيل أليكسا بلس، المساعد الصوتي المحسن الذي أطلقته أمازون حديثا.
ويتميز Nova Sonic كذلك بقدرته على الاستجابة في الوقت المناسب في أثناء الحوارات الثنائية، إذ يراعي مدد الصمت والمقاطعات من الطرف الآخر.
كما يمكنه توليد نسخة مكتوبة من كلام المستخدم، ويمكن للمطورين الاستفادة منها في تطبيقات مختلفة، وهو نموذج أقل عرضة لأخطاء الكلام مقارنة بالنماذج الأخرى، إذ يتمكن من فهم نوايا المستخدم حتى في حال تمتمته أو حديثه وسط ضوضاء.
وسجل نموذج Nova Sonic معدل خطأ بلغ 4.2% فقط عند متوسط الأداء عبر اللغات الإنجليزية والفرنسية والإيطالية والألمانية والإسبانية.
وفي الوقت نفسه، تفوق Nova Sonic بنسبة قدرها 46.7% من ناحية معدل الخطأ مقارنة بنموذج GPT-4o-transcribe من OpenAI، كما سجل النموذج سرعة استجابة رائدة بمتوسط تأخير محسوس قدره 1.09 ثانية، مقارنة بـ1.18 ثانية لنموذج Realtime API من OpenAI.
ويعد نموذج Nova Sonic جزءا من إستراتيجية أمازون الواسعة لتطوير الذكاء الاصطناعي العام AGI، الذي تعرفه الشركة بأنه الذكاء الاصطناعي القادر على أداء كافة المهام التي ينفذها البشر عبر الحاسوب.
المصدر: صدى البلد
كلمات دلالية: أمازون الذكاء الاصطناعي المزيد الذکاء الاصطناعی
إقرأ أيضاً:
استخدام تقنيات الذكاء الاصطناعي عند أبواب المسجد الحرام
مكة المكرمة
تستخدم الهيئة العامة للعناية بشؤون المسجد الحرام والمسجد النبوي تقنية متطورة تعتمد على الذكاء الاصطناعي من خلال حساسات قارئة عند أبواب المسجد الحرام.
وتأتي هذه التقنية لرصد الأعداد على أرضية المداخل الرئيسة للمسجد الحرام، بهدف رفع الكفاءة التشغيلية عبر متابعة التدفقات لتمكين الجهات ذات العلاقة من اتخاذ القرار المناسب في عمليات إدارة الحشود بفاعلية لتحسين الانسيابية.
وتستشعر الكاميرات الذكية حركة الدخول والخروج؛ مما يتيح مراقبة فورية لتدفقات ضيوف الرحمن وتحديد نقاط الازدحام بدقة أكبر.
ويسهم هذا النظام المزدوج من الحساسات والكاميرات في تحسين توزيع الحشود داخل المسجد الحرام، لا سيما في أدوار المطاف والمسعى؛ مما يساعد على تنظيم الحركة وتعزيز سلامة الزوار، خاصة خلال أوقات الذروة.
كما تسهل هذه التقنية تسهيل انسيابية الدخول والخروج عبر الاعتماد على البيانات الدقيقة والتاريخية في اتخاذ القرارات المناسبة؛ مما يعكس أهمية تبني مثل هذه الأنظمة لدعم التخطيط الفعّال وإدارة الحشود وفق معايير عالية الدقة.
وأوضحت الهيئة أن استخدام هذه التقنية يأتي لرصد حركة الدخول والخروج بدقة متناهية وتعزيز كفاءة أنظمة إدارة الحشود وتطوير وسائل مراقبة التدفقات البشرية داخل المسجد الحرام، وتحليل الازدحام من أجل دعم الجهات المعنية العاملة في المسجد الحرام لتحسين التفويج وتعزيز التشغيل بتوزيع الأدوار وتحويل الكثافات بما يحقق أعلى مستويات الانسيابية والتنظيم.
وتأتي هذه الخطوة ضمن جهود الهيئة المستمرة لاستثمار التقنيات في تحسين خدمات ضيوف الرحمن، واتخاذ قرارات قائمة على بيانات دقيقة وتحليل شامل للحركة داخل المسجد الحرام.