OpenAI تحدث تجربة ChatGPT الصوتية
تاريخ النشر: 2nd, December 2025 GMT
في خطوة تعكس تسارع وتيرة تطوير واجهات التفاعل بالذكاء الاصطناعي، أعلنت شركة OpenAI عن تحديث كبير لطريقة عمل وضع الصوت في ChatGPT سواء على الويب أو داخل تطبيق الهاتف.
التحديث الجديد يقدّم تجربة صوتية أكثر تكاملًا مع الحوار الكتابي، بحيث يصبح بإمكان المستخدم متابعة النص والصور المرافقة لإجابات ChatGPT أثناء التحدث معه بالصوت، دون الحاجة للانتقال إلى واجهة منفصلة كما كان الحال سابقًا.
بحسب OpenAI، أصبح تشغيل وضع الصوت أسهل وأكثر سلاسة. كل ما يحتاجه المستخدم هو الضغط على أيقونة الموجة الصوتية بجانب مربع الكتابة لبدء محادثة صوتية مباشرة ضمن نفس سياق الدردشة.
هذا يعني أن المستخدم لن يُنقل بعد الآن إلى الواجهة الدائرية السابقة التي أطلقت بها الشركة ميزة الصوت لأول مرة، بل سيظل داخل نفس الجلسة مع إمكانية رؤية النصوص التي يكتبها النموذج لحظة بلحظة.
ويُظهر الفيديو التوضيحي الذي نشرته OpenAI أن ChatGPT بات يعرض النص الكامل للمحادثة بالتزامن مع الرد الصوتي، إضافة إلى صور وإيضاحات بصرية حول الموضوع المطروح. على سبيل المثال، عندما طلب المستخدم معلومات حول المخابز الشهيرة، عرض ChatGPT خريطة تفاعلية وصورًا للمعجنات من متجر Tartine، ما جعل المحادثة الصوتية تبدو أشبه بجولة معرفية متكاملة.
رغم التحسينات الكبيرة، أدركت OpenAI أن بعض المستخدمين ما زالوا يفضلون الواجهة الصوتية الأصلية، ذات التصميم الدائري والمظهر المجرّد. لذلك أضافت الشركة خيارًا يسمى وضع الفصل داخل إعدادات "وضع الصوت".
عند تفعيل هذا الإعداد، تعود التجربة إلى شكلها التقليدي، ما يمنح المستخدمين حرية اختيار الطريقة التي تناسب احتياجاتهم وأساليبهم في التفاعل.
يأتي هذا التحديث كجزء من التوجه المتزايد لجعل ChatGPT مساعدًا متعدد الوسائط بحق. فالتطبيق بات قادرًا على فهم الصوت والصور والفيديو والمزج بينها داخل جلسة واحدة. وبالتالي، من الطبيعي أن تدعم الاستجابات الصوتية أيضًا إظهار عناصر بصرية توضّح ما يقوله المساعد بدلاً من الاعتماد على الصوت وحده.
هذه الخطوة ليست معزولة عن السياق العالمي للذكاء الاصطناعي. فشركة جوجل تعمل في الاتجاه نفسه عبر منصتها Gemini Live، التي تستكشف طرقًا أكثر تعبيرًا للتفاعل المباشر بين المستخدم والذكاء الاصطناعي، بما في ذلك إظهار تراكبات على الفيديو المباشر لشرح عناصر معينة. ورغم أن الميزة الجديدة من OpenAI ليست تفاعلية إلى هذا الحد، فإن دمج الصور والنصوص في المحادثة الصوتية يجعل التجربة أكثر غنى وفائدة.
كيف يغيّر هذا التحديث طريقة استخدامنا لـ ChatGPT؟التحسين الجديد لا يتعلق بتحسين واجهة المستخدم فحسب، بل يرتبط بفكرة أكبر:
جعل الذكاء الاصطناعي طبيعيًا في الحوار، قريبًا من طريقة تواصل البشر.
إليك ما يقدمه التحديث على مستوى التجربة:
استيعاب أفضل للمعلومات: سماع المعلومة ورؤيتها مكتوبة بصور داعمة يعزز الفهم، خاصة في المواضيع التي تتطلب شروحات مرئية.
سهولة المتابعة: إذا انقطع اتصال الإنترنت أو توقّف المستخدم للحظة، يمكنه متابعة آخر نص مكتوب دون فقدان سياق الحديث.
تقليل الانتقال بين النوافذ: التفاعل يقع في مكان واحد، مما يسهل العمل أو الدراسة أثناء التحدث مع ChatGPT.
تجربة أكثر واقعية: الدمج بين الصورة والصوت والنص يجعل الذكاء الاصطناعي يبدو أقرب إلى مساعد تفاعلي حقيقي وليس محرك إجابات تقليدي.
يبدو أن هذه الخطوة تعكس رؤية OpenAI لمرحلة جديدة من المساعدات الذكية: مساعد شامل متعدد الوسائط، يفهم ويتفاعل ويرى ويشرح.
ومع ازدياد توجه الشركات إلى دمج الصوت بالذكاء الاصطناعي في التعليم والتسويق والتخطيط اليومي، قد يصبح هذا النوع من المحادثات الصوتية المعززة بالصور الشكل السائد للمساعدات الرقمية خلال السنوات القادمة.
في النهاية، يمثل تحديث ChatGPT Voice انعطافة مهمة في جعل التفاعل الصوتي أكثر قربًا من التجربة البشرية الطبيعية، وأكثر قدرة على توصيل المعلومات بطرق متعددة، مفيدة وسلسة، وتفتح الباب أمام جيل جديد من الأدوات الذكية التي تتكامل مع حياتنا اليومية.
المصدر: بوابة الوفد
إقرأ أيضاً:
ChatGPT ثلاث سنوات من التحول الرقمي
غزة - صفا
قبل ثلاث سنوات، أطلقت شركة OpenAI نموذجها اللغوي ChatGPT، الذي بدأ كمعاينة بحثية بسيطة. على الرغم من المخاوف الداخلية بشأن عدم اكتماله، اتخذ الرئيس التنفيذي سام ألتمان قرارًا بالمضي قدمًا في إطلاقه. منذ ذلك الحين، شهد ChatGPT انتشارًا واسعًا، متجاوزًا مليون مستخدم في خمسة أيام فقط، ليصبح التطبيق الأسرع نموًا في التاريخ. اليوم، يستخدمه ما يقارب 800 مليون شخص أسبوعيًا، مما يجعله جزءًا أساسيًا من حياتهم اليومية. ومع فوائده العديدة في مجالات البحث والكتابة، تبرز مخاوف بشأن دقة المعلومات وتأثيره المحتمل على سوق العمل. لقد مثل ChatGPT نقطة تحول محورية في العلاقة بين المجتمع والتكنولوجيا، مثيرًا تساؤلات عميقة حول مستقبل الذكاء الاصطناعي وتأثيره على الصعيد العالمي.
البدايات والإطلاققبل ثلاث سنوات، قدمت شركة OpenAI ما وصفته بـ "معاينة بحثية بسيطة" لنموذجها اللغوي. كانت هذه المعاينة متواضعة لدرجة أن الموظفين تلقوا تعليمات بعدم اعتبارها منتجًا نهائيًا. على الرغم من القلق السائد داخل الشركة بشأن طرح منتج غير مكتمل، أصر الرئيس التنفيذي سام ألتمان على المضي قدمًا في الإطلاق. كان دافعه الرئيسي هو الرغبة في التفوق على المنافسين وفهم كيفية تفاعل المستخدمين مع النموذج اللغوي الجديد، وهكذا أبصر ChatGPT النور.
الانتشار الهائلمنذ لحظة إطلاقه، حظي ChatGPT بانتشار هائل وغير مسبوق. فقد تجاوز عدد مستخدميه حاجز المليون شخص في غضون خمسة أيام فقط، محققًا بذلك لقب التطبيق الاستهلاكي الأسرع نموًا في التاريخ. وتشير التقارير المتعددة إلى أن عدد مستخدميه الأسبوعيين اليوم يقدر بحوالي 800 مليون شخص.
تأثيره على المجتمع والاقتصادتتجاوز أهمية ChatGPT مجرد الأرقام والإحصائيات، فالتأثير الحقيقي يكمن في السرعة التي أعاد بها تشكيل قطاعات واسعة من المجتمع والاقتصاد. لقد وجدنا أنفسنا نعيش في عالم جديد، ساهم الذكاء الاصطناعي التوليدي بشكل كبير في صياغة ملامحه.
مكانة ChatGPT والمنافسةرسخ منتج OpenAI مكانته كواجهة رئيسية للتفاعل مع نماذج اللغة الكبيرة. سرعان ما حذت شركات أخرى حذوها، حيث أطلقت جوجل نموذجها "بارد" الذي تطور لاحقًا ليصبح "جيميناي"، بينما قدمت مايكروسوفت روبوت "بينج" الذي أثار جدلاً واسعًا بعد خروجه عن المألوف في محادثة مع أحد الصحفيين.
استخدامات ChatGPT اليوميةبالنسبة لملايين المستخدمين، تحول ChatGPT إلى أداة سهلة وفعالة، على الرغم من ميلها أحيانًا لتقديم معلومات غير دقيقة. يعتمد عليه المستخدمون في مهام متنوعة مثل البحث، والكتابة، والبرمجة، وصياغة المراسلات، وحتى في تنفيذ مهام كاملة بشكل آلي، ليصبح بذلك جزءًا لا يتجزأ من روتين العمل اليومي.
تطور الأداء والتحدياتشهدت نماذج ChatGPT تحسنًا مستمرًا مع كل إصدار جديد، وتطورت كذلك أدوات المنافسين، مما أدى إلى ارتفاع ملحوظ في الأداء ضمن الاختبارات المعيارية. اندمجت روبوتات الدردشة في أنظمة خدمة العملاء، وفي المقابل، استغلها بعض المحتالين على وسائل التواصل الاجتماعي لإنشاء شبكات واسعة من الحسابات الآلية.
تحديات المحتوى والتعليمأدت هذه التطورات إلى امتلاء المكتبات الإلكترونية بالكتب المولدة بواسطة الذكاء الاصطناعي، وتعرضت محركات البحث مثل جوجل للضغط بسبب المحتوى منخفض الجودة. دفع هذا الجامعات إلى إعادة تقييم أساليب التقييم الخاصة بها، نظرًا لسهولة الغش باستخدام هذه النماذج.
مخاوف المبدعين والفنانينفي المجال الإبداعي، عبر الفنانون عن قلقهم المتزايد بشأن تأثير النماذج التوليدية على وظائفهم ومكانتهم. تفاقمت هذه المخاوف بعد أن أبرمت بعض المؤسسات الإعلامية اتفاقات لترخيص البيانات، بينما لجأت أخرى إلى الإجراءات القضائية. كما قامت بعض الشركات بتسريح موظفين بالتزامن مع تزايد الاعتماد على أدوات الدردشة المدعومة بالذكاء الاصطناعي.
ثقافة الذكاء الاصطناعي الجديدةبرزت ثقافة جديدة في وادي السيليكون، نشأت بين مجموعات المطورين ورواد الأعمال. شملت هذه الثقافة مصطلحات مثل "الذكاء الخارق" و"الذكاء الاصطناعي العام"، التي أصبحت متداولة على نطاق واسع في الأوساط التقنية.