ImageFX.. جوجل تكشف عن أداة لتحويل النص إلى صورة
تاريخ النشر: 2nd, February 2024 GMT
تطرح Google مجموعة كبيرة من التحديثات على واجهة الذكاء الاصطناعي التوليدي، بما في ذلك أداة جديدة لتحويل النص إلى صورة. الأمر المختلف في ImageFX هو أنه يحتوي على واجهة تتميز بـ "شرائح معبرة". الفكرة هنا هي أن هذه الأشياء ستساعدك على "تجربة الأبعاد المجاورة لإبداعك وأفكارك بسرعة".
إلى جانب ظهور ImageFX لأول مرة، تقول Google إنها قامت بتحسين MusicFX وTextFX.
يتم وضع علامة على الصور والتسجيلات الصوتية التي تم إنشاؤها بواسطة ImageFX والتي تم إنشاؤها باستخدام MusicFX بواسطة SynthID، وهي علامة مائية رقمية تهدف إلى توضيح أن هذه الصور مزورة باستخدام الذكاء الاصطناعي، خاصة عندما تظهر في البحث أو Chrome. ستتضمن إبداعات ImageFX أيضًا بيانات تعريف IPTC. وهذا، وفقًا لشركة جوجل، سيوفر "للأشخاص مزيدًا من المعلومات كلما واجهوا صورنا التي تم إنشاؤها بواسطة الذكاء الاصطناعي".
يمكن للأشخاص في الولايات المتحدة وكينيا ونيوزيلندا وأستراليا تجربة هذه الأدوات الجديدة والمتجددة في AI Test Kitchen بدءًا من اليوم. إنها متاحة باللغة الإنجليزية فقط في الوقت الحالي.
يعمل نموذج Imagen 2 على تشغيل ميزات إنشاء الصور الجديدة في ImageFX. إنها أيضًا التقنية التي تقود خيارات الذكاء الاصطناعي التوليدية الجديدة في Bard وSearch وAds وDuet AI في Workspace وVertex AI. تقول Google إن Imagen 2 يساعد في تقديم صور عالية الجودة تم إنشاؤها بواسطة الذكاء الاصطناعي حتى الآن. تشير الشركة إلى أن النموذج يساعد في الحفاظ على الصور خالية من القطع الأثرية ويحسن مجالات توليد الصور التي عانت منها هذه الأدوات حتى الآن.
بالإضافة إلى ذلك، تقول Google إنها قامت "باستثمارات كبيرة" في تدريب سلامة بيانات Imagen 2 مع إضافة حواجز حماية "للحد من المخرجات الإشكالية مثل المحتوى العنيف أو المسيء أو الجنسي الصريح بالإضافة إلى تطبيق المرشحات لتقليل مخاطر إنشاء صور لأفراد محددين". " ويرجع ذلك إلى قدرة النموذج المحسنة على إنشاء صور واقعية. تدعي الشركة أنها تجري أيضًا "اختبارات عدائية واسعة النطاق" للكشف عن المحتوى الذي قد يسبب مشاكل أو ضارًا وتضييق الخناق عليه.
وفي مكان آخر، أصبح Gemini Pro in Bard متاحًا على نطاق أوسع بدءًا من اليوم. أصبح الآن متاحًا بأكثر من 40 لغة وشمال 230 دولة وإقليمًا. اعتبارًا من اليوم أيضًا، تقول Google إن الأشخاص في معظم البلدان يمكنهم إنشاء صور بلغة Bard باللغة الإنجليزية مجانًا. ستتضمن هذه الصور علامات مائية SynthID.
المصدر: بوابة الوفد
كلمات دلالية: الذکاء الاصطناعی
إقرأ أيضاً:
تحكم دون لمس.. ساعة Google Pixel Watch 4 تحصل على إيماءات ثورية وتحسينات في الردود
تكشف التحليلات البرمجية المعمقة لأحدث إصدارات تطبيق "Google Pixel Watch"، التي نشرها موقع "9to5Google" المتخصص اليوم، عن استعداد شركة جوجل لطرح تحديث برمجي ضخم لساعتها الأحدث Google Pixel Watch 4.
تؤكد المصادر أن التحديث المرتقب سيركز بشكل أساسي على دمج إيماءات تحكم لاتلامسية جديدة كلياً، بالإضافة إلى إصلاح جذري لنظام "الردود الذكية" (Smart Replies) بالاعتماد على الذكاء الاصطناعي التوليدي.
ثورة التحكم بالإيماءات (Gesture Control)توضح السطور البرمجية المكتشفة أن الساعة ستدعم أنماطاً جديدة من التفاعل بيد واحدة، مما يتيح للمستخدمين التحكم في الساعة دون الحاجة للمس الشاشة باليد الأخرى.
تتضمن الإيماءات الجديدة حركات مثل "القبض المزدوج" (Double Clench) لتأكيد الإجراءات، و"القرص" (Pinch) للتنقل بين القوائم، و"تدوير المعصم" للعودة للخلف. تفيد التقارير بأن هذه الميزات تستفيد من المستشعرات الدقيقة ومعالج "Tensor" الجديد لفهم حركة العضلات والأوتار في المعصم بدقة فائقة.
تعتمد جوجل في تحسين ميزة الردود الذكية على دمج نماذجها اللغوية المتطورة (يرجح أنها Gemini Nano) مباشرة داخل الساعة.
تشير المعلومات إلى أن النظام الجديد لن يكتفي بتقديم ردود جاهزة وقصيرة (مثل: نعم، لا، شكراً)، بل سيقوم بتحليل سياق المحادثة الطويلة بالكامل واقتراح ردود طبيعية ومفصلة تناسب أسلوب المستخدم، مع إمكانية تعديل نبرة الرد لتكون رسمية أو ودية قبل الإرسال.
التكامل مع النظام البيئيتأتي هذه التحسينات في إطار سعي جوجل لتوحيد تجربة الاستخدام عبر أجهزتها، حيث تلمح المصادر إلى أن هذه الميزات قد تكون جزءاً من تحديث "Pixel Feature Drop" القادم لشهر ديسمبر.
تهدف الشركة من خلال هذه الإضافات إلى تقليص الفجوة التنافسية مع ساعة "Apple Watch Series 11"، التي قدمت ميزات مشابهة (Double Tap) في إصداراتها الأخيرة.
ينتظر المستخدمون الإعلان الرسمي عن وصول التحديث عبر الهواء (OTA) خلال الأيام المقبلة، حيث يتوقع الخبراء أن تعزز هذه الميزات من مكانة Pixel Watch 4 كواحدة من أذكى الساعات المتوفرة في السوق حالياً، خاصة للمستخدمين المنخرطين في بيئة أندرويد.