تريند جديد على ChatGPT.. تحديد الموقع من الصور بالبحث عبر الإنترنت
تاريخ النشر: 19th, April 2025 GMT
في تطور مثير ومقلق في آنٍ معًا، بدأت تنتشر ظاهرة جديدة على الإنترنت عبر استخدام ChatGPT لتحديد المواقع الجغرافية من خلال الصور.
فقد أطلقت شركة OpenAI هذا الأسبوع نموذجين جديدين من الذكاء الاصطناعي، هما o3 و o4-mini، يتمتعان بقدرات متقدمة في "الاستنتاج البصري"، تتيح لهما تحليل الصور بطريقة غير مسبوقة.
يمكن لهذه النماذج اقتصاص الصور، وتدويرها، والتكبير داخلها، حتى لو كانت غير واضحة أو مشوشة، بهدف تحليلها بدقة.
استنتاج المواقع من صور مشوشة أو غامضةوبفضل دمج هذه القدرات التحليلية مع خاصية البحث عبر الإنترنت، أصبح بإمكان المستخدمين توجيه النموذج لاكتشاف الموقع الذي تم التقاط الصورة فيه. وقد رصد عدد من مستخدمي منصة X (تويتر سابقًا) أن النموذج o3 يستطيع بدقة لافتة تحديد المدن، والمعالم الشهيرة، بل وحتى أسماء المطاعم والحانات من خلال إشارات بصرية بسيطة جدًا.
المثير للدهشة أن هذه النتائج لا تعتمد على بيانات EXIF (وهي بيانات مرفقة بالصور تتضمن معلومات مثل موقع التصوير)، ولا على ذاكرة المحادثات السابقة لـChatGPT، بل تعتمد فقط على تحليل الصورة نفسها.
انتشرت على منصة X تجارب عديدة لمستخدمين عرضوا على النموذج صورًا لأحياء، أو واجهات مطاعم، أو حتى صور سيلفي، وطلبوا منه أن يتقمص دور لعبة “GeoGuessr”، وهي لعبة شهيرة تتحدى اللاعبين لتخمين المواقع من صور خرائط Google Street View.
لكن هذا الاتجاه يثير مخاوف واضحة تتعلق بالخصوصية، إذ لا يوجد حتى الآن ما يمنع أي شخص سيئ النية من التقاط صورة من قصة (Story) على إنستجرام، مثلًا، واستخدام ChatGPT لمحاولة تحديد موقع هذا الشخص بدقة.
جدير بالذكر أن قدرات تحديد الموقع ليست حكرًا على النماذج الجديدة. فبحسب تجربة أجراها موقع TechCrunch، تبيّن أن النموذج القديم GPT-4o (الذي يفتقر إلى خاصية "الاستنتاج البصري") نجح في تحديد الموقع الصحيح في معظم الحالات بنفس دقة النموذج o3 – بل وأحيانًا بشكل أسرع.
GPT-4o ليس أقل كفاءة من o3في إحدى التجارب الفريدة، عرضت على النموذج o3 صورة لرأس وحيد قرن أرجواني مُعلق داخل حانة خافتة الإضاءة، وتمكن من تحديد المكان بدقة أحد "البارات السرية" في حي ويليامزبرغ بنيويورك، بينما أخطأ النموذج الأقدم، وافترض أنه حانة في المملكة المتحدة.
بالرغم من ذلك، لا يعني هذا أن نموذج o3 معصوم من الخطأ، فقد فشل في عدد من التجارب، إما بدخوله في حلقة مفرغة دون إجابة حاسمة، أو بتحديد مواقع خاطئة.
وقد أشار مستخدمون على منصة X إلى أنه في بعض الحالات كان النموذج بعيدًا تمامًا عن الحقيقة.
تظهر هذه الظاهرة الناشئة مخاطر النماذج المتقدمة من الذكاء الاصطناعي القادرة على "الاستدلال المنطقي".
فعلى ما يبدو، لا توجد حاليًا ضوابط كافية لمنع هذه الميزة الخطيرة التي تُعرف بـ"البحث العكسي عن الموقع"، ولم تتطرق OpenAI إلى هذه الإشكالية في تقرير السلامة المخصص لنموذجي o3 وo4-mini.
رد رسمي من OpenAI
وقد تواصل موقع TechCrunch مع شركة OpenAI للحصول على تعليق رسمي، وجاء الرد بعد ساعات من نشر التقرير، حيث صرح متحدث باسم الشركة قائلًا:"نماذج o3 و o4-mini من OpenAI توفر قدرات استدلال بصري داخل ChatGPT، مما يجعلها أكثر فائدة في مجالات مثل تسهيل الوصول، والبحث العلمي، أو تحديد المواقع في حالات الطوارئ".
واضاف "لقد عملنا على تدريب النماذج لرفض الطلبات التي تتضمن معلومات خاصة أو حساسة، وأضفنا ضوابط تهدف إلى منع النموذج من تحديد هوية الأفراد في الصور، ونعمل بنشاط على مراقبة أي انتهاكات لسياستنا في ما يخص الخصوصية واتخاذ الإجراءات اللازمة".
المصدر: صدى البلد
كلمات دلالية: المزيد الذکاء الاصطناعی
إقرأ أيضاً:
أهم ما يميز أداة الذكاء الاصطناعي نوت بوك إل إم من غوغل
كشفت "غوغل" خلال مؤتمر المطورين هذا العام عن عدة أدوات ذكاء اصطناعي لتطويرها، وفي مقدمتها جاءت التحسينات على "نوت بوك إل إم" (Notebook LM) التي أحدثت ضجة كبيرة عالمية منذ طرحها للمرة الأولى، إذ تختلف كثيرا عن أدوات الذكاء الاصطناعي المعتادة.
ولاقت الأداة استحسان الخبراء فور طرحها، إذ وصفها موقع "سي نت" (Cnet) بكونها أداة الذكاء الاصطناعي المثالية للعمل أو الدراسة، وذلك رغم اختلافها الكبير عن أدوات الذكاء الاصطناعي المعتادة مثل "جيميناي" و"شات جي بي تي" التي تعتمد على الدردشة المباشرة بين المستخدم والأداة، ولكن ما هي أداة "نوت بوك إل إم"؟ ولماذا لاقت كل هذا الاستحسان؟
ما "نوت بوك إل إم"؟يمكن وصف هذه الأداة عبر وصفها بأنها أداة تسجيل ملاحظات معززة بقدرات "جيميناي" للذكاء الاصطناعي، إذ يمكنك توجيه الأسئلة مباشرة إلى الأداة لتقوم بالإجابة. ولكن بدلا من البحث عن الإجابات بالإنترنت والمواقع العامة، تبحث هذه الأداة عن الإجابات داخل المصادر التي تقوم بتزويدها بها.
ويعني هذا أنك تقوم بتزويد الأداة بمجموعة من المصادر سواء كانت روابط وصفحات إنترنت أو مقاطع صوتية أو مقاطع فيديو وصورا ملتقطة من خلال هاتفك، ثم تقوم بتوجيه السؤال إلى الأداة لتبحث عن الإجابة بهذه المصادر التي قمت بتزويدها بها فقط.
وهو ما يجعل هذه الأداة مثالية للمساعدة على الدراسة أو البحث في المستندات وملفات العمل، إذ يمكنك تزويدها بالملفات التي ترغب فيها ثم تطلب منها إيجاد معلومة بعينها داخل هذه المستندات أو الصور لتقوم بالبحث تلقائيا حتى تجد الإجابة التي تبحث عنها.
ولا يقف دور "نوت بوك إل إم" هنا فقط، فهي تقوم بعمل تلخيص كامل لكافة الملاحظات والمصادر التي قمت بتزويدها بها، وتبدأ بعرض مجموعة من المعلومات الملخصة وبناء خرائط ذهنية وملاحظات صوتية وربما مقاطع فيديو أيضا لبعض المعلومات الموجودة بالمصادر الخاصة بها.
تطبيق مخصص للهواتف والحواسيبتتوفر أداة "غوغل" في تطبيق مخصص للهواتف والحواسيب، ورغم أن الواجهة تختلف كثيرا بين التطبيقين، إلا أن كليهما يؤديان الغرض مع كون تطبيق الحاسب أكثر شمولية وأبسط في الاستخدام، وتجدر الإشارة إلى أن الأداة وصلت مؤخرا إلى الهواتف المحمولة ولم تكن متاحة مسبقا.
وتنقسم واجهة تطبيق الحاسب إلى 3 أجزاء، الأول هو جزء المصادر التي قمت بتزويد الأداة بها، ثم جزء للدردشة المباشرة مع الأداة والسؤال عن المصادر، والجزء الأخير وتطلق عليه الأداة "استوديو" الذي يقدم مزايا الأداة بشكل مكثف ويتيح لك الوصول إلى كافة خباياها.
إعلانوفي تطبيق الهواتف، يمكنك التنقل بين الأجزاء الثلاثة عبر قائمة التطبيق الرئيسية، وهي تقدم المزايا ذاتها تقريبا وتؤدي الوظائف ذاتها بشكل مبسط، ولكن يجب الملاحظة أن تطبيق الهواتف لا يضم كافة مزايا نسخة الحاسب.
توليد المقاطع الصوتية لمعاينة المصادرتقدم الأداة مجموعة متنوعة من المزايا، ولكن تعد ميزة توليد المقاطع الصوتية لمعاينة وتلخيص المصادر هي الأهم فيها، كونها تتيح لك تلخيص المصادر وبناء مقطع صوتي متكامل يشرح لك المصدر كأن شخصا ما قام بتسجيله.
كما أعلنت "غوغل" في مؤتمرها الأخير إتاحة التحكم الكامل في هذا المقطع، وإمكانية التعديل عليه بما يتناسب مع خيارات المستخدم وتفضيلاته، بدءا من تحديد مدة المقطع الصوتي وإن كان طويلا أو قصيرا أو حتى إمكانية التفاعل مع المقطع والتحكم في النقاط التي يغطيها.
وأضافت "غوغل" ميزة أخرى جعلت الأداة أكثر قوة، إذ أتاحت طورا جديدا يدعى الطور التفاعلي، وباستخدامه يمكن لك التفاعل مع المقطع الصوتي الذي يعمل، فيمكنك الضغط على زر المشاركة ليقوم المتحدث في المقطع الصوتي بالتوقف وسؤالك عما ترغب به، وبعد ذلك تقوم بسؤاله كيفما ترغب ليقوم بتقديم الإجابة لك.
وتعد ميزة المقاطع الصوتية التفاعلية إحدى أهم المزايا التي تقدمها الأداة وأكثرها استخداما بشكل عام، وذلك لأنها توفر تجربة تفاعلية قلما توجد في أدوات الذكاء الاصطناعي.
توليد مقاطع الفيديومن المتوقع أن تقدم "نوت بوك إل إم" تحديثا جديدا خلال الشهور القادمة إضافة ميزة توليد مقاطع الفيديو -بالشكل الذي يحدث مع المقاطع الصوتية- والتي تعمل على شرح المصادر والتفاصيل الخاصة بها بشكل سهل وسلس مباشرة من خلال مقاطع فيديو يتم توليده عبر الأداة ويمكن التحكم فيه.
لم تكشف "غوغل" عن الوقت المتوقع لوصول هذه الميزة بعد، ولكن يمكن أن تصل خلال الشهور القادمة وقبل نهاية العام.
توليد الخرائط الذهنيةيعتمد الملايين عالميا على أسلوب الخرائط الذهنية في الدراسة وفهم الأمور المعقدة، وبينما كان بناء هذه الخرائط الذهنية يستغرق وقتا طويلا، فإن أداة "نوت بوك إل إم" قادرة على توليدها في ثوان معدودة.
ويمكنك إضافة مجموعة من المصادر والكتب التي تعد دليلا لتعليم أي شيء ثم تطلب منها بسهولة ويسر أن تقوم بتوليد خريطة ذهنية تساعدك على تعلم هذا الأمر، وفي ثوان معدودة تظهر أمامك الخرائط الذهنية بشكل مباشر وسريع.
وتظهر الخريطة الذهنية على شكل مجموعة من النصوص والخيوط التي تربط بينها، وعند الضغط على أي نص أو رابط، يظهر أمامك مربع البحث ليخبرك بالمزيد من التفاصيل على هذا الجانب وتحليله بشكل أكثر.
استخدامات "نوت بوك إل إم"رغم أن هذه المزايا تبدو قليلة بعض الشي، فإنها تتيح العديد من الاستخدامات المتنوعة والمبتكرة للأداة، ولا تقف عند المساعدة على الدراسة.
ومن بين أهم الاستخدامات، يمكنك بناء صفحة الأسئلة الشائعة الموجودة في الكثير من المواقع والبرمجيات مباشرة عبر استخدام هذه الأداة، إذ كل ما تحتاج إليه هو إضافة موقعك والمحتوى الذي تعتمد عليه إلى الأداة، وتطلب منها توليد صفحة الأسئلة الشائعة.
كذلك يمكنك استخدام الأداة لبناء خط زمني واضح للأحداث الزمنية المختلفة، وهو الخط الزمني الذي يمكن أن يستخدم من قِبل صناع محتوى التاريخ أو حتى الراغبين في فهم التاريخ ودراسته بشكل أفضل، ويمكن بالطبع الاعتماد على الأداة لتوليد وثائق الإحاطة والملخصات الضرورية للأعمال.
إعلان