الصورة في مخيّلة الذكاء الاصطناعي
تاريخ النشر: 27th, January 2024 GMT
يحاول بعضٌ مِنَّا أن يترجم أفكاره إلى صور تفرزها مخيّلته الواسعة، ويحاول البعض -خصوصا في فترة الطفولة- أن يجعل من هذه الأفكار صورا يرسمها على الأوراق البيضاء؛ علّها تسعف خواطره المشدودة إلى أمنيات يتوق إليها أو رغبات يرجوها أن تتحقق؛ فيجد ضالتَه -الممكنة- عبر الإبداع في تحويل هذه المشاعر والأفكار إلى صور -ساكنة- تَعبْر به -في لحظتها- إلى عالَم مفقود يتجسّده الخيال ينشد بواسطته واقعه المفقود.
أعود إلى موضوعنا الخاص بهذا المقال الذي يتناول قدرات أخرى لنماذج الذكاء الاصطناعي، وهي القدرة على توليد الصور وتخيّلها وفقا للوصف البشري الذي يعين به النموذج التوليدي على التخّيل المناسب للصورة المقترحة، وسيكون التركيز في هذا المقال على أحد أهم أدوات توليد الصور المستعملة في الذكاء الاصطناعي التي تُعرف بـ«دالي» «DALL.E» المندرجة تحت مظلة نموذج «شات جي بي تي 4». سنتطرق إلى تعريف القارئ بهذه الأداة الذكية، وآلية عملها وقدراتها، وعرض التجربة الشخصية بعد استعمال هذه الأداة التي أمكن أن تحدد مفاصل القوة والضعف لديها. أضافت شركة «OpenAI» أداة «دالي» لأول مرة في عام 2021م؛ لتكون ضمن الأدوات الذكية التابعة لـ«شات جي بي تي 4» الذي أُلحِقَت به -مؤخرا- أدوات أخرى بعضها تُعدّ فرعيةً تندرج تحت مظلة الأدوات الرئيسة مثل أداة «دالي»؛ إذ نجد -حتى اللحظة- وجود ما يقرب من اثنتي عشرة أداة فرعية تابعة لأداة «دالي» تتعلق جميعها بالصور وتوليدها -تتشابه في وظائفها التوليدية العامة للصور- وأُخِذَ اسم «دالي DALL.E» من اسم الفنان التشكيلي الأسباني «سلفادور دالي» «Salvador Dali» (1904م- 1989م) الذي يُعدّ علما من أعلام المدرسة السريالية الخاصة بالفنون، وكذلك ارتبط جزءٌ آخر لاسم الأداة من شخصية WALL-E من ابتكار شركة «Pixar» المتخصصة في الإنتاج الفني «الكارتوني» عن طريق الأنظمة الحاسوبية.
من المهم أن نطوفَ -بشكل مختصر- داخل هذه الأداة الذكية؛ لنعرفَ خباياها الرقمية التي تجعل منها أداةً ذكيةً قادرةً على تخيّل الصور وتوليدها. تتبنّى خوارزمية الذكاء الاصطناعي في «دالي» نظامَ التعلّمِ العميق «Deep Learning» الذي يعمل وفق أنظمة رياضية تعينه في أهم مراحله «مرحلة التعلّم أو التدرّب»، وإحدى أهم هذه الأنظمة ما يُعرف بـ«الانتشار الخلفي» «BackPropagation» -الذي سبق تناوله في مقالات سابقة- وكذلك «دالة الكلفة» «Cost Function» التي تُعرف أيضا بـ«دالة الخسارة» «Loss Function» التي تعمل جنبا إلى جنب مع نظام «الانتشار الخلفي»؛ لتقييم قدرة تدرّب الخوارزمية على البيانات المُعطَاة وقياس تناسبها وملاءمتها، وهذه من المبادئ العامّة التي تشترك فيها معظم خوارزميات الذكاء الاصطناعي التي تعتمد على نظام «التعلّم العميق»، وسبق شرحه أيضا في مقالات سابقة. نُقرّب النظرَ في هذا المقال فيما يتعلق بآلية عمل أداة «دالي» التي تكون مرحلة «التدرّب» أولى الأعمال التي تباشرها خوارزمية هذه الأداة وأهمها، وهنا يكون التدرّب على مجموعة كبيرة من الصور المتعددة التي تمنح هذه الأداة القدرة على فهم أنماط متباينة للصور وتخيّل مفاصلها الفنية وفق طريقة تشبه -إلى حد كبير- آلية الدماغ البشري في تخيّل الصور وتوليدها الذهني -يقظة ومناما.
تتكون المنظومة الرقمية الرئيسة في خوارزمية «دالي» من نظام يُعرف بـ«المُشفِّر الآلي» «Auto-encoder» الذي يتفرّع منه نظامان هما: المُشفِّر «Encoder» الذي يعمل على استقبال الصور، وكاسر التشفير «Decoder» الذي يعمل على توليد الصور بعد فك شيفرتها الرقمية، ويمكن تشبيه هذا النظام الرئيس -الذي تعتمد عليه أداة «دالي»- بنظام «المحوِّل» «Transformer» الذي يعمل عليه نموذج «شات جي بي تي» في توليد النصوص- وسبق شرحه في مقال سابق- إلا أنه في مراحل التدرّب عند أداة «دالي»، يتدخل نظام «المحوِّل» الذي يعمل على نقل النص التوصيفي للصور -الذي يصفه الإنسان للنموذج بواسطة النص- فيحوّله إلى مدخل آخر يساعد خوارزمية «دالي» على تخيّل الصور وتوليدها، وهذا ما يفسّر السعة الحاسوبية الكبيرة التي تتطلبها أداة «دالي» مقارنة بالسعة الحاسوبية الأقل المُتطلبة للنموذج التوليدي الخاص بالنصوص. هناك تفاصيل تقنية معقدّة تتعلق بآلية عمل خوارزميات «دالي» وتفرعاتها الرياضية التي لا أرى أن هذا المقال يتسع لتناولها، ولا أرى ضرورةً لسردها؛ إذ يمكن للقارئ -المهتم بهذه التفاصيل- السعي في فهمها عبر المصادر الرقمية المفتوحة والمتعددة، وإنما أردت أن أفتحَ باب التشويق في كشف لثام هذه الأداة التي اكتشفت -عبر تجربتي الشخصية لها- بعضا من زوايا قوتها وضعفها كما سيتضح في السطور الآتية.
لست من هواة الفن والصور -إلى حدِّ الشغف- وارتباطاتها الوظيفية -الرسم والتصوير- وكان استعمالي لأداة «دالي» رغبةً في فهم عمل خوارزمية هذه الأداة، والتأمل في قدرتها على تخيّل الصور وتوليدها؛ فجربت طرقا عدة في التفاعل مع هذه الأداة منها إعطاء وصفٍ -نصّي- باللغتين العربية والإنجليزية لصورٍ تجوب في خاطري أو أستوحيها من محيط بيئتي، وتجربة منح الوصف عموما -لا تفصيل فيه- ومنحه تفصيلا دقيقا للصورة المطلوبة، وطلب تعديل الصور -بعد توليدها- عبر حذفٍ أو إضافةٍ، وخرجت بنتائج أسعفتي في فهم بعضٍ من سلوك خوارزمية هذه الأداة من حيثُ مفاصلُ القوةِ والضعف؛ فوجدت الأداة قادرة -نسبيا- على التفاعل مع النص الواصف للصورة؛ لتحوّل الوصف النصّي إلى صورة تحاكي الصور الواقعية -من حيث جودتها- وتزداد الصورة واقعيةً -في عكسها للصورة المطلوبة- كلما زادت تفاصيل الوصف النصّي، وتقل الواقعية مع الابتعاد عن تقديم التفاصيل الدقيقة والاكتفاء بالوصف -النصّي- العام. تقع كذلك خوارزمية «دالي» في مأزق التحليل غير الدقيق للوصف النصّي -في بعض الحالات- إذ تتجاوز أداة «دالي» -في حالات كثيرة- بعضَ ملامح توصيف الصورة المطلوبة حتى مع الطلبات -المتكررة- للتعديل وتجنب تجاوز هذه الملامح؛ فتظل الخوارزمية عاجزة -في هذه الحالات- عن بلوغ أفضل درجات التفاعل بين النص التوصيفي للصورة وبين الصورة الناتجة من تأويل النص، وهذا ما يمكن اعتباره أمرا واردا عند بداية الطريق لهذه النماذج الرقمية، ويمكن تجاوز مثل هذه التعرجات الرقمية وتحسينها في نسخٍ قادمة لهذه النماذج بعد التطويرات التي ستُمنَحُ لمثل هذه النماذج الذكية، ولا عجب أن نرى ما هو أكثر دهشةً في قادم السنوات المقبلة فيما يتعلق بالثورة الرقمية بما في ذلك توليد الصور الذي سيُحدث نقلة نوعية -مفتوحة للجميع- في تخيّل الصور وتوليدها عبر خوارزميات الذكاء الاصطناعي.
د. معمر بن علي التوبي أكاديمي وباحث عُماني
المصدر: لجريدة عمان
كلمات دلالية: الذکاء الاصطناعی هذه النماذج شات جی بی تی هذه الأداة هذا المقال الذی یعمل النص ی التی ت الذی ی
إقرأ أيضاً:
الذكاء الاصطناعي يتيح للأطباء الدردشة مع السجلات الطبية
بات بوسع أطباء الرعاية الصحية في ستانفورد في الولايات المتحدة الآن التفاعل مع السجلات الطبية للمريض من خلال برنامج مدعوم بالذكاء الاصطناعي يُسمى ChatEHR، وذلك بنفس الطريقة التي يمكن بها للناس "الدردشة" مع نماذج لغوية كبيرة مثل GPT-4.
تُمكّن هذه التقنية، التي لا تزال في مرحلة تجريبية، الأطباء من طرح أسئلة حول التاريخ الطبي للمريض، وتلخيص المخططات تلقائيًا، وتنفيذ مهام أخرى.
ويستخدم برنامج ChatEHR معلومات من السجلات الصحية للمريض لتقديم إجابته.
قال الدكتور نيغام شاه، رئيس قسم علوم البيانات في "ستانفورد للرعاية الصحية"، والذي قاد الفريق في تطوير هذه التقنية "يمكن للذكاء الاصطناعي أن يُحسّن ممارسات الأطباء ومقدمي الرعاية الصحية الآخرين، ولكنه لا يكون مفيدًا إلا إذا كان مُدمجًا في سير عملهم وكانت المعلومات التي تستخدمها الخوارزمية في سياق طبي". وأضاف "يتميز ChatEHR بالأمان؛ فهو يستقي البيانات الطبية ذات الصلة مباشرةً؛ وهو مُدمج في نظام السجلات الطبية الإلكترونية، مما يجعله سهلًا ودقيقًا للاستخدام السريري".
كان البرنامج قيد التطوير، منذ عام 2023، عندما أدرك فريق من الباحثين في كلية الطب بجامعة ستانفورد بقيادة شاه إمكانات نماذج اللغة الكبيرة واستلهموا فكرة إنشاء شيء مفيد للأطباء.
قال الدكتور مايكل فيفر، رئيس قسم المعلومات والرقمنة في مركز ستانفورد للرعاية الصحية وكلية الطب، والذي ساهم في قيادة تطوير البرنامج ودمجه "يفتح ChatEHR آفاقًا جديدة للأطباء للتفاعل مع السجلات الصحية الإلكترونية بطريقة أكثر انسيابية وكفاءة، سواءً كان ذلك من خلال طلب ملخص للسجل بأكمله أو استرجاع بيانات محددة ذات صلة برعاية المريض".
اقرأ أيضا... الذكاء الاصطناعي يحسّن علاج سرطان الرئة
بحث وتلخيص وجمع معلومات أسرع
حاليًا، لا يتوفر البرنامج إلا لمجموعة صغيرة من الأفراد في مستشفى ستانفورد أي 33 طبيبًا وممرضًا ومساعدًا طبيًا وممرضًا ممارسًا يراقبون أداءه، ويحسنون دقته، ويعززون فائدته.
قالت الدكتورة سنيها جاين، أستاذة الطب المساعدة السريرية، ومن أوائل مستخدمي هذه التقنية إن "جعل السجلات الطبية الإلكترونية أكثر سهولة في الاستخدام يعني أن الأطباء سيقضون وقتًا أقل في البحث في كل زاوية وركن فيها عن المعلومات التي يحتاجونها". وأضافت "يمكن لـ ChatEHR مساعدتهم في الحصول على هذه المعلومات مُسبقًا، مما يتيح لهم تخصيص وقتهم لما هو مهم: التحدث مع المرضى ومعرفة ما يحدث".
عند وصول الأطباء إلى الأداة، يُستقبلون بـ: "مرحبًا، ???? أنا ChatEHR! هنا لمساعدتك في الدردشة بأمان مع السجل الطبي للمريض".
عندها، يمكنهم كتابة مجموعة من الأسئلة حول المريض: هل يعاني هذا الشخص من أي حساسية؟ ماذا أظهر آخر فحص للكوليسترول؟ هل خضع لتنظير القولون؟ هل كانت النتائج طبيعية؟
وصرح شاه بأن ChatEHR ليس مخصصًا لتقديم المشورة الطبية. البرنامج أداة لجمع المعلومات تُسرّع العملية، وفي الحالة المثالية، تُوفّر الوقت. جميع القرارات تبقى في أيدي خبراء الرعاية الصحية.
يُمكن لـ ChatEHR تسريع العديد من المهام المُستهلكة للوقت والتي تُشكّل جزءًا من العمل اليومي للطبيب.
يشير الدكتور جوناثان تشين، وهو طبيب مُستشفى وأستاذ مُساعد في الطب وعلوم البيانات الطبية الحيوية، إلى أنه عندما يأتي مريض إلى غرفة الطوارئ، يجب على الطبيب المُناوب إيجاد طريقة لمساعدته بسرعة.
وأضاف تشين "ليس ألم الصدر الذي يشعر به المريض في تلك اللحظة، مثلا، هو المهم فحسب، بل قصته كاملةً، والأسباب التي أدت إلى هذه اللحظة. جميع سجلاته الطبية السابقة مهمة. ما الأدوية التي كان يتناولها، وما الآثار الجانبية التي عانى منها، وما العمليات الجراحية التي خضع لها، وكيف أثر ذلك عليه؟"، مؤكدا "يتطلب الأمر جهدًا كبيرًا للعودة إلى كل تلك المعلومات خلال حالة حساسة زمنيًا. لذا، فإن تسريع هذه العملية سيكون مفيدًا للغاية".
وأضاف أن ChatEHR قد يكون مفيدًا في بعض حالات نقل المرضى. عادةً ما يصل المرضى الذين يُنقلون إلى مستشفى ستانفورد لتلقي رعاية أكثر تقدمًا ومعهم حزمة كبيرة من المعلومات، قد تصل أحيانًا إلى مئات الصفحات".
ويؤكد تشين "التاريخ الطبي بأكمله بالغ الأهمية، لكن التدقيق فيه ومراجعته يُمثلان تحديًا كبيرًا". وأضاف: "إن تلخيص ChatEHR لهذا التاريخ الطبي في ملخص ذي صلة سيجعل هذه العملية أكثر سلاسة". وأوضح أن ChatEHR لا يقتصر على تقديم ملخصات عالية المستوى فحسب، بل يُمكن للطبيب أيضًا طرح أسئلة متابعة استقصائية لفهم تاريخ المريض بشكل أفضل.
يعمل الفريق أيضًا على تطوير "الأتمتة"، أو مهام تقييمية تستند إلى تاريخ المريض وسجلاته. على سبيل المثال، ابتكر الفريق أتمتة تُحدد ما إذا كان من المناسب نقل المريض إلى وحدة رعاية المرضى في مستشفى تابع لجامعة ستانفورد الطبية، والتي توفر غرفًا إضافية للمرضى.
وقال شاه "يُوفر علينا هذا التقييم الآلي العبء الإداري المتمثل في التدقيق في معلومات المريض، ويُساعدنا على تحديد إمكانية نقل المريض بسرعة، مما يُتيح الوصول إلى الرعاية هنا في مستشفى ستانفورد".
يعمل شاه وآخرون على أتمتة أخرى، من شأنها تحديد أهلية الحصول على رعاية المسنين، على سبيل المثال، أو التوصية برعاية إضافية بعد الجراحة.
إطلاق النظام
سيواصل شاه وفريقه تقييم حالات استخدام ChatEHR. كما يجري تطوير ميزات أخرى لضمان الدقة، مثل الاستشهادات التي توضح للأطباء مصدر المعلومات داخل السجل الطبي.
مع تطور التكنولوجيا، يتمثل الهدف في إتاحة ChatEHR لجميع الأطباء الذين يطلعون على سجلات المرضى. وصرح شاه "نُطلق هذا النظام وفقًا لإرشاداتنا المتعلقة بالذكاء الاصطناعي المسؤول، ليس فقط لضمان الدقة والأداء، بل أيضًا لضمان توفر الموارد التعليمية والدعم الفني اللازم لجعل ChatEHR قابلًا للاستخدام ومفيدًا لكوادرنا".
مصطفى أوفى (أبوظبي)