أسرار بلاد الرافدين.. كيف تمكن الذكاء الاصطناعي من قراءة النصوص المسمارية القديمة؟
تاريخ النشر: 30th, August 2024 GMT
مقدمة الترجمة
في هذه المادة المترجمة من موقع نيو ساينتست، يُسلَّط الضوء على الكتابة المسمارية التي تعود لحضارة بلاد الرافدين، العراق حاليا. وتحكي المادة جهود الباحثين في استخدام تقنيات الذكاء الاصطناعي لقراءة نصوص إحدى أقدم حقب التاريخ الإنساني، أما كيفية حدوث ذلك، هو ما تستعرضه هذا المادة.
نص الترجمةوراء باب مغلق في المتحف البريطاني بلندن، تقع مكتبة جميلة ذات أسقف مرتفعة ومقوّسة مستترة داخل غرفة سرية، هناك حيث يفتح الدكتور إيرفينغ فينكل، مساعد أمين المتحف البريطاني للنصوص ولغات وثقافات بلاد الرافدين القديمة، أحد الأدراج ليُخرج لوحًا من الطين مُحترقًا ومتصدعًا يحمل أحرفًا صغيرة تنتمي لأقدم لغة في العالم، يتضح أنها قائمة بالتنبؤات المستقبلية، أو نصوصا تحمل دلالة على حدوث شيء ما في المستقبل.
من خلفنا، يبذل مصور جهدًا مُضنيًا لالتقاط صور دقيقة لهذه الكتابة من خلال تسليط الأضواء بعناية لإبراز النقوش المنحوتة بعمق على الألواح. يُجسِّد هذا العمل جهودًا ثورية لاستخدام القدرة الحاسوبية الحالية لإعادة إحياء هذه السجلات التي تعود إلى ما يقرب من 5000 عام، وإزاحة الستار عن أسرار جديدة لأولى حضارات العالم. وعلى الرغم من فك شفرة نظام الكتابة القديمة هذا قبل 165 عامًا، فإن أغلب النصوص التي استخدمت هذا النظام لم تُترجم قط إلى اللغات الحديثة، لأن مهمة كهذه معقدة للغاية وتعتمد على خبراء مثل فينكل لترجمتها وتحليلها.
غير أن الوضع تغيّر الآن بفضل التطورات التي طرأت على مجال الذكاء الاصطناعي، إذ تُدرَّب الحواسيب على قراءة وترجمة الكتابة المسمارية، وجمع الألواح القديمة المتناثرة والمُحطَّمة معًا على نحوٍ مبتكر لإعادة إنشاء مجموعات من النصوص والوثائق التي تعود إلى المكتبات القديمة، وحتى القدرة على التنبؤ بأجزاء من النصوص المفقودة. ولأول مرة منذ العصور القديمة، ستساعد هذه الأدوات في قراءة أقدم الأعمال الأدبية كاملة، وهو ما سيكشف النقاب عما كانت عليه الحضارات منذ فجر التاريخ.
تبدأ قصة الكتابة المسمارية التي يعود تاريخها إلى 6000 عام في بلاد الرافدين، تلك المنطقة الخصبة الواقعة بين نهري دجلة والفرات، التي هي العراق حاليا. تبدأ القصة مع تحول شكل حياة الناس بانتقالهم من العيش في مستوطنات زراعية صغيرة إلى مراكز حضرية كبيرة. وانطلاقًا من هذا المكان، بنى السومريون أولى مدن العالم، وكانت أوروك من أهمها. وبفضل المعابد والنظام المائي في القنوات، كانت المدينة موطنًا لما يصل إلى 50 ألف شخص بحلول عام 3000 قبل الميلاد، كما كانت المركز الإداري للمنطقة ببنية بيروقراطية لإدارة نظام العمل المعقد الذي تطور مع الوقت.
على الرغم من أن هؤلاء الأشخاص تحدثوا بلغة تُدعى السومرية، تختلف تمامًا عن أي لغة أخرى نعرفها، فضلًا عن أنها انقرضت منذ فترة طويلة، فإننا مع ذلك نملك سجلًّا مدهشًا عن حياتهم، فعلى ما يبدو قد اشتعل أول فتيل للكتابة من هنا. في ذلك الوقت، كانوا يستخدمون نهاية قصبة لضغطها في الطين الرطب لصنع أشكال تشبه المثلثات أو الإسفين (أداة بسيطة مثلثة الشكل تستخدم في البناء والنجارة للفصل بين جسمين*)، وهو ما أعطى هذه الكتابة اسمها الحديث: الكتابة المسمارية (Cuneiform)، المشتق من الكلمة اللاتينية (Cuneus)، التي تعني الإسفين. صحيح أننا نربط الآن الكتابة بالشعر والأدب، إلا أن الكتابات المبكرة لم تكن لأغراض كهذه، بل تمحورت حول أغراض إدارية مثل تتبع نقل العبيد، على سبيل المثال، أو تسلُّم الحيوانات. بمعنى آخر، تمحور هدفها الرئيسي في تسجيل المعاملات الاقتصادية والإدارية.
لقد استغرق الأمر وقتًا طويلًا حتى تحولت الكتابة المسمارية من كونها مجرد وسيلة للتسجيل الإداري إلى أداة للتعبير اللغوي. ظهرت أولى النقوش الملكية نحو 2700 قبل الميلاد، ثم ظهر أقدم النصوص الأدبية بعد ذلك بـ100 عام تقريبًا. كانت إنهدوانا من أوائل الكتّاب المعروفين، وهي أميرة وكاهنة وشاعرة عاشت قبل نحو 4300 عام. إذ كتبت العديد من الترانيم والأساطير، وأشهر نصوصها "ملحمة جلجامش"، التي تتحدث عن سعي ملك إلى الحياة الأبدية أو الخلود، وتتضمن قسمًا كان في الغالب مقدمة لقصة الطوفان الدينية. ولا يزال تأثير الثقافة السومرية حاضرًا في حياتنا اليومية إلى الآن ويشكِّل أساسًا للأنظمة والمفاهيم الحديثة، ليس من خلال القصص الدينية فقط، ولكن أيضًا في نظامنا الزمني. وذلك لأن نظامهم في العد الستيني القائم في الأساس على العدد 60 هو السبب وراء وجود 60 ثانية في الدقيقة و360 درجة في الدائرة.
فك شفرات الماضيالكتابة المسمارية هي في الأساس نظام كتابة وليست لغة في حد ذاتها، بمعنى أنها أشبه بكيفية استخدام الحروف الإنجليزية في كتابة الفرنسية أو الألمانية. وعلى الرغم من اندثار اللغة السومرية فيما بعد، فإن الكتابة المسمارية واصلت سعيها متلمسة طريقها إلى هذا الشكل الذي كُتبتْ به العديد من اللغات الأخرى، مثل الأكادية والحثية والفارسية القديمة. واستُخدمت هذه الكتابة مدة 3000 عام قبل أن تندثر مخلِّفةً وراءها سجلات لمواليد ووفيات الممالك القديمة. وفي النهاية، تمكنا من التوصل إلى هذا التاريخ بفضل الطين الذي نُقشت عليه هذه الكتابة، وهو مادة رخيصة الثمن ومتوفرة بسهولة.
ومن جانبه، يقول فينكل: "إننا محظوظون جدًّا لأن أي لوح منقوشة عليه هذه الكتابة يبقى على حاله ما لم يُلقَ في النهر أو يُحطَّم تماما". واليوم ما زالت آلاف من هذه الألواح الطينية موجودة هناك، وتشكِّل جزءًا أساسيًّا من التراث الثقافي العالمي. وهي عبارة عن سجلات لأولى الإمبراطوريات العظمى في العالم، إضافة إلى ترانيم ورسائل وقوائم تسوق وحتى شكاوى العملاء. وعن ذلك، يقول إنريكي خيمينيز أستاذ الآداب القديمة والشرقية في جامعة لودفيغ ماكسيميليان في ميونيخ بألمانيا: "يقولون إن النصف الأول من تاريخ البشرية لم يسُجِّل إلا على هذه الألواح المسمارية".
حتى يومنا هذا، لا يزال العلماء يكتشفون العديد من الأسرار الجديدة عن الألواح المسمارية. في عام 2017، توصل الباحثون إلى لوح صغير عمره 3700 عام يُعرَف باسم بليمبتون 322، ومن المفترض أنه أقدم جدول لحساب المثلثات في العالم، وهو ما أظهر أن البابليين -الشعب الناطق باللغة الأكادية الذي يعيش في وسط وجنوب بلاد الرافدين- هم أول من درس علم المثلثات، وليس الإغريق. وفي العام الماضي، أظهر تحليل جديد لأحد الألواح -التي عُثر عليها في العراق عام 1894- أن البابليين تعاملوا مع حساب المثلثات قبل قرون من فيثاغورس.
ومع وجود نحو 75 شخصًا فقط يمكنهم قراءة الكتابة المسمارية بطلاقة، فإن الغالبية العظمى من الألواح تظل مستترة خلف الغرف الخلفية للمتاحف متراكمًا عليها التراب. وتكمن إحدى التحديات الرئيسية في أن الكتابة المسمارية غاية في التعقيد كما يؤكد خيمينيز بقوله: "المشكلة أن النص مبهم للغاية، فلا توجد طريقة واحدة لكتابة كلمة معنية بصورة ثابتة"، فضلًا عن أن الغالبية العظمى من الألواح غير مكتملة، فمعظمها مكسور أو مشوّه أو مُفتّت إلى شظايا. وفي كثير من الأحيان، تكون الحواف متآكلة تاركة القصص ضائعة بلا بدايات أو نهايات، أو بثغرات في السرد".
وهذا هو الحال بالنسبة لأقدم مكتبة ملكية في العالم نجت من عواصف الزمن، وهي مكتبة الملك آشور بانيبال ملك الإمبراطورية الآشورية. جمع هذا الملك في مدينة نينوى التي تقع بالقرب من مدينة الموصل الحديثة في شمال العراق، مكتبة ضخمة من الأعمال المكتوبة من جميع أنحاء بلاد الرافدين، وبلغ عدد الألواح في المكتبة حوالي 30 ألف لوح تحوي كل شيء بدءًا من الطقوس والموسوعات الطبية مرورًا بالأرصاد الفلكية ووصولًا إلى إنجازات العائلات الملكية. وقد وصفها الكاتب إتش جي ويلز بأنها "أثمن مصدر للمواد التاريخية في العالم"، لكنها دُمرت وأُحرقت وكان السبب الرئيسي المسؤول عما حاق بها هو غزو المدينة عام 612 قبل الميلاد. والأدلة الملموسة على ذلك تقبع في المتحف البريطاني حيث تُخزّن بقايا هذه المكتبة، ولا تزال آثار الحروق السوداء بادية على هذه الألواح.
في السياق ذاته، يقول خيمينيز إن تجميع هذه الأجزاء معًا يشبه تجميع عدد من ألغاز الصور المعقدة المبعثرة مع عدم وجود صورة على الصناديق يمكنك الرجوع إليها لتخبرك بما ينبغي أن تبحث عنه فيها، ومما قد يزيد الأمور تعقيدًا أنه يمكن لأجزاء من لوح واحد أن تكون متناثرة في أنحاء العالم. ومن جانبه، يقول فينكل: "قد تتناثر أجزاء من اللوح نفسه في معظم أنحاء العالم. فربما تجد قطعة منه في شيكاغو، وقطعة أخرى في برلين وقطعة ثالثة هنا". واستنادًا إلى ذلك، تبدو عملية إعادة تجميع اللغز عملية شاقة تعتمد على الحظ والذاكرة. فمثلًا استغرق الأمر أكثر من 100 عام للتعرف على بداية ملحمة جلجامش عن طريق تحليل قطعة صغيرة مخزنة في درج متحف. إلا أننا آنسنا رياحًا جديدة تهب مؤخّرًا على هذا المجال بفضل الحواسيب.
في عام 2018، أنشأ خيمينيز مشروع الأدب البابلي الإلكتروني، الذي يشمل جزءًا يُسمى Fragmentarium""، وهو جزء من المشروع يستخدم الذكاء الاصطناعي لإعادة تجميع مكتبة آشور بانيبال وغيرها من المجموعات الرائعة المكتوبة بالخط المسماري، وذلك من خلال تحديد الأجزاء التي يتناسب بعضها مع بعض لترجمتها. ولتنفيذ ذلك، يستخدم خيمينيز خوارزميات مطورة لمقارنة نسخ مختلفة من النصوص ذاتها بدقة، باعتبار أن ثمة نسخًا متعددة من النص نفسه مع اختلافات بسيطة في الغالب.
كما يمكن تدريب الذكاء الاصطناعي على الترجمات الحرفية لهذه النصوص بكتابة الأحرف المسمارية بالأبجدية اللاتينية وفقًا للطريقة التي تُنطق بها (وهو أشبه بكتابة الأحرف الصينية بنظام البينين، أي الاعتماد في نطقها على لغة الماندرين). بتبني هذا النهج، يمكن للذكاء الاصطناعي بعد ذلك التنبؤ بالرموز المسمارية التي قد تكون ضمن الأجزاء المفقودة، كما يمكنه أيضًا البحث عن رموز مسمارية معينة في قاعدة بيانات ضخمة من الشظايا المتناثرة.
في عام 2019، ساعد هذا النهج في التعرف على العديد من الأجزاء المفقودة من ملحمة جلجامش. وبجانب ذلك، تمكن أيضا من الكشف عن نوع جديد من الأدب القديم، وهو نص يتكون من محاكاة ساخرة (بما في ذلك نكات حول روث الحمير) استخدمها أطفال المدارس لتعلم الكتابة. وللتوسع أكثر، قرر خيمينيز التعاون مع أنمار فاضل من جامعة بغداد في العراق لتجميع نوع آخر من النصوص لم يكن معروفا من قبل، وهو ترانيم لتمجيد مدينة معنية، وما عثروا عليه كان ترانيم مخصصة لمدينة بابل، تتضمن تفاصيل عن حياة المعبد. وفي العام الماضي، تمكن الذكاء الاصطناعي لأول مرة بصورة مستقلة من التعرف على قطعة مفقودة من قصيدة الصالح المتألم الشهيرة (التي تتساءل عن سبب شقاء الأبرار). يقول خيمينيز: "لولا الذكاء الاصطناعي لما تمكن البشر من سبر أغوار مثل هذه الجوانب".
على الجانب الآخر، صب بعض الباحثين جلّ اهتمامهم على الألواح المنقوشة عليها تفاصيل إدارية، وهي تفاصيل قد تبدو للوهلة الأولى عادية لكنها لم تكن كذلك في الحقيقة. وتقول إميلي باغيه بيرون من جامعة أكسفورد: "اتضح أن هذه الألواح تحمل الكثير من النصوص المتعلِّقة بإيصالات توثيق المعاملات التي تحدث بين مؤسسات مختلفة مثل المعابد وقصر الحاكم المحلي، أو بين الأفراد مثل التجار". وتضم هذه النصوص في كنفها ثروة من المعلومات التي تمس قلب الحضارات القديمة في بلاد الرافدين. فالنصوص السومرية على سبيل المثال غالبا ما تضم أسماء الأفراد والتواريخ، وهو ما يسهِّل تتبع الدور الذي يؤديه الفرد في المجتمع. اكتشف الباحثون على سبيل المثال مجموعة مكونة من 80 لوحا تُعرف باسم أرشيف ماما -أُمّي Mama-ummi، يعود تاريخه إلى حوالي 2300 قبل الميلاد، وتشير هذه الألواح إلى مشرفة تُدعى ماما -أُمي كانت مسؤولة عن فريق يضم 180 نساجًا، والمثير للدهشة هو وجود فرص عمل متنوعة للنساء في ذلك الوقت.
إن مشروع الترجمة الآلية والتحليل الآلي للنصوص المسمارية الذي أنشأته هيذر بيكر من جامعة تورنتو عام 2017، بالتعاون مع باغيه-بيرون لتنسيقه، يُعتبر خير وسيلة للتعامل مع الكميات الهائلة من المعلومات الإدارية المنقوشة على هذه الألواح. في التجارب الأخيرة، اختُبرتْ خوارزميات مختلفة مُدربة على 45.500 عبارة مترجمة حرفيا، تتألف كل منها مما يصل إلى 19 كلمة لتحديد قدرتها على ترجمة الكلمات من السومرية إلى الإنجليزية. أظهرت النتائج التي نُشرت في 2021 أن خوارزمية معينة يمكنها ترجمة هذه النصوص بدقة تصل إلى 95%. كما يمكن لهذا النظام أيضًا استخراج معلومات رئيسية من النصوص وتحديد فئات معينة مثل الأشخاص والأماكن.
في العام الماضي، وجد عالم الحاسوب غابرييل ستانوفسكي وزملاؤه طريقة للتنبؤ بالنص المفقود على الألواح بطريقة مشابهة لتلك المستخدمة في التنبُّؤ بالكلمات تلقائيًّا على الهواتف المحمولة، واستعانوا بالذكاء الاصطناعي للتعلم العميق، وزوّدوه بترجمات حرفية مكونة من 10,000 لوح مسماري مكتوب باللغة الأكادية، ومن بعدها اكتشفوا أن بإمكانه اقتراح كلمات صحيحة سياقيًّا لملء الثغرات بدقة تصل إلى 89%. لا يقتصر الأمر على هذا الحد، بل يمكننا استخدام الذكاء الاصطناعي أيضًا في تحديد تاريخ الألواح السومرية المجهولة المصدر، وهو ما يشير إليه ستانوفسكي بقوله: "إذا تمكنا من معرفة بعض الوثائق، فيمكننا تدريب الخوارزمية للتنبؤ بالتواريخ المفقودة للوثائق الأخرى". بمعنى آخر، يمكن للذكاء الاصطناعي استخدام البيانات الموجودة لتقدير تواريخ الوثائق الأخرى التي لا نعرف عنها شيئا.
وبالفعل بدأت أجهزة الكمبيوتر في إحراز تقدم نحو قراءة الرموز المسمارية، وذلك باستخدام نوع أنظمة الرؤية الحاسوبية نفسها المستخدمة في التعرف على النص. وفقا لذلك، بدأ ميلر بروسر من جامعة شيكاغو هو وزملاؤه -على سبيل المثال- في تدريب نظام للتعلم الآلي يُسمى "Deepscribe" لاكتشاف الرموز الموجودة على آلاف الألواح من أرشيف تحصين برسيبوليس -وهو أرشيف عبارة كنز من النصوص الإدارية المكتوبة باللغة العيلامية (اللغة الأساسية في الإمبراطورية الفارسية*) حوالي 500 سنة قبل الميلاد. في الوقت ذاته، تقول سوزان باولوس، وهي أحد أعضاء الفريق الذي نفذ هذا العمل في جامعة شيكاغو أيضًا: "إن قدرة جهاز الكمبيوتر على التعرف على حدود الرموز المسمارية ورسم مربع حولها، تُعدّ إنجازًا عظيمًا، فعادة لا يعرف أحد أين تنتهي إحدى العلامة لتبدأ الأخرى".
ترجمة فوريةفي نهاية المطاف، يتمثل الأمل في ربط أنظمة التعرف على الرموز المسمارية بأنظمة ترجمة اللغات الحديثة. وهو ما يعني أن بإمكاننا التقاط صورة باستخدام هاتفنا المحمول لأي نص موجود على لوح طيني والحصول على قراءة فورية لما يشير إليه النص بالضبط. غير أن هذه الجهود قد تذهب سدى إن لم تتوافر قواعد بيانات رقمية ضخمة من النصوص لتدريب الخوارزميات حتى تتمكن من التنبؤ بالكلمات التي من المحتمل أن تُكتب بجوار بعضها. ومع ذلك، لم يُترجم من بين نصف مليون نص مسماري يقبع في متاحف العالم سوى ربع مليون فقط. أما النصوص المتاحة رقميًّا فيصل عددها إلى 100 ألف فحسب. وهو ما يجعل الجهود المبذولة في سبيل فهم الكتابة المسمارية على غرار مبادرة المكتبة الرقمية المسمارية، ومشروع الأدب البابلي الإلكتروني، شديدة الأهمية لقدرتها على إحراز تقدم كبير في تعزيز هذه الأرشيفات الرقمية.
يرى الخبراء أن امتلاك الأدوات اللازمة لتحويل كميات كبيرة من النصوص إلى صيغة رقمية يجلب الكثير من المعلومات الجديدة والاتصالات الجديدة للباحثين. وبهذه الطريقة، يمكننا إنشاء مجموعة من الوثائق أو المعلومات التي تصف حياة الشعوب القديمة. إلا أن عملية كهذه تحتاج إلى جهود شاقة لالتقاط صور عالية الجودة لجميع الألواح القابعة في المتاحف والأماكن الأخرى في أنحاء العالم. وهذا بالضبط ما يحدث حاليا في المتحف البريطاني، إذ تُلتَقط صور لجميع القطع المحطمة البالغ عددها 40 ألف قطعة من مكتبة آشور بانيبال باعتبارها جزءا من مشروع الأدب البابلي الإلكتروني.
في إحدى الاستوديوهات الخاصة، يلتقط المصور ألبرتو جيانيز ست صور لكل لوح مسماري، بداية من الوجه الأمامي، والخلفي، ثم الجزء العلوي، والسفلي، ومن بعده الجوانب. في السياق ذاته، يقول جيانيزي إن النصوص المكتوبة على الألواح لا تنتهي عادة عند الحواف الظاهرة من اللوح (بمعنى أنها قد تمتد إلى الجوانب الخفية للألواح أو ربما إلى أعلى أو أسفل)، بل حتى التمييز بين الجهة الأمامية والخلفية والجزء العلوي والسفلي قد يكون صعبًا. تُدمَج بعد ذلك الصور الست معًا تلقائيًّا بواسطة برامج الكمبيوتر، ثم يحين دور خبراء الكتابة المسمارية مثل خيمينيز لفك شفرتها وترجمتها. صحيح أنه لا يمكن لأي شخص زيارة الغرف الخلفية السرية للمتاحف، إلا أننا سنتمكن جميعا في القريب العاجل من مشاهدة مكتبة آشور بانيبال والعديد من النصوص المسمارية الأخرى المفقودة منذ زمن طويل من منازلنا المريحة دون الحاجة إلى الذهاب إلى أي مكان.
مع انتهاء زيارتي لمكتبة المتحف البريطاني المميزة بأسقفها المقوسة، وانضمامي إلى الحشود التي تتدفق إلى المعارض في المتحف، تساورني دهشة اتجاه ما خضت غماره للتوّ، وهو سفري عبر الزمن لمشاهدة الأفكار المكتوبة لأشخاص عاشوا منذ آلاف السنين، ومن ثَم العودة إلى الحاضر لرؤية هذه النصوص القديمة المتصدعة التي أُعيد تجميعها مرة أخرى وفك تشفيرها في العالم الرقمي. أعتقد أن آشور بانيبال لو كان موجودًا لبدا فخورًا بالجهود التي تُبذل اليوم لإحياء تراثه.
نقش بيستونربما كان سيتعذر على الخبراء فك رموز الكتابة المسمارية لولا نقش بيستون. ويُعد هذا النصب المنقوش بثلاث لغات والقابع بأعلى جبل يتعذر الوصول إليه في إيران، المفتاح الرئيسي لفك شفرة الكتابة المسمارية. إنه أشبه بحجر رشيد الذي كان مفتاحًا أساسيا أيضا لفهم الهيروغليفية المصرية. يعود النقش المنحوت إلى حوالي 520 قبل الميلاد لتخليد ذكرى تمرد أخمده الملك الفارسي داريوس. ويتضمن النقش ثلاث نسخ من النص نفسه كُتبت بثلاث لغات مختلفة من الكتابة المسمارية التي لم تكن سوى ألغاز في ذلك الوقت الذي تسلق فيه المستكشفون الغربيون لأول مرة سلالم متأرجحة لنسخ النصوص من أعلى الجبل عام 1764.
كانت أول اللغات الواردة في نقش بيستون وتمكن المختصون من فك شفرتها هي اللغة الفارسية القديمة. ومن خلال الطريقة التي كُتبت بها أسماء مثل داريوس، تمكن الباحثون من فك رموز نص آخر منقوش. وقد اتضح فيما بعد أنها لغة أكادية، وهي لغة مندثرة كانت تُستخدم قديما في بلاد الرافدين. وعن ذلك، يقول إيرفينغ فينكل من المتحف البريطاني في لندن: "لقد كشفت اللغة الأكادية تدريجيًّا عن أسرارها، وبدون هذا المفتاح، لا أعتقد أن أي شخص كان بإمكانه قراءتها". ومن هناك، كان من السهل نسبيًّا فك شفرة اللغة المسمارية الأصلية باستخدام العديد من النصوص الثنائية اللغة حيث كتب النُّساخ النصوص باللغة الأكادية ثم أضافوا تحتها ترجمة سومرية.
__________________
*إضافة من المترجم
هذه المادة مترجمة عن موقع نيوساينتست ولا تعبر بالضرورة عن الجزيرة نت.
المصدر: الجزيرة
كلمات دلالية: حراك الجامعات حريات أبعاد الکتابة المسماریة الذکاء الاصطناعی المتحف البریطانی على سبیل المثال بلاد الرافدین هذه الألواح على الألواح هذه الکتابة قبل المیلاد التعرف على هذه النصوص من النصوص فی المتحف العدید من فی العالم مختلفة م من جامعة من خلال من النص فی ذلک التی ت إلا أن الذی ی وهو ما
إقرأ أيضاً:
هل عبرنا الوادي الغريب ؟ الذكاء الاصطناعي يحاكينا صوتا وصورة
قبل سنوات قليلة كنت أطالع أخبار هزيمة أدوات جوجل الذكية لبطل لعبة جو (go) الذي توّج بثماني عشرة ميدالية عالمية من قبل، كان ذلك بالتحديد في 15 مارس من عام 2016، هذه اللعبة التي تتطلب الكثير من التحليل والتخطيط والسرعة أتقنتها حواسيب «ألفا جو»(AlphaGo) المطورة مما يسمى «العقل العميق لجوجل» (Google DeepMind)، ويومئذ أُعتبر ذلك بمثابة إعلان مرحلة جديدة لأدوات الذكاء الاصطناعي الخاصة بجوجل وفتحت الباب أمام تصورات لم تكن تخطر على بال كثيرين عن قدرات الآلة المستقبلية في مجالات ظلت حكرا على العقل البشري وربما ظننا أنها ستبقى كذلك.
صحيح أن تفوق الكمبيوتر على غاري كاسباروف في عام 1997 يُعد نقطة فارقة في تاريخ الذكاء الاصطناعي، إلا أن تفوقه في لعبة جو عُد استثنائيا؛ لأنه لم يكشف عن قدرة الكمبيوتر على إجراء الحسابات المعقدة فحسب (وهو ما نعرف أنه قادر على فعله بمهارة حتى مع لعبة أعقد يصل عدد الحركات الأولى الممكنة فيها إلى 360 مقابل 20 للشطرنج) بل وأن يأتي بحركات تعد «غير تقليدية». أي أنها ابتكرت استراتيجيات جديدة تمامًا، لم تكتسبها من خلال تقليد أو ملاحظة أداء البشر في اللعبة.
شكّلت هزيمة كاسباروف نقطة تحوّل دفعت كبرى شركات الذكاء الاصطناعي إلى دخول سباق لإثبات تفوقها عبر تفوق آلاتها على الإنسان، ليس في الشطرنج وحدها، بل في ألعاب أكثر تعقيدا. وهذه المرة بأسلوب مغاير لتقنيات IBM التي طورت ديب بلو (Deep Blue). ففي حين أن ديب بلو استند إلى الذكاء الاصطناعي الرمزي، اعتمدت ديب مايند DeepMind على تقنيات التعلم الآلي والشبكات العصبية الاصطناعية. ويمكننا فهم الفرق بين الخوارزميتين بالنظر إلى الذكاء الاصطناعي الرمزي على أنه يشبه البرمجة التقليدية التي تعتمد على سلسلة من الشروط (مثلا: إذا حدث كذا، فافعل كذا)، معززة بقدرات حسابية ضخمة وخوارزميات بحث متقدمة. أما أنظمة التعلم الآلي، فهي تُبرمَج عبر التعلم، فتتعلم من البيانات (مثل دراستها لمباريات جو سابقة كي تُتقن اللعبة)، دون أن تُمد بالتعليمات على نحو صريح.
نفس هذه التقنيات والأدوات من جوجل «وعقلها العميق» تسارعت خطى تطورها، مع اهتمام العالم بشكل مركز على هذه التقنيات، إلى أن أعلنت جوجل مؤخرا عن أحدث أداوتها، ومنها أداة «في أو 3» المتخصصة في إنتاج مقاطع ڤيديو، سيناريو وصوت وصورة وتمثيل وإخراج، وموسيقا وضوضاء، مع تحريك للشفاه وتعابير في الوجوه بشكل واقعي إلى حد بعيد جدا، وقد تصدرت المشهد التقني لهذا السبب. هذه الأداة مختلفة عن نظيراتها لأنها قفزت قفزات نحو الواقعية، وكما يقول الخبراء أنها أخيرا غادرت «الوادي الغريب (Uncanny valley)»، في إشارة إلى أنها بعد هذه المرحلة لم تعد غريبة وغير مألوفة بالنسبة لمعظم البشر، والوصول لهذه المرحلة يعني تقدما حاسما وغير مسبوق، الواقعية هذه لم تعد تقتصر على الشكل الظاهري فحسب، بل امتدت إلى محاكاة ديناميكيات الحركة وتفاعلات الضوء والظل وانسجام العناصر المرئية والصوتية في تناغم مدهش، يجعل الفارق بين ما هو مصنوع بالذكاء الاصطناعي وما هو حقيقي يتضاءل يوما بعد يوم. الوادي الغريب هي فرضية في علم النفس والجمال تدرس العلاقة بين مدى مشابهة كائن صناعي (روبوت، دمية، أو شخصية كرتونية ما) للإنسان وردود فعلنا العاطفية تجاهها. تفيد الفرضية أن مدى تشابه الكائن الصناعي مع الإنسان يتناسب تصاعديا مع إعجابنا به وقدرتنا على التعاطف معه. إلا أن هذا يصح لدرجة معينة فحسب. الدرجة التي يبلغ فيها الشبه اقترابا من التطابق، وعندها يثير فينا نفورا غير مبرر. أو لعله مبرر، فعدم الارتياح قادم من تلقينا للكائن كبشري، ومن ثم توترنا إزاء التفاصيل الصغيرة كحركة العين وجمود الوجه. هذا الصعود في الإعجاب والتعاطف تماشيا مع الدقة في التصوير، ثم الهبوط بانحدار إذا استمر التطور هو ما يكسب الظاهرة اسم «الوادي الغريب». وهذا تماما ما يدفع بعض صناع الأفلام المعتمدة على تقنيات CGI ليختاروا أن ينتجوا أعمال إنيمي أقل من قدرتهم الفعلية في الحقيقة: خوفا من تنفير الجمهور.
في السابق - قبل أشهر أو أسابيع فقط - كنا نرى مقاطع الفيديو المنشأة بمثل هذه الأدوات ويسهل علينا تمييزها، ففي النسخة الأولى من
هذه الأدوات كانت تنتج صوتا فقط أو صورة فقط، ثم يتعين على من يريد دمجها أن يعمل على أدوات أخرى، ويستعين بأدوات أخريات لصناعة السيناريو وضبط الشخصيات كذلك، وجاءت هذه الأداة لتقول لنا أن المستقبل الذي ربما ظنناه بعيدا، قد حان، وأنه قد تنخدع بفيديو عالي الجودة، بسيناريو وصوت وصورة -متسقة معا- وموسيقى وشخصيات كلها تم توليدها بأداة تقنية، سهلة وفي المتناول، بل أن أدوات في أو 3 تنتج أصواتا وصورا أصيلة للشخصيات، غير مستنسخة بشكل كامل من البشر، بل أن هذه التقنيات تحاكي بدقة كبيرة فيزياء العالم الحقيقي، من حركة القماش مع الريح إلى انعكاسات الضوء على الأسطح المختلفة، وتفاصيل دقيقة كالرموش وتقلصات الجلد عند الابتسام، مما يجعل الخداع البصري والسمعي أمرا في متناول الجميع تقريبا.
بالتأكيد أن إدارة مثل هذه الأداة لتنتج أفضل المشاهد يتطلب دراية وخبرة في كيفية «هندسة التعليمات» لتكون دقيقة بما فيه الكفاية دون الحاجة لكثير من التعديلات وتكرار المشاهد، فعلى من يديرها أن يهندس أوامره ويفصلها، فإذا ما طلب أحدهم منها -على سبيل المثال- مقطعا ترويجيا لشركة بيع خضار في سوق تقليدي في سلطنة عمان، واكتفى، قد تنتج له مشهدا لثلاثة باعة هندي وباكستاني وسوري يتجولون في سوق نزوى على سكوتر ويروجون بلغتهم لشركة بيع الخضار تلك، بينما يأتي «مهندس تعليمات» أدق وأخبر، ليفصل الأوامر، ويدقق في السيناريو كيف يبدأ وكيف ينتهي، ويفصل الشخصيات وسماتها ولغتها ولبسها وملامحها وطبيعتها، ثم يتعمق في طبيعة المكان والألوان من خلف المشهد والضوضاء والموسيقا الخلفية، ومن ثم عن حركة وزاوية الكاميرات لحظة بلحظة، وحركات الصوت والجسم والتعابير حتى ينتهي المقطع، بالتأكيد أن نتيجة هذه التعليمات والأوامر ستكون أفضل بكثير ومقنعة أكثر وأقرب للواقع. ربما تصل إلى حد يصعب معه على المشاهد غير المدقق أن يحكم على أصالة المشهد من زيفه، وبالمناسبة أصبحت هناك دورات تخصصية مفصلة تقوم بتدريس كيفية صياغة هذه التعليمات وهندسة الأوامر لأدوات الذكاء الاصطناعي لتوجيهه بسهولة ودقة، وربما ستكون هذه المهاراة إحدى متطلبات الكثير من الوظائف في المستقبل القريب.
في أيامنا هذه التي يستهلك فيه العالم المحتوى بشكل كثيف، ومحتوى الفيديو بشكل خاص، توفر هذه الأداة، ومثيلاتها -السابقات والقادمات- ، الكثير من الوقت والجهد والتكلفة، وفي ذات الوقت تثير الكثير من المخاوف، أبرزها سهولة صنع المحتوى المزيف، أو الإدعاء بأن المحتوى مزيف وهو حقيقي، وهذا قد يمهد لانهيار الثقة في ما نراه ونسمعه، ويصبح من السهولة بمكان أن تزيف ما تريد وتنفي ما تريد بادعاء أنه مزيف، وتضلل الرأي العام كذلك، هذه الأزمة المتوقعة في الثقة قد تمتد لتشمل كل شيء، من الأخبار إلى الأدلة في المحاكم إلى الذكريات الشخصية المسجلة، مما يخلق واقعا هشا يصعب الاعتماد على مثل هذه المقاطع.
تنبهت جوجل لهذا الأمر مثلا، وأصدرت أداة تتيح التحقق من المحتوى ما إذا كان قد صنع بأدواتها. وهناك أدوات أخرى مشابهة، غير أنها تواجه تحديا كبيرا في التفريق بين محتوى صنعه البشر، ومحتوى أنشأه الذكاء الاصطناعي بتعلمه من محتوى البشر، فلا غرابة أن تصنف أحد هذه الأدوات أن خطاب الاستقلال للولايات المتحدة الأمريكية قد تم صنعه بأدوات الذكاء الاصطناعي بنسبة ٩٩٪ فربما أن هذه الأدوات تعلمت أصلا من مثل هذه النصوص وأساليبها وتراكيب الجمل التي تستخدمها هذه الأدوات كلها من كلام البشر أصلا. صحيح أن أدوات جوجل -على وجه التحديد- تخفي علامة في تركيبتها لتدل على أنها مصنعة بالذكاء الاصطناعي، غير أن المتخصصين ومن يدققون وراء الأخبار والمقاطع المرئية، هم فقط -ربما- من سيبذلون جهدهم للتحقق، كذلك فإن هذا حاليا ينطبق على أدوات شركة واحدة فقط أما الأدوات الأخرى المنتشرة من شركات عملاقة وناشئة أو مجموعات بحثية أو دول أو مطورين مستقلين أو جهات غير معلنة، فلا ضمانة لوجود أي علامة مائية أو آلية كشف لمثل هذه المقاطع، مما يجعل المحتوى المنتشر بحرا شاسعا عرضة للتزييف والإنكار دون حل تقني فعّال.
إن تطور هذه التقنيات بهذه السرعة يدفع العالم لضرورة مناقشتها وآثارها أخلاقيا وسياسيا وقانونيا. ويضع جموع الفنانين ومنتجي الأفلام والحملات الدعائية وصناع المحتوى في تساؤل ما إذا كانت هذه الأدوات قد بدأت فعليا بتغيير المعادلات في مجال صناعتهم، وهل فعلا المؤسسات والأفراد ستتبنى استخدام هذه الأداوت؟ وإلى أي حد قد تبدو هذه الأدوات مخيفة؟ الأسئلة المطروحة ليست تقنية فحسب، بل وجودية حول طبيعة الإبداع والملكية الفكرية ومصداقية الواقع الذي نعيش فيه.
شخصيا، ومن متابعة لصناعة وإنتاج الصور ونشرها والإعلان لها في وسائل التواصل في السلطنة، فأنني أرى بوضوح كيف أن المؤسسات -كبيرها وصغيرها- بدأت تستعين بأدوات الذكاء الاصطناعي بشكل كبير في صنع إعلاناتها ومنشوراتها، وهذا مبرَر بما أنها يوفر الكثير من الجهد والتكلفة والوقت وبجودة اعتيادية مقبولة.
أما عن كونها مخيفة، فأرى شخصيا أنها مخيفة، فحتى قبل أن تحدث هذه الطفرة الأخيرة انخدع الكثيرون -مثلي- بمقاطع تبدو حقيقية وهي ليست كذلك، أسمع أغنية بصوت طلال مداح -مثلا- فتعجبني وأقول ها قد فاجأني الـ«تيك توك» بأغنية لم أسمعها من قبل لطلال، ليتضح لي بعدها أنها ليست أغنيته وأنه لم يسبق له أن غناها أصلا. فكم من المحتوى خدعني وانتهى وآخر سيخدعني؟ وإلى متى سينتظر العالم ليضع ما يقنن وينظم هذه التقنيات وأخلاقياتها، التي باتت تخيف حتى صناعها! والتساؤل الذي يليه، هل يمكن للقوانين والأطر الأخلاقية أن تلحق بسرعة التطور الجنوني لهذه الأدوات، أم أننا ندخل عصرا من الفوضى الرقمية حيث الحقيقة هي أول ضحايا التقدم؟
المعتصم الريامي مطور ومهتم بالتقنية