استغلت الوحدة 8200 المختصة بالحرب والاستخبارات الإلكترونية في الجيش الإسرائيلي مجموعة كبيرة من الاتصالات بين الفلسطينيين التي اعترضتها، لبناء برمجية قائمة على الذكاء الاصطناعي على غرار “تشات جي بي تي” (ChatGPT)، من أجل تعزيز قدراتها التجسسية، وفقاً لما كشفته صحيفة ذا غارديان البريطانية بالتعاون مع مجلة 972+ الإسرائيلية وموقع لوكال كول الإخباري العبري.
وأفادت المنافذ الإخبارية الثلاثة، الخميس، بأن الوحدة 8200 الإسرائيلية دربت نموذج الذكاء الاصطناعي الخاص بها على فهم العربية العامية باستخدام عدد كبير من المكالمات الهاتفية والرسائل النصية التي وصلت إليها عبر تجسسها على الأراضي المحتلة.
ووفقاً لمصادر وصفت بأ نها مطلعة على المشروع، فإن الوحدة الإسرائيلية هدفت من بناء البرمجية إلى إنشاء أداة متطورة تشبه روبوت الدردشة، قادرة على الإجابة عن أسئلة حول الأشخاص الذين تتجسس عليهم وتوفير تحليلات متعلقة بالكميات الضخمة من البيانات التي تجمعها. وسارعت هذه الوحدة التي يقال إن قدراتها تضاهي قدرات وكالة الأمن القومي الأميركية (NSA) إلى تسريع عملية تطويرها للبرمجية بعد بدء حرب الإبادة الإسرائيلية على قطاع غزة في أكتوبر/تشرين الأول 2023.
ووفقاً للتحقيق، فإن البرمجية كانت لا تزال قيد التدريب في النصف الثاني من العام الماضي، وليس واضحاً ما إن كانت قد دشنت أو بعد. ولفت التحقيق إلى أن الجهود المبذولة لبناء برمجية تستخدم نماذج اللغة الكبيرة (LLM) ــ وهي نماذج تعليم عميق كبيرة جداً مدرَّبة مسبقاً على كميات هائلة من البيانات ــ ذكرت أولاً في حديث للخبير السابق في تكنولوجيا الاستخبارات العسكرية تشاكيد روجر جوزيف سيدوف، لكنها مرّت مرور الكرام ولم تسترع أي اهتمام. إذ قال أمام الحاضرين في مؤتمر الذكاء الاصطناعي العسكري في تل أبيب خلال العام الماضي: “حاولنا إنشاء أكبر مجموعة بيانات ممكنة وجمع كل البيانات التي حصلت عليها دولة إسرائيل باللغة العربية”. وأضاف أن النموذج يتطلب “كميات هائلة” من البيانات.
وأكد ثلاثة مسؤو لين سابقين في الاستخبارات الإسرائيلية، على دراية بالمشروع، وجود نماذج اللغة الكبيرة وشاركوا تفاصيل حول تطويرها. وتحدثت مصادر أخرى عن استخدام الوحدة 8200 نماذج التعلم الآلي الأصغر حجماً في السنوات التي سبقت إطلاق المشروع الطموح والتأثير الذي أحدثته هذه التكنولوجيا.
وقال مصدر مطلع على تطوير نماذج الذكاء الاصطناعي لوحدة 8200 في السنوات الأخيرة: “الذكاء الاصطناعي يعزز القوة. لا يتعلق الأمر فقط بمنع هجمات إطلاق النار، بل يمكنني تتبع الناشطين في مجال حقوق الإنسان، ومراقبة البناء الفلسطيني في المنطقة ج (من الضفة الغربية). لديّ المزيد من الأدوات لمعرفة ما يفعله كل شخص في الضفة الغربية”.
تسخير الذكاء الاصطناعي لأغراض عسكرية
تسلط التفاصيل حول ضخامة النموذج الضوء على احتفاظ الوحدة 8200 على نطاق واسع بمحتوى الاتصالات التي يتم اعتراضها. كما تبين أن هذه الوحدة الإسرائيلية، مثل العديد من وكالات التجسس حول العالم، تسعى لتسخير التقدم في تقنيات الذكاء الاصطناعي لأداء مهام تحليلية معقدة وفهم الكميات الهائلة من المعلومات التي تجمعها روتينياً.
وحذّر التحقيق من نماذج مثل نماذج اللغة الكبيرة في التحاليل الاس تخباراتية ينطوي على أخطار، إذ يمكن أن تؤدي البرمجيات إلى تفاقم التحيزات وهي عرضة لارتكاب الأخطاء، كما حذر الخبراء والناشطون الحقوقيون. كما أن طبيعتها الغامضة يمكن أن تصعب فهم كيفية التوصل إلى الاستنتاجات التي تم إنشاؤها بواسطة الذكاء الاصطناعي”.
وفي هذا السياق، أعرب زاك كامبل، وهو باحث كبير في مجال المراقبة في منظمة هيومن رايتس ووتش، عن انزعاجه من استخدام الوحدة 8200 هذه البيانات لاتخاذ قرارات حاسمة بشأن حياة الفلسطينيين تحت الاحتلال. وقال كامبل: “إنها أداة تخمين. وفي نهاية المطاف، يمكن استخدام هذه التخمينات لتجريم الأشخاص”.
في المقابل، أشارت “ذا غارديان” إلى أن متحدثاً باسم قوات الاحتلال رفض الإجابة عن أي أسئلة حول بيانات نماذج اللغة الكبيرة، لكنه زعم أن الجيش “يستخدم أساليب استخباراتية مختلفة لتحديد وإحباط النشاط الإرهابي الذي تقوم به المنظمات المعادية في الشرق الأوسط”. طورت الوحدة 8200 مجموعة من الأدوات التي تعمل بالذكاء الاصطناعي في السنوات الأخيرة، بينها “ذا غوسبل” (The Gospel) و”لافندر” (Lavender) التي استخدمت في حرب الإبادة الإسرائيلية على غزة، وتحديداً في تحديد “بنوك الأهداف”.
ولنحو عقد تقريباً، استخدمت الوحدة أيضاً الذكاء الاصطناعي لتحليل الاتصالات التي تعترضها وتخزنها، باستخدام سلسلة من نماذج التعلم الآلي لفرز المعلومات إلى فئات محددة مسبقاً وتعلم كيفية التعرف على الأنماط والتنبؤ. وبعد إصدار “أوبن إيه آي” برمجية “تشات جي بي تي” في أواخر عام 2022، وضع خبراء الذكاء الاصطناعي في الوحدة 8200 تصوراً لبناء أداة أكثر توسعاً تشبه ذلك التابع للشركة الأميركية.
حتى الآن، يعد “تشات جي بي تي” أحد أكثر برامج التعلم الآلي استخداماً على مستوى العالم، ويستند إلى ما يسمى “نموذج الأساس”، وهو الذكاء الاصطناعي للأغراض العامة المدرب على كميات هائلة من البيانات وقادر على الاستجابة للاستفسارات المعقدة.
بناء شبيه “تشات جي بي تي” من الصفر
في البداية، كافحت الاستخبارات العسكرية الإسرائيلية لبناء نموذج مماثل، إذ “لم يكن لديها أدنى فكرة عن كيفية تدريب نموذج الأساس”، كما قال سيدوف خلال المؤتمر الذي عقد في تل أبيب. وفي مرحلة ما، أرسل المسؤولون طلباً إلى “أوبن إيه آي” للسماح بتشغيل “تشات جي بي تي” على أنظمة جيش الاحتلال من دون جدوى، وفقاً لما كشفه التحقيق.
ومع ذلك، عندما حشد جيش الاحتلال مئات الآلاف من جنود الاحتياط من أجل العدوان على غزة، انتقلت مجموعة من الضباط ذوي الخبرة في بناء برامج التجسس إلى الوحدة 8200 من شر كات خاصة، بينها تلك الأكبر في العالم مثل “غوغل” و”ميتا” و”مايكروسوفت”.
وقالت مصادر مطلعة لمعدي التحقيق إن الفريق الصغير من الخبراء سرعان ما بدأ في بناء برنامج قائم على نماذج اللغة الكبيرة يفهم العربية، ولكن كان عليه البدء من الصفر، بعدما لاحظ أن النماذج التجارية ومفتوحة المصدر باللغة العربية مدربة باستخدام اللغة العربية الفصحى المستخدمة في الاتصالات الرسمية والأدب والإعلام بدلاً من العامية المستخدمة في المكالمات أو عبر تطبيقات الدردشة مثل “واتساب”.
وأشارت المصادر إلى أن التحدي كان “جمع كل النصوص (العربية العامية) التي امتلكتها الوحدة على الإطلاق ووضعها في مكان مركزي”. وقالوا إن بيانات تدريب النموذج تتكون من نحو مائة مليار كلمة. وأفاد مصدر مطلع بأن هذا الكم الهائل من الاتصالات تضمن محادثات باللهجات اللبنانية وكذلك الفلسطينية. وعن ذلك، قال سيدوف خلال المؤتمر نفسه إن الفريق الذي كان يطور البرمجية “ركز فقط على لهجات من يكرهوننا”.
وسعت الوحدة إلى تدريب النموذج على فهم المصطلحات العسكرية، حسبما ذكرت المصادر. لكن عملية جمع البيانات التدريبية الضخمة تضمنت كميات كبيرة من الاتصالات ذات القيمة الاستخباراتية القليلة أو المعدومة عن الحياة اليومية للفلسطينيين. وقال أحد المصادر: “إن اتصال شخص ما بآخر وإخباره بأنه ينتظره خارج المدرسة مجرد محادثة ليست مثيرة للاهتمام. ولكن بالنسبة لنموذج مثل هذا، فهي تساوي ذهباً”.