logo
الأرشيف السوداني
logoالأرشيف السوداني

حول

المنهجية والأدوات

أدوات ومنهجيات مفتوحة المصدر للتحقيقات مفتوحة المصدر

اطبع المقال

يمكن أن يمثل التحقيق في انتهاكات حقوق الإنسان في السودان والإبلاغ عنها تحديًا وخطيرًا للصحفيين والعاملين في مجال حقوق الإنسان والمنظمات الدولية. تم اعتقال النشطاء والمدافعين عن حقوق الإنسان أو اعتقالهم أو حتى قتلهم بسبب عملهم. هذا هو السبب الرئيسي الذي يجعل الأرشيف السوداني ومجموعات التوثيق الأخرى تعتمد على محتوى تم إنشاؤه بواسطة المستخدم الذي تم التحقق منه للمساعدة في بناء القضايا الجنائية وكذلك أبحاث حقوق الإنسان. يعتمد الأرشيف السوداني على بنية تحتية ومنهجية تم تطويرها وصيانتها من قبل الأرشيف السوري ، من خلال شراكة مع Mnemonic.

يسعى Mnemonic والأرشيف السوداني لتحقيق الشفافية في أدواتهم ونتائجهم ومنهجياتهم ؛ بالإضافة إلى التأكد من أن المحتوى الذي تم التحقق منه متاح للجمهور ويمكن الوصول إليه للصحفيين والمدافعين عن حقوق الإنسان والمحامين الذين يعملون لغرض إعداد التقارير والدعوة والمساءلة.

لتحقيق الشفافية ، يتم إصدار البرمجيات التي طورها الأرشيف السوري بصيغ مجانية ومفتوحة المصدر. يتم ذلك لضمان بناء الثقة والحفاظ عليها مع شركائنا والمتعاونين ، بالإضافة إلى السماح بإعادة استخدام البرامج وتخصيصها من قبل مجموعات أخرى خارج الأرشيف السوري. يضمن التكامل التقني مع أدوات التحقيق مفتوحة المصدر الحالية عدم تكرار العمل. يعمل الأرشيف السوري جنبًا إلى جنب مع التقنيين لتطوير أدواتنا مفتوحة المصدر. تم تطوير منهجيتنا بالتعاون مع مجموعات أرشيفية أخرى ، بالإضافة إلى محامين وصحفيين.

في نموذج البيانات والتشغيل الخاص به؛ اعتمد الأرشيف السوري على النموذج المرجعي للاكتشاف الإلكتروني الذي طورته كلية الحقوق بجامعة ديوك. أدناه شرح مفصّل لكلٍّ من خطوات هذا النموذج.

تضمنت عملية التجميع لدينا إنشاء مخطط بيانات وصفية معياري جنبًا إلى جنب مع قاعدة بيانات للمصادر الموثوقة للمحتوى الرقمي. يمكن أن تكون المصادر عبارة عن عمليات إرسال مباشرة من الأفراد والمؤسسات ، وحسابات وقنوات وسائط اجتماعية متاحة للجمهور ، بالإضافة إلى معلومات أخرى متاحة للجمهور.

1) إنشاء قاعدة بيانات للمصادر الموثوقة للمحتوى

قبل أن يكون من الممكن جمع أي مواد رقمية أو أرشفتها أو التحقق منها ، كان علينا إنشاء قاعدة بيانات للمصادر الموثوقة للمحتوى المرئي. لقد حددنا أكثر من 3.500 مصدر موثوق ، بما في ذلك الصحفيين الفرديين والمراسلين الميدانيين ، والمؤسسات الإعلامية الأكبر (مثل وكالات الأنباء المحلية والدولية) ، ومنظمات حقوق الإنسان ، والعاملين الطبيين المحليين والمستشفيات. بدأ العديد من هذه المصادر في نشر أو تقديم محتوى مرئي في أواخر عام 2018 - أوائل عام 2019 وأيضًا نشر أعمالًا في وسائل إعلامية أخرى ذات مصداقية.

يتم الوصول إلى المحتوى المرئي بشكل أساسي من خلال قنوات التواصل الاجتماعي (Twitter و Facebook و YouTube ومواقع الويب و Telegram) والملفات المرسلة (مقاطع الفيديو والصور وملفات pdf) ومجموعات البيانات الخارجية والمتعاونين. يتم تعقب التغييرات في مجموعات البيانات هذه ، مما يعني أنه يتم حفظ جميع الإصدارات.

يتم تحديد المصداقية من خلال تحليل ما إذا كان المصدر مألوفًا لنا أم لشبكتنا الحالية ، بالإضافة إلى التحقق من أن محتوى المصدر والتقرير كان موثوقًا به في الماضي. قد يشمل ذلك تقييم المدة التي قضاها المصدر في الإبلاغ ومدى نشاطه.

لتحديد مكان المصدر ، قد يتم تقييم قنوات وسائل التواصل الاجتماعي لتحديد ما إذا كانت مقاطع الفيديو التي تم تحميلها من موقع معين بشكل متسق ، أو ما إذا كانت المواقع تختلف اختلافًا كبيرًا. قد يتم تحليل القنوات والحسابات لتحديد ما إذا كانت تستخدم شعارًا وما إذا كان هذا الشعار يُستخدم باستمرار عبر مقاطع الفيديو. يمكن أيضًا تحليل القنوات والحسابات بحثًا عن المحتوى الأصلي لتحديد ما إذا كان القائم بالتحميل يجمع مقاطع فيديو من مؤسسات إخبارية أو حسابات أخرى ، أو ما إذا كان المصدر يبدو أنه هو القائم بالتحميل الأساسي.

2) إنشاء قاعدة بيانات للمصادر الموثوقة للتحقق

أنشأ الأرشيف السوداني قاعدة بيانات للمصادر الموثوقة للتحقق منها. توفر هذه المصادر معلومات إضافية تُستخدم للتحقق من المحتوى على منصات التواصل الاجتماعي أو المستلمة من المصادر مباشرة. تشمل أدوات التحقق من المحتوى الصحفيين المواطنين والمدافعين عن حقوق الإنسان والعاملين في المجال الإنساني المقيمين في السودان والخارج. للحفاظ على تكامل البيانات ، لا تشكل المصادر المستخدمة للحصول على المحتوى جزءًا من قاعدة البيانات للتحقق منها.

3) إنشاء مخطط معياري للبيانات الوصفية

قبل أن نتمكن من الحفاظ على أي محتوى أو التحقق منه ، يجب علينا تحديد نظام يمكن من خلاله إدارة المحتوى وتنظيمه ، ويتم ذلك من خلال البيانات الوصفية. تم تطوير هذا النظام من قبل الأرشيف السوري ويستخدمه الأرشيف السوداني من خلال شراكتنا مع Mnemonic. يعد إنشاء نظام بيانات أو بيانات وصفية أمرًا ضروريًا لمساعدتنا في تنظيم المحتوى وإدارته بالإضافة إلى مساعدة المستخدمين في تحديد وفهم ما حدث ومتى وأين. مع الاعتراف بالحاجة إلى وجود بيانات أو مخطط معياري للبيانات الوصفية. نحن ندرك أيضًا أن تنفيذ أي مخطط للبيانات الوصفية هو خيار سياسي للغاية. نظرًا لعدم وجود معايير بيانات وصفية مقبولة عالميًا ومقبولة قانونًا ، فقد بُذلت جهود لتطوير إطار عمل بالتشاور مع مجموعة متنوعة من هيئات التحقيق الدولية. وتشمل هذه المشاورات مع أعضاء مكتب المفوض السامي لحقوق الإنسان التابع للأمم المتحدة ، والآلية الدولية المحايدة والمستقلة بشأن الجرائم الدولية المرتكبة في سوريا (IIIM) ، ومع معاهد أرشيفية أخرى ، ومنظمات حقوقية وبحثية. تحدث إضافة البيانات الوصفية بعد حفظ المحتوى ولكن من الضروري تحديد مخطط البيانات الوصفية قبل تجميع المحتوى ومعالجته.

يتم الاحتفاظ بمجموعة الأرشيف السوداني من خلال سير عمل الحفظ الآمن للأرشيف السوري ، والذي يضمن عدم ضياع المحتوى الأصلي بسبب إزالته من منصات الشركة. يتم تحقيق ذلك من خلال جمع المحتوى الرقمي وتخزينه بأمان على خوادم خلفية خارجية قبل نقله إلى وضع عدم الاتصال وقبل إجراءات التحقق الأساسية. ثم يتم نسخ المحتوى احتياطيًا بشكل آمن على الخوادم في جميع أنحاء العالم. يستخدم الأرشيف السوري Sugarcube لهذه العملية ، وهو برنامج مجاني ومفتوح المصدر تم تطويره لتحقيقات حقوق الإنسان باستخدام محتوى عبر الإنترنت من إنشاء المستخدمين.

Sugarcube هي أداة مصممة لدعم الصحفيين، المنظمات غير الربحية، الباحثين الأكاديميين، منظمات حقوق الإنسان، وغيرهم في تحقيقاتهم باستخدام المصادر المُتاحة للعموم عبر الإنترنت (مثل التغريدات، مقاطع الفيديو، قواعد البيانات العامة، مواقع الويب، وقواعد البيانات عبر الإنترنت).

في مسار الحفظ هذا ، نكتشف اللغة المنطوقة ، ونقوم بتوحيد تنسيق البيانات (مع الحفاظ على التنسيق القديم). كما نقوم بالتقاط وتنزيل صفحة الويب التي تلقينا المعلومات منها. تحصل الملفات في قاعدة بياناتنا على قيمتي تجزئة hash بالاستناد إلى خوارزمية sha256 و md5 وتُختم بطابع زمني باستخدام Enigio Time، طرف ثالث متعاون. تجزّأ البيانات وتُختم زمنيًا لضمان وإثبات نزاهتها ما يعني عدم التلاعب بها أو تعديلها بعد أرشفتها.

بمجرد أن يتم حفظ المحتوى بأمان ، يتم استخراج البيانات الوصفية من المحتوى المرئي ، يتم تحليلها وتجميعها تلقائيًا باستخدام مخطط البيانات الوصفية المحدد مسبقًا والموحد من الأرشيف السوري. قد يتم تضمين تفاصيل الموقع والمصدر في البيانات الوصفية التي تم تحليلها والتي يمكن أن تكون مفيدة لتحديد الموقع الجغرافي حيث نشأ المحتوى.

تتم إضافة البيانات الوصفية تلقائيًا ويدويًا ، اعتمادًا على كيفية جمعها، على سبيل المثال من خلال طرق مفتوحة المصدر أو طرق مغلقة المصدر. تتضمن البيانات الوصفية التي نجمعها وصفًا للعنصر المرئي على النحو الوارد (مثل عنوان YouTube) ؛ مصدر المحتوى المرئي ؛ الرابط الأصلي حيث تم نشر اللقطات لأول مرة ؛ معالم يمكن تحديدها الطقس (الذي قد يكون مفيدًا لتحديد الموقع الجغرافي أو تحديد الوقت) ؛ لغات محددة أو لهجات إقليمية منطوقة ؛ ملابس أو أزياء يمكن التعرف عليها ؛ أسلحة أو ذخائر ؛ الجهاز المستخدم لتسجيل اللقطات ؛ ونوع محتوى الوسائط.

يمرر خط أنابيب المعالجة أيضًا ملفات الفيديو إلى إطارات مفتاحية ، بالإضافة إلى استخدام برنامج التعلم الآلي، V-FRAME.

VFRAME عبارة عن مجموعة من أدوات برمجيات الرؤية الحاسوبية مفتوحة المصدر المصممة لتحقيقات حقوق الإنسان التي تعتمد على مجموعات بيانات كبيرة من الوسائط المرئية. يستخدم خوارزميات اكتشاف الكائنات التي يمكنها تلقائيًا وضع علامة على محتوى الفيديو الذي يصور كائنات محددة مسبقًا ، مثل الذخائر العنقودية.

يقوم خط البيانات لدينا بإعداد المحتوى المرئي للتحقق الأولي. يتم تسجيل جميع العلامات الإضافية الممكنة ومعلومات سلسلة العهدة. يتم ذلك لمساعدة المستخدمين في تحديد وفهم ما حدث في حادثة معينة ، ومتى وأين.

يتكون التحقق من ثلاث خطوات: 1) التحقق من مصدر القائم بتحميل الفيديو أو الناشر؛ 2) تحقق من مكان تصوير الفيديو. 3) التحقق من التواريخ والأوقات التي تم فيها تصوير وتحميل الفيديو.

  • تحقق من مصدر ناشر الفيديو

أولاً ، نحدد ما إذا كان مصدر الفيديو مدرجًا في قائمة المصادر الموثوقة لدينا. إذا لم يكن الأمر كذلك ، فإننا نحدد مصداقية المصدر الجديد من خلال اتباع الإجراء أعلاه.

في بعض الحالات ، قد يتم نشر محتوى شبه مكرر. على سبيل المثال ، إذا تضمن مقطع فيديو مدته 10 دقائق مقطع فيديو مدته 30 ثانية بالكامل ، فسيتم الاحتفاظ بمقطعي الفيديو كليهما طالما أنه يمكن التحقق منهما. وبالمثل ، يتم أيضًا الاحتفاظ بمقاطع الفيديو من المؤسسات الإخبارية أو المؤسسات الإعلامية التي تعرض أجزاء من مقاطع الفيديو الأخرى طالما كان التحقق ممكنًا. نحافظ أيضًا على الازدواجية إذا كانت من مصادر مختلفة وكان القائم بالتحميل الأصلي غير معروف.

قد يختلف مصدر تحميل الفيديو عن مشغل الكاميرا. في معظم لقطات الفيديو التي نتحقق منها ، يمكن تحديد فقط القائم بتحميل الفيديو وليس مشغل الكاميرا. في التحقق المتقدم من الحالات ذات الأولوية ، تتضمن مرحلة التحليل تحديد مشغل الكاميرا.

  • تحقق من الموقع حيث تم تصوير الفيديو

يمر كل مقطع فيديو بتحديد الموقع الجغرافي الأساسي للتحقق من أنه تم التقاطه في السودان. يتم تنفيذ عملية تحديد الموقع الجغرافي الأكثر دقة للمحتوى ذي الأولوية من أجل تحديد أصله إلى موقع أكثر دقة. يتم ذلك عن طريق مقارنة المراجع المرئية (مثل المباني وسلاسل الجبال والأشجار والمآذن) بصور القمر الصناعي من Google Earth و Maxar بالإضافة إلى الصور المحددة جغرافيًا من خرائط Google. تُستخدم صور الأقمار الصناعية أيضًا لتقييم الضرر والدمار أثناء التحقيق في الهجمات التي تستهدف المدنيين والبنية التحتية المدنية.

بالإضافة إلى ذلك ، يقارن الأرشيف السوداني اللغة العربية المنطوقة في مقاطع الفيديو باللهجات واللهجات الإقليمية المعروفة داخل السودان للتحقق بشكل أكبر من موقع مقاطع الفيديو. عندما يكون ذلك ممكنًا ، نتصل بالمصادر مباشرة ، ونتشاور مع شبكتنا الحالية من الصحفيين العاملين داخل وخارج السودان لتأكيد مواقع حوادث محددة.

  • تحقق من التواريخ والأوقات التي تم فيها تصوير الفيديو وتحميله

نستخدم البيانات الوصفية للوقت والتاريخ المضمنة في مقاطع الفيديو التي نتلقاها مباشرةً من أجل تأكيد تاريخ ووقت حادثة معينة. يتم استخراج التاريخ والوقت باستخدام ExifTool [https://exiftool.org/].

نتحقق من تاريخ التقاط مقاطع الفيديو من خلال الإحالة المرجعية إلى تاريخ نشرها على منصات وسائل التواصل الاجتماعي مثل YouTube) و Twitter و Facebook و( Telegram مع تواريخ من التقارير المتعلقة بالحادثة نفسها. يتم أيضًا مقارنة المحتوى المرئي الذي تم جمعه مباشرة من المصادر مع التقارير المتعلقة بالحادثة الواردة في الفيديو.

هذه التقارير تشمل:

  • تقارير من وسائل الإعلام الدولية والمحلية ، بما في ذلك رويترز ، أسوشيتد برس ، الجزيرة ، بي بي سي;
  • تقارير حقوق الإنسان التي نشرتها المنظمات الدولية والمحلية ، بما في ذلك هيومن رايتس ووتش ومنظمة العفو الدولية ؛
  • سجلات المراقبة اليومية التي جمعها فريق مراقبة الأرشيف السوداني
  • تقارير الحوادث التي تمت مشاركتها من قبل شبكة الصحفيين المواطنين في الأرشيف السوداني على Twitter و Facebook و Telegram.

يمكن أيضًا استخدام تقنيات إضافية مثل البحث العكسي عن الصور وتحديد الموقع الزمني لتأكيد وقت الالتقاط وتاريخ المحتوى المرئي.

في بعض الحالات، نجري تحقيقات معمقة مفتوحة المصدر. تعني قيود الوقت والسعة أنه لا يمكن تحليل جميع الحوادث بشكل متعمق. ومع ذلك، من خلال تطوير سير عمل قابل للتكرار، من المأمول أن يساعد الآخرون في هذه الجهود، والتحقيق في الحوادث الأخرى باستخدام أساليب مماثلة.

إفادة شاهد

بالنسبة لبعض الحوادث ، يقوم فريق الباحثين لدينا بجمع إفادات الشهود أو الشراكة مع المنظمات التي تقوم بذلك. يمكن أن يشمل ذلك المنظمات التي يتمثل دورها في جمع روايات الناجين أو المصابين أو أفراد الأسرة أو شهود العيان (مثل الطاقم الطبي ومديري المستشفيات)

إعادة النظر

في حال وجود ادّعاء بقصف جويّ؛ يُحلّل الأرشيف السوري بيانات رصد الطيران ويقاطعها مع المحتوى البصري للتأكد فيما إذا رُصدت رحلات الجوية بالقرب من المواقع التي تم الادعاء بتعرضها لقصف جوي. نستخدم Tableau-public لإجراء هذا النوع من التحليلات.

المراجعة

بمجرد معالجة المحتوى والتحقق منه وتحليله ، تتم مراجعته للتأكد من دقته. في حالة وجود تناقض ، تتم إعادة تغذية المحتوى مرة أخرى في سير عمل الأدلة الرقمية لمزيد من التحقق. إذا تم اعتبار المحتوى دقيقًا ، فإنه ينتقل إلى مرحلة النشر لسير عمل الأدلة الرقمية.

لمزيد من المعلومات عن الأدوات أو الطرق التي نستخدمها ، يرجى التواصل مع المعلومات، info@sudanesearchive.org

نسعى للحصول على تبرعات فردية لتنفيذ عملنا. يرجى النظر في دعمنا.

Connect with us
حولتواصل معناالصحافةالشؤون القانونيّة
Mnemonicالأرشيف السودانيالأرشيف اليمني