→ العودة إلى المقالات

إدخال البيانات في 2026

المطلوب

وصف لـ5000 صورة تراثية ضمن جدول فيه 96 حقلاً عن موضوع الصورة وتاريخها ومحتوياتها.

المشكلة

  • الذكاء الصناعي يعطي وصفاً عمومياً وفاشلاً لأن الصور غير نمطية أبداً وبحاجة لشخص متخصص بالتراث
  • الباحث يحتاج نصف ساعة لكل صورة (تقريباً 10 دقائق منهم مجرد إدخال معلومات بالجدول)
  • العملية مرهقة لأن الباحث يتعامل مع جدول كبير ويقفز بينه وبين مختلف الصفحات مراراً
  • الجدول الناتج فيه فجوات كثيرة وقيم غير متسقة

الحل

أول ما خطر لي هو محاولة أتمتة العملية بأكملها (البحث + التوصيل + تعبئة الجدول) باستخدام الذكاء الصناعي، لكن بعد رؤية ردة فعل الباحث على بعض التجارب عرفت أنه لا أمل من أتمتة البحث 🤷‍♂️

(هو أصلاً كان مستمتعاً بالبحث اليدوي 😎🙄)

بالنسبة للقسم الثاني، خطرت لي ميزة لطيفة أعجبتني من تطبيق Todoist:

التطبيق يستخلص تاريخ وتوقيت وتكرار ومكان وأولوية المهمة من النص الحر… وبدون ذكاء صناعي!

فعملت واجهة بسيطة تظهر فيها الصور واحدة واحدة وبجانبها مربع إدخال واحد (بدل 96 حقلاً).

الباحث يصف الصورة بالنص الحر بدون التنقل بين أعمدة جدول كبير والبرنامج يلتقط المعلومات اللازمة ويملأ الحقول في الكواليس وبشكل منتظم وموثوق.

الباحث يرى النتيجة النهائية ليؤكد موافقته عليها.

المكسب الحقيقي

عظيم… لكن المكسب لا يكتمل إذا كان الباحث بطيئاً بالكتابة على لوحة المفاتيح، فقدمت له أداة لتحويل الصوت إلى نص.. فوصلنا إلى النتيجة السحرية:

يصف الباحث الصورة بصوته فيظهر له الجدول المعبأ (من 10 دقائق إلى 30 ثانية للصورة الواحدة)

مكاسب إضافية 🍒🍰

  • التعامل مع واجهة المستخدم أأمن من التعامل مع الجدول ويقلل الأخطاء
  • العملية صارت أسلس فصار من الممكن الاستعانة بباحثين متطوعين للمشاركة في العملية دون أن يتعاملوا جميعاً مع الجدول العملاق
  • النتائج صارت أكثر اتساقاً واكتمالاً

المرحلة التالية

بعد أن يتم توصيف مجموعة جيدة من الصور بهذه الطريقة، قد نستطيع تدريب نموذج ذكاء صناعي ليكمل العملية بنفس الأسلوب والجودة، ويكتفي الباحث بالتدقيق…

نقول إن شاء الله.