تزايد الشكوك بشأن استخدام DeepSeek لمخرجات “Gemini” في تدريب نموذجها الجديد R1-0528

في خطوة مثيرة للجدل، أثار نموذج الذكاء الاصطناعي الجديد “R1-0528” الذي أطلقته شركة DeepSeek الصينية تساؤلات حول مصدر بياناته، النموذج الجديد، الذي أظهر أداءً متفوقًا في مجالات البرمجة والرياضيات، يُشتبه في اعتماده على مخرجات نماذج Gemini التي تطورها Google،

مزاعم حول الاعتماد على بيانات Geminin

الجدل بدأ عندما أشار سام بيتش، مطور مختص في تقييمات الذكاء العاطفي، إلى وجود دلائل تدعم هذا الادعاء عبر منشور له على منصة X، وذكر أن التعبيرات اللغوية المستخدمة في النموذج تقترب بشكل كبير من تلك المفضلة في نموذج Gemini 2.5 Pro، مما يعزز الشكوك حول أصول البيانات المستخدمة في التدريب.

اتهامات سابقة

ليس هذا الاتهام الأول الذي يواجه DeepSeek، ففي ديسمبر الماضي تم الإبلاغ عن أن نموذج V3 الخاص بها كان يعرف نفسه أحيانًا باسم “ChatGPT”، واكتشفت OpenAI دلائل تشير إلى استخدام تقنيات مثل "التقطير" لاستخلاص المعرفة من النماذج الأحدث، وتجدر الإشارة إلى أن استخدام البيانات هذه يُعد انتهاكًا لشروط الخدمة الخاصة بـOpenAI.

التحديات في التحقق من البيانات

من جهة أخرى، تطرق الخبراء إلى صعوبة التأكد من أصول البيانات بسبب ما يُعرف بتلوث الإنترنت بمحتوى مُولد من الذكاء الاصطناعي، حيث يسيطر هذا المحتوى الرديء على منصات الإنترنت، مما يجعل من غير الممكن التحقق من مصادر البيانات بسهولة.

الإجراءات الأمنية المتزايدة

قامت بعض الشركات، مثل OpenAI، بفرض تدابير أمنية صارمة للحد من استخدام تقنيات التقطير، وفي الآونة الأخيرة، بدأت Google بتلخيص "آثار التفكير" التي تنتجها نماذجها، مما يصعب على المنافسين استخدام تلك الآثار لتطوير نماذج مشابهة.

لاتزال Google غير معنية بالإفصاح عن تفاصيل هذه الادعاءات، في وقت تتجه فيه الأنظار للحصول على رد رسمي من الشركة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى