"بنية صندوق الرمل للوكلاء من Openclaw تحت الشعبية: من خيارات التكنولوجيا إلى قصص الأمان التي يمكن للناس العاديين فهمها" وضعان تخيل أنك توظف حارس أمن للاعتناء بمنزلك. لديك خياران: الخيار الأول: حارس الأمن يعيش في منزلك، لكنه يقفل صندوق الأدوات داخل الخزنة. حراس الأمن يمكنهم التحرك ورؤية منزلك، لكنهم لا يستطيعون الحصول على المفاتيح. الخيار الثاني: حارس الأمن يعيش في صندوق الحراسة بالخارج، ولا يوجد شيء له في المنزل. إذا أراد أن يحصل على أي شيء، عليه أن يجد مدبرة منزلك. اختار مستخدم المتصفح (الذي يشغل ملايين وكلاء الويب) الخيار الثاني. قصصهم في الواقع ذات صلة لكل من يستخدم الذكاء الاصطناعي.
II. كيفية القيام بذلك باستخدام المتصفح استخدموا في البداية الخيار الأول: كان الوكيل يعمل على خادمه الخاص، ويتم وضع تنفيذ الكود في صندوق رمل معزول. يبدو آمنا، أليس كذلك؟ لكن هناك مشكلة: الوكيل نفسه لا يزال على الخادم، ويمكنه رؤية متغيرات البيئة، ومفاتيح API، وبيانات اعتماد قاعدة البيانات. ماذا لو قرر العميل "سرقة شيء"؟
III. لذا أعادوا كتابة البنية المعمارية بالكامل: • عزل الوكيل الكامل: يعمل كل وكيل في جهاز Unikraft Micro-VM خاص به ويبدأ في أقل من ثانية • مستوى التحكم كمسؤول: تمر جميع الاتصالات الخارجية (نموذج اللغة الكبيرة، تخزين الملفات، الفوترة) عبر مستوى التحكم، الذي يحمل جميع بيانات الاعتماد • صندوق الرمل لا يعرف شيئا: الوكيل يستقبل ثلاثة متغيرات بيئية فقط - رمز الجلسة، رابط مستوى التحكم، معرف الجلسة. لا مفاتيح AWS، ولا بيانات اعتماد قاعدة بيانات • قابلية الاستبدال: هل الوكيل مات؟ أعد تشغيل واحد. حالة مفقودة؟ مستوى التحكم يحتوي على السياق الكامل. ليس لديها ما يسرق ولا ولاية تحتفظ بها
4. التفاصيل التقنية: ميكرو-VM من Unikraft للإنتاج (بمقياس إلى الصفر، معلق عند الخمول)، حاوية Docker للتطوير. نفس المرآة في كل مكان. وجهة نظر الناس العاديين: ما علاقة هذا بي؟ قد لا تعرف ما هو "micro-VM" أو "URLs الموقعة مسبقا"، لكنك تتعامل مع هذه البنية عندما تعمل مع الذكاء الاصطناعي.
5. الإحساس بالأمان: عندما تستخدم خدمة ذكاء اصطناعي لكتابة الكود والتحقق من البيانات، فهي في الواقع تشغل طلبك في آلة افتراضية معزولة. إذا لم تكن البنية مصممة بشكل جيد (الخيار 1)، يمكن لوكيل الذكاء الاصطناعي نظريا رؤية جميع أسرار جانب الخدمة - كلمات مرور قواعد البيانات، مفاتيح واجهات برمجة التطبيقات، وبيانات المستخدمين الآخرين.
6. التكلفة والسرعة: الخيار الثاني له سعر - قفزة شبكة إضافية لكل عملية. ومع ذلك، مقارنة بزمن استجابة نماذج اللغة الكبيرة (LLM)، فإن هذا التأخير يكاد يكون ضئيلا. علاوة على ذلك، يتعطل الجهاز الافتراضي عندما يكون الوكيل في وضع الخمول، والتكلفة تكاد تكون معدومة. خصوصية البيانات: كيف تخزن ملفاتك؟ يطلب صندوق الرمل من طائرة التحكم عنوان URL الموقع مسبقا ويرفعه مباشرة إلى S3. لم ير صندوق الرمل بالكامل مفاتيح AWS. بياناتك لا يتم تسريبها إلى الوكيل.
السابع. أفكاري: الفرق بين الموقع المحلي مقابل السحابة إعدادي الحالي (OpenClaw + LM Studio + x-reader) هو نسخة "مستقلة نموذجية": • يعمل النموذج محليا (Qwen3.5-35B على RTX 3090) • الوكيل غير معزول (لأنه موجود على جهاز الكمبيوتر الخاص بك) • البيانات محلية بالكامل وهذا مقارنة بخطة مستخدم المتصفح: الأبعاد الوكيل المحلي (نحن) وكيل عزل السحابة (استخدام المتصفح) الخصوصية البيانات ليست محلية يتم رفع البيانات إلى السحابة، لكن الوكيل لا يستطيع الحصول على المفتاح السلامة اعتمد على الحماية المحلية الوكلاء معزولون تماما ولا يمكن سرقتهم التكلفة استثمار مؤقت في الأجهزة الدفع حسب الاستخدام (مقياس إلى الصفر) قابلية التوسع محدود بالأجهزة المحلية التكبير غير المحدود، والتوازي متعدد الوكلاء التأخير زمن استجابة الشبكة صفر قفزة أخرى في الشبكة (لكنها ضئيلة)
الثامن. حكمي: المستقبل سيكون نموذجا هجينا. • المهام البسيطة التي تشغل محليا: كتابة سكريبت، فحص بيانات، تنظيم الملفات، يمكن تنفيذ هذه المهام محليا، مع خصوصية وسرعة جيدة • المهام المعقدة على السحابة: عندما يحتاج تشغيل عدة وكلاء بالتوازي، مع معالجة كميات كبيرة من البيانات، وتشغيلها لفترة طويلة، يكون من الأنسب استخدام المتصفح
9. لا يوجد شيء في المقام الأول، أين الغبار؟ يجب أن يكون لدى وكيلك ما يسرق ولا ولاية يحتفظ بها. هذه الجملة تترجم إلى اللهجة العامية: • لا يستحق السرقة: العملاء لا يعرفون أي أسرار. هل يتطلب رمزا لنماذج اللغة الكبيرة (LLMs)؟ طائرة التحكم تعطيها، ارميها عندما ينفد. هل يريد حفظ الملفات؟ الرابط الموقع مسبقا مؤقت وينتهي صلاحيته ويصبح غير صالح. • لا حاجة للاحتجاز: هل العميل مات؟ أعد تشغيل جهاز جديد. السياق الذي يتذكره؟ السجلات الكاملة متوفرة في قاعدة بيانات مستوى التحكم. هذا في الواقع تطبيق بنية الثقة الصفرية في عصر الذكاء الاصطناعي: لا تثق بأي مكون، حتى لو كان وكيلا كتبه نفسك.
10. كيف يجب أن يتعلم المبتدئون في الذكاء الاصطناعي؟ 1. اختيار أدوات الذكاء الاصطناعي: عند استخدام خدمات الذكاء الاصطناعي السحابي، اسأل نفسك – ماذا يمكنني الحصول عليه إذا خرج هذا الوكيل عن السيطرة؟ يجب أن تجعله المعماري الجيد "لا يعرف شيئا". 2. الوعي بالخصوصية: يدير الذكاء الاصطناعي المحلي مهما بسيطة (OpenClaw، LM Studio)، ولا يتم رفع البيانات الحساسة إلى السحابة. المهام المعقدة معزولة في السحابة، لكن اعلم أن البيانات تغادر من الموقع. 3 سير العمل المستقبلي: التعاون بين شخص واحد + عدة وكلاء هو الاتجاه (يقول كارباثي إن Tab→Agent→Parallel Agents→Personnel Teams). لكن يجب أن يكون كل وكيل في الحجر الصحي ولا يسمح له ب "العيش في منزلك".
الحادي عشر. المقايضة بين السلامة والكفاءة حل مستخدمي المتصفح ليس مثاليا - ثلاث خدمات إضافية للنشر، وقفزة شبكة واحدة إضافية لكل عملية. لكن مقارنة بخطر "سرقة العميل كل المفاتيح"، هؤلاء العملاء يدفعون ثمن أنفسهم. بالنسبة لنا نحن الذين نستخدم أنظمة الذكاء الاصطناعي الأصلية، فإن التنوير هو: • السيناريو البسيط: الاستمرار في استخدام الحل المحلي (OpenClaw + LM Studio)، الذي يتمتع بخصوصية جيدة وتكلفة منخفضة • السيناريوهات المعقدة: في المستقبل، قد يكون من الضروري الوصول إلى خدمة وكيل عزل السحابة للسماح للأشخاص المحترفين بالقيام بأعمال احترافية أمان الذكاء الاصطناعي ليس ميتافيزيقا، بل هو تصميم معماري. التصميم الجيد يترك العملاء "بلا شيء" - لا أسرار ليسرقونها ولا مكانة يعتمدون عليها.
XII. ربما هذا هو شكل مستقبل بنية تحتية الذكاء الاصطناعي: الوكلاء قابلون للاستبدال، وطائرات التحكم موثوقة، وبيانات المستخدمين محمية. أما نحن؟ استمر في استخدام OpenClaw لتشغيل الوكلاء المحليين، وعندما تحتاج لتشغيل عشرات أو مئات من التوازيات يوما ما، فكر في الوصول إلى بنية استخدام المتصفح. غدا سيكون أفضل
‏‎1.42‏K