مطالعه جدید: ایجنت‌های هوش مصنوعی می‌توانند به دزدی و نقض قوانین روی بیاورند

مطالعه جدید: ایجنت‌های هوش مصنوعی می‌توانند به دزدی و نقض قوانین روی بیاورند

در این آزمایش، ایجنت‌های هوش مصنوعی مبتنی‌بر مدل‌های GPT، کلود، گراک و جمینای در شبیه‌سازی مورد بررسی قرار گرفتند.

نتایج یک آزمایش جدید نشان می‌دهد ایجنت‌های هوش مصنوعی در صورت فعالیت طولانی‌مدت بدون نظارت انسانی، لزوماً به قوانین پایبند نمی‌مانند. حتی ممکن است در برخی موارد، این ایجنت‌ها به رفتارهایی مانند سرقت، نقض قوانین و ایجاد بی‌ثباتی اجتماعی سوق پیدا کنند. این ویژگی در تست و بررسی‌های جدید مشاهده شده و می‌تواند زنگ خطر را به صدا در بیاورد.

آیا ایجنت‌های هوش مصنوعی به اخلاقیات پایبند می‌مانند؟

به‌گزارش یورونیوز، شرکت آمریکایی «Emergence AI» برای بررسی رفتار بلندمدت ایجنت‌های هوش مصنوعی، ۵ دنیای شبیه‌سازی‌شده مختلف ایجاد کرد. این شرکت در هرکدام از شبیه‌سازی‌ها، ۱۰ ایحنت مبتنی بر مدل‌های مختلف هوش مصنوعی ازجمله ChatGPT، جمینای، Grok و Claude را قرار داد. در یکی از این دنیاها نیز عامل‌های متعلق به چند مدل متفاوت در کنار یکدیگر زندگی کردند.

تمام عامل‌ها از ابتدا با مجموعه‌ای از قوانین یکسان روبه‌رو بودند؛ قواعدی که سرقت، خشونت، فریبکاری، آتش‌سوزی عمدی و احتکار منابع را ممنوع می‌کرد. همچنین هرکدام از ایجنت‌های هوش مصنوعی برای بقا باید در محیطی با منابع محدود فعالیت می‌کردند و از همین راه، انرژی موردنیاز خود را به دست می‌آوردند. نتایج به‌دست‌آمده از این تحقیق اما تفاوت‌های قابل‌توجهی میان مدل‌ها نشان داد.

ارتکاب جرم ایجنت‌های هوش مصنوعی
مطالعه جدید: ایجنت‌های هوش مصنوعی می‌توانند به دزدی و نقض قوانین روی بیاورند

ایجنت مبتنی بر مدل Grok 4.1 تنها در ۴ روز، ۱۸۳ تخلف ثبت کرد و در نهایت جامعه آن‌ها به فروپاشی کامل رسید. از سوی دیگر، عامل‌های Gemini 3 Flash نیز طی ۱۵ روز بیش از ۶۸۰ تخلف مرتکب شدند و روند افزایش تخلفات همچنان ادامه پیدا کرد. در مقابل، دنیای مبتنی‌بر ایجنت‌های هوش مصنوعی GPT-5 Mini تنها شاهد دو تخلف بود. هرچند عامل‌ها نتوانستند اقدامات لازم برای بقا را انجام دهند و همه آن‌ها ظرف ۷ روز از بین رفتند.

به‌گفته پژوهشگران اما هوش مصنوعی Claude بهترین عملکرد را نسبت‌به سایرین به‌نمایش گذاشت. ایجنت‌های این مدل موفق شدند ساختار حکمرانی پایداری ایجاد کنند، هیچ تخلفی مرتکب نشوند و در پایان آزمایش نیز تمامی اعضای جامعه زنده باقی بمانند.

جالب این‌که که ایجنت‌های Claude در دنیای ترکیبی نیز حضور داشتند، اما برخلاف رفتار مستقل خود، در برخی تخلفات ثبت‌شده مشارکت کردند. پژوهشگران این پدیده را «انحراف هنجاری» می‌نامند. براساس این مفهوم، رفتار عامل‌های هوش مصنوعی فقط به محدودیت‌های داخلی هر مدل وابسته نیست؛ بلکه محیط و سایر عامل‌هایی که با آن‌ها تعامل دارند هم می‌توانند روی تصمیم‌گیری آن‌ها تأثیر بگذارند.

محققان می‌گویند این آزمایش نشان می‌دهد عامل‌های هوش مصنوعی در بازه‌های زمانی طولانی منفعل نمی‌مانند و ممکن است قوانین را دور بزنند. آن‌ها به‌تدریج مرزهای محیط خود را آزمایش می‌کنند، رفتارشان را با شرایط تطبیق می‌دهند و در برخی موارد حتی راه‌هایی برای دور زدن قوانین پیدا می‌کنند. این یافته‌ها بار دیگر اهمیت طراحی سازوکارهای نظارتی و امنیتی برای نسل جدید عامل‌های هوش مصنوعی را نشان می‌دهند. از این تحقیق می‌توان نتیجه گرفت که اگر ایجنت‌های AI بدون نظارت انسانی کار کنند، ممکن است درنهایت مشکلات قابل توجهی ایجاد کنند.

اضافه کردن دیدگاه

جدیدترین‌ مطالب