OpenAI بهروزرسانی جدید مدل GPT-4o را که باعث شده بود ChatGPT بیشازحد چاپالوس به نظر برسد، حذف کرد و حالا توضیح داده دقیقاً چه اتفاقی رخ داده است.
OpenAI در بیانیهای اعلام کرد تلاشهایش برای «بهبود استفاده از بازخورد کاربران، حافظه و دادههای بهروزتر» احتمالاً باعث شده «تعادل در برابر تملقگویی بههم بخورد.»
در هفتههای اخیر، کاربران متوجه شده بودند که ChatGPT تقریباً در همهی موارد با آنها موافقت میکند؛ حتی در سناریوهای نسبتا خطرناک. سم آلتمن، مدیرعامل OpenAI، بعدها تأیید کرد که آپدیت جدید GPT-4o باعث شده تا چتبات «بیشازحد چاپالوس و آزاردهنده» شود.
OpenAI در آپدیت اخیرش شروع به استفاده از اطلاعات دکمههای لایک و دیسلایک در ChatGPT به عنوان «سیگنال پاداش اضافی» کرده بود. خالق ChatGPT میگوید: «این تغییر ممکن است اثر سیگنال پاداش اولیهی ما را که مانع رفتار چاپالوسانه میشد، تضعیف کرده باشد.» به گفتهی این شرکت، بازخورد کاربران «گاهی پاسخهای موافقتر را ترجیح میدهد» و همین عامل میتواند به تشدید این رفتار منجر شده باشد. اشاره شده که ویژگی حافظهی چتبات میتواند تملقگویی را تقویت کند.
OpenA اذعان کرد که در فرایند ارزیابی، هشدارهای کیفی دربارهی رفتار غیرعادی مدل را نادیده گرفت و ابزارهای سنجش موجود قادر به شناسایی رفتار چاپالوسانه نبودهاند.
خالق ChatGPT میگوید که ازاینپس مسائل رفتاری را معیاری برای توقف احتمالی انتشار بهروزرسانیها قرار میدهد و فاز آزمایشی داوطلبانهای برای دریافت بازخورد مستقیم کاربران پیش از انتشار عمومی راهاندازی خواهد شد. همچنین، اطلاعرسانی دربارهی تغییرات ChatGPT دقیقتر انجام میشود.