سؤال بسیاری از افراد در این دوران که نوشتههای مختلف درباره نابودی بیوقفه هنرها توسط صنعت هوش مصنوعی صحبت میکند، این است که چطور «آنتروپیک» دادههای مورد نیاز برای آموزش مدل کلود (Claude) خود را جمعآوری کرده است.
این استارتآپ پشتیبانی شده توسط گوگل، تنها از میلیونها کتاب دارای حق نشر تقلید نکرد، بلکه صفحات کتابها را از جلدشان جدا کرد، آنها را اسکن کرد تا فایلهای دیجیتل بسازد و سپس تمام آن میلیونها صفحه متن اصلی را دور ریخت.
این کار در دادگاه فاش شد. قاضی این پرونده حکم داد که «آنتروپیک» میتواند مدلهای زبانی بزرگ (LLM) خود را بر اساس کتابهایی که قانوناً خریده، حتی بدون اجازه مستقیم نویسندگان، آموزش دهد.
این کار در مجموع، از مفهوم حقوقی قاعده اولین فروش (first-sale doctrine) بهره میبرد. این اصل به خریدار اجازه میدهد هر کاری میخواهد با کالای خریداریشده انجام دهد و نیاز به مداخله حقوقدان یا ناشر نیست، با این وجود کار شرکتهای هوش مصنوعی همیشه با نیت بد همراه بوده است.
آنتروپیک در فبروری ۲۰۲۴ تام تروی(Tom Turvey)، سرپرست پیشین پروژه اسکن کتابهای گوگل را استخدام کرد تا تمام کتابهای جهان را بدون روبهرو شدن با مشکل حقوقی، جمعآوری کند. تروی با خریدن کتابها به شکل فزیکی منجر به محافظت این شرکت با قانون «قاعده اولین فروش» شد و این شرکت دیگر نیاز به دریافت مجوز ندارد.
البته این راهحل، کمی فریبکارانه. زمانی که «آنتروپیک» شروع به کار کرد، مسیر غیر اخلاقیتری را انتخاب کرد و میلیونها کتاب را دانلود کرد و آنها را به صورت غیرقانونی برای آموزش هوش مصنوعی خودش استفاده کرد. همین کار را شرکت متانیز انجام داد که به تازگی توسط گروهی از نویسندگان در دادگاه مورد شکایت قرار گرفته است.
همچنین این کار با بیدقتی همراه است. بسیاری از آرشیوها و مؤسسات، روشهایی ابداع کردهاند تا بتوانند کتابها را به صورت گروهی اسکن کنند، بدون اینکه نیاز باشد آنها را نابود کنند یا تغییر دهند، اما هرچقدر که این امر صرفهجویی در هزینه باشد، صنعت هوش مصنوعی در حال کمبود منابع باکیفیت است که بتواند سامانههای خود را تغذیه کند و از آنجایی که در طول این مدت کم، کارهای غیراخلاقی انجام داده است، سرانجام اهمیتی ندارد که برخی نویسندگان ضرر ببینند یا کتابها نابود شوند. این هزینهای کوچک برای غولهای فناوری است که باید پرداخت شود.