شکایت ردیت از پرپلکسیتی و سه شرکت دیگر به اتهام استفاده غیرمجاز از محتوا

ردیت از پرپلکسیتی شکایت کرد. به گزارش نیویوزک تایمز، ردیت از شرکت‌های SerApi، OxyLabs، AWMProxy و پرپلکسیتی به دلیل برداشت…

ردیت از پرپلکسیتی شکایت کرد. به گزارش نیویوزک تایمز، ردیت از شرکت‌های SerApi، OxyLabs، AWMProxy و پرپلکسیتی به دلیل برداشت غیرمجاز داده‌ها از نتایج جست‌وجو و استفاده بدون مجوز از آن‌ها شکایت کرده است. این شکایت تازه در ادامه‌ی اقدام قانونی ردیت علیه استارتاپ هوش مصنوعی آنتروپیک صورت می‌گیرد که ظاهراً از محتوای ردیت برای آموزش چت‌بات خود یعنی Claude استفاده کرده بود.

جزئیات شکایت ردیت از پرپلکسیتی

از سال 2023، ردیت برای دسترسی شرکت‌ها به پست‌ها و سایر محتوای خود هزینه دریافت می‌کند تا از داده‌هایی که ممکن است برای آموزش هوش مصنوعی استفاده شوند، درآمدزایی کند.

این شرکت همچنین قراردادهای صدور مجوزی با گوگل و OpenAI امضا کرده و حتی یک موتور پاسخ‌دهی مبتنی بر هوش مصنوعی اختصاصی خود ساخته تا از دانش موجود در پست‌های کاربران بهره ببرد.

برداشت مستقیم داده‌ها از نتایج جست‌وجوی گوگل برای محتوای ردیت راهی برای دور زدن این پرداخت‌ها است، به همین دلیل ردیت در پی دریافت خسارت مالی و صدور حکم دائمی برای جلوگیری از فروش داده‌های برداشت‌شده است.

برخی از شرکت‌های هدف شکایت، مانند SerApi، OxyLabs و AWMProxy، نام‌های چندان شناخته‌شده‌ای نیستند، اما اساس کسب‌وکار آن‌ها بر جمع‌آوری داده از نتایج جست‌وجو و فروش آن بنا شده است.

در مقابل، حضور شرکت پرپلکسیتی در این پرونده چندان تعجب‌برانگیز نیست. این شرکت فعال در حوزه هوش مصنوعی برای آموزش مدل‌های خود به داده نیاز دارد و پیش‌تر نیز متهم شده بود که محتوای دارای حق مجوز را کپی و بازتولید کرده است. گزارش‌ها همچنین نشان می‌دهد که پرپلکسیتی پروتکل robots.txt را که مشخص می‌کند وب‌سایت‌ها نمی‌خواهند محتوای آن‌ها برداشت شود، نادیده گرفته است.

طبق این شکایت، ردیت پیش‌تر دستور توقف برداشت داده بدون مجوز را برای Perplexity ارسال کرده بود. این شرکت در پاسخ مدعی شد که از داده‌های ردیت استفاده نمی‌کند، اما همچنان به ارجاع به این پلتفرم در پاسخ‌های چت‌بات خود ادامه داد.

ردیت می‌گوید با ایجاد یک «پست آزمایشی» توانسته ثابت کند که پرپلکسیتی محتوای ردیت را از طریق گوگل برداشت کرده است. این پست تنها توسط موتور جست‌وجوی گوگل قابل مشاهده بود و در هیچ بخش دیگری از اینترنت در دسترس نبود، اما تنها چند ساعت بعد، موتور پاسخ‌دهی پرپلکسیتی محتوای آن پست را بازتولید کرد.

در متن شکایت آمده است:

تنها راهی که پرپلکسیتی می‌توانست به آن محتوای ردیت دسترسی پیدا کند و سپس آن را در موتور پاسخ‌دهی خود به کار گیرد، این بود که خود این شرکت یا هم‌دستانش محتوای ردیت را از نتایج جست‌وجوی گوگل برداشت کرده و سریعاً در سامانه پاسخ خود وارد کرده باشند.

در پاسخ، شرکت پرپلکسیتی بیانیه‌ای صادر کرد:

ما هنوز نسخه رسمی شکایت را دریافت نکرده‌ایم، اما همواره با قدرت از حق کاربران برای دسترسی آزاد و منصفانه به دانش عمومی دفاع خواهیم کرد. رویکرد ما اصولی و مسئولانه است، زیرا ما پاسخ‌های واقعی را با هوش مصنوعی دقیق ارائه می‌دهیم و تهدید علیه شفافیت و منافع عمومی را تحمل نخواهیم کرد.

این شکایت در راستای رویکرد تهاجمی ردیت برای محافظت از داده‌های خود است. در سال 2024 این شرکت دسترسی ربات‌ها و خزنده‌های ناشناس را محدود کرد و در اوت 2025 نیز میزان دسترسی Wayback Machine (آرشیو اینترنت) به محتوای خود را کاهش داد. علاوه بر این، ردیت برای تعریف چارچوب جدیدی در زمینه برداشت داده از وب‌سایت‌ها، از استاندارد Really Simple Licensing استفاده کرده که شرایط صدور مجوز را به فایل robots.txt اضافه می‌کند.

منبع خبر