هوش مصنوعی TinyZero معرفی شد؛ بازتولید DeepSeek با تنها ۳۰ دلار!

تحقیقات هوش مصنوعی معمولاً بازی شرکت‌های بزرگ فناوری با جیب‌های پرپول است. با این حال، یک تیم در دانشگاه برکلی…
هوش مصنوعی TinyZero معرفی شد؛ بازتولید DeepSeek با تنها ۳۰ دلار!

تحقیقات هوش مصنوعی معمولاً بازی شرکت‌های بزرگ فناوری با جیب‌های پرپول است. با این حال، یک تیم در دانشگاه برکلی کالیفرنیا این روند را تغییر داد. آن‌ها توانستند قابلیت‌های اصلی مدل DeepSeek R1-Zero را با تنها ۳۰ دلار (بدون اشتباه تایپی) بازتولید و مدل هوش مصنوعی TinyZero را خلق کنند.

این پروژه ثابت می‌کند که مدل‌های پیشرفته استدلال هوش مصنوعی لزوماً نباید هزینه‌های گزافی داشته باشند و علاوه بر این، تحقیقات هوش مصنوعی در حال دسترسی‌پذیرتر شدن از همیشه است.

محققان این دانشگاه به رهبری Jiayi Pan هدف خود را بازآفرینی مدل استدلالی DeepSeek با استفاده از یادگیری تقویتی (Reinforcement Learning یا RL)، به جای تکیه بر خدمات ابری گران‌قیمت یا قدرت محاسباتی عظیم قرار دادند و TinyZero را با یک مدل زبانی پایه، یک دستورالعمل ساده و یک سیستم پاداش آموزش دادند.

Jiayi Pan هوش مصنوعی TinyZero در X

Jiayi Pan در پستی در X (سابقاً توییتر) گفت: «شما می‌توانید لحظه “آها” را خودتان با کمتر از ۳۰ دلار تجربه کنید.» او همچنین TinyZero را اولین بازتولید باز (open reproduction) از مدل‌های استدلالی توصیف کرد و تأکید کرد که این مدل چگونه یاد گرفت تا پاسخ‌های خود را تأیید و بهبود بخشد.

مدل هوش مصنوعی TinyZero چگونه توسعه یافت؟

برای آزمایش این مدل هوش مصنوعی، محققان از یک بازی به نام Countdown استفاده کردند که در آن بازیکنان باید با استفاده از عملیات ریاضی پایه به یک عدد هدف برسند. در ابتدا TinyZero به صورت تصادفی حدس می‌زد، اما به مرور زمان یاد گرفت که پاسخ‌های خود را تأیید کند، به دنبال پاسخ‌های بهتر بگردد و بر این اساس تنظیم شود.

آن‌ها با اندازه‌های مختلف این مدل را آزمایش کردند، از مدل‌های ۵۰۰ میلیون پارامتری تا ۷ میلیارد پارامتری. نتایج چه بود؟ مدل‌های کوچک‌تر (۰.۵ میلیارد پارامتر) فقط پاسخ‌ها را حدس می‌زدند و متوقف می‌شدند. مدل‌های بزرگ‌تر (۱.۵ میلیارد پارامتر و بیشتر) یاد گرفتند که پاسخ‌های خود را تأیید کنند، راه‌حل‌ها را بهبود بخشند و دقت را به طور قابل توجهی افزایش دهند.

چه چیزی TinyZero را واقعاً چشمگیر می‌کند؟

آنچه TinyZero را واقعاً چشمگیر می‌کند، هزینه بسیار پایین آن در مقایسه با مدل‌های سنتی هوش مصنوعی است. فقط به این هزینه‌ها نگاه کنید:

هزینه API شرکت OpenAI: هر یک میلیون توکن 15 دلار

هزینه مدل DeepSeek-R1: هر یک میلیون توکن 0.55 دلار

هزینه کل TinyZero:  هزینه یک‌بار آموزش 30 دلار

این بدان معناست که هر کسی — نه فقط شرکت‌های بزرگ فناوری — می‌تواند بدون هزینه‌های گزاف با مدل‌های استدلال هوش مصنوعی آزمایش کند.

دسترسی به TinyZero

مدل هوش مصنوعی TinyZero به صورت متن‌باز (open-source) در GitHub در دسترس است، بنابراین هر کسی می‌تواند با آن کار کند. اگرچه این مدل در حال حاضر فقط در بازی Countdown آزمایش شده است، پَن امیدوار است که این پروژه تحقیقات یادگیری تقویتی را بیش از پیش در دسترس قرار دهد.

البته، هنوز راه زیادی در پیش است. Jiayi Pan اذعان کرده است که: «یک نکته مهم این است که این مدل فقط در وظیفه Countdown تأیید شده است و نه در حوزه استدلال عمومی.» اما حتی با این محدودیت، تأثیر آن واضح است: توسعه هوش مصنوعی لزوماً نباید گران باشد. با پروژه‌هایی مانند TinyZero، هوش مصنوعی مقرون‌به‌صرفه و متن‌باز می‌تواند آینده این حوزه باشد.

منبع خبر