- 2025-02-01
- 1 بازدید
- 0 دیدگاه
- هوش مصنوعی
هوش مصنوعی TinyZero معرفی شد؛ بازتولید DeepSeek با تنها ۳۰ دلار!
تحقیقات هوش مصنوعی معمولاً بازی شرکتهای بزرگ فناوری با جیبهای پرپول است. با این حال، یک تیم در دانشگاه برکلی کالیفرنیا این روند را تغییر داد. آنها توانستند قابلیتهای اصلی مدل DeepSeek R1-Zero را با تنها ۳۰ دلار (بدون اشتباه تایپی) بازتولید و مدل هوش مصنوعی TinyZero را خلق کنند.
این پروژه ثابت میکند که مدلهای پیشرفته استدلال هوش مصنوعی لزوماً نباید هزینههای گزافی داشته باشند و علاوه بر این، تحقیقات هوش مصنوعی در حال دسترسیپذیرتر شدن از همیشه است.
محققان این دانشگاه به رهبری Jiayi Pan هدف خود را بازآفرینی مدل استدلالی DeepSeek با استفاده از یادگیری تقویتی (Reinforcement Learning یا RL)، به جای تکیه بر خدمات ابری گرانقیمت یا قدرت محاسباتی عظیم قرار دادند و TinyZero را با یک مدل زبانی پایه، یک دستورالعمل ساده و یک سیستم پاداش آموزش دادند.
Jiayi Pan در پستی در X (سابقاً توییتر) گفت: «شما میتوانید لحظه “آها” را خودتان با کمتر از ۳۰ دلار تجربه کنید.» او همچنین TinyZero را اولین بازتولید باز (open reproduction) از مدلهای استدلالی توصیف کرد و تأکید کرد که این مدل چگونه یاد گرفت تا پاسخهای خود را تأیید و بهبود بخشد.
مدل هوش مصنوعی TinyZero چگونه توسعه یافت؟
برای آزمایش این مدل هوش مصنوعی، محققان از یک بازی به نام Countdown استفاده کردند که در آن بازیکنان باید با استفاده از عملیات ریاضی پایه به یک عدد هدف برسند. در ابتدا TinyZero به صورت تصادفی حدس میزد، اما به مرور زمان یاد گرفت که پاسخهای خود را تأیید کند، به دنبال پاسخهای بهتر بگردد و بر این اساس تنظیم شود.
آنها با اندازههای مختلف این مدل را آزمایش کردند، از مدلهای ۵۰۰ میلیون پارامتری تا ۷ میلیارد پارامتری. نتایج چه بود؟ مدلهای کوچکتر (۰.۵ میلیارد پارامتر) فقط پاسخها را حدس میزدند و متوقف میشدند. مدلهای بزرگتر (۱.۵ میلیارد پارامتر و بیشتر) یاد گرفتند که پاسخهای خود را تأیید کنند، راهحلها را بهبود بخشند و دقت را به طور قابل توجهی افزایش دهند.
چه چیزی TinyZero را واقعاً چشمگیر میکند؟
آنچه TinyZero را واقعاً چشمگیر میکند، هزینه بسیار پایین آن در مقایسه با مدلهای سنتی هوش مصنوعی است. فقط به این هزینهها نگاه کنید:
هزینه API شرکت OpenAI: هر یک میلیون توکن 15 دلار
هزینه مدل DeepSeek-R1: هر یک میلیون توکن 0.55 دلار
هزینه کل TinyZero: هزینه یکبار آموزش 30 دلار
این بدان معناست که هر کسی — نه فقط شرکتهای بزرگ فناوری — میتواند بدون هزینههای گزاف با مدلهای استدلال هوش مصنوعی آزمایش کند.
دسترسی به TinyZero
مدل هوش مصنوعی TinyZero به صورت متنباز (open-source) در GitHub در دسترس است، بنابراین هر کسی میتواند با آن کار کند. اگرچه این مدل در حال حاضر فقط در بازی Countdown آزمایش شده است، پَن امیدوار است که این پروژه تحقیقات یادگیری تقویتی را بیش از پیش در دسترس قرار دهد.
البته، هنوز راه زیادی در پیش است. Jiayi Pan اذعان کرده است که: «یک نکته مهم این است که این مدل فقط در وظیفه Countdown تأیید شده است و نه در حوزه استدلال عمومی.» اما حتی با این محدودیت، تأثیر آن واضح است: توسعه هوش مصنوعی لزوماً نباید گران باشد. با پروژههایی مانند TinyZero، هوش مصنوعی مقرونبهصرفه و متنباز میتواند آینده این حوزه باشد.
ارسال دیدگاه