بحث "اپن سورس" توی هوش مصنوعی خیلیها رو گیج کرده. یه سری اصطلاحات مارکتینگ مثل "open-weight" رو با لایسنسهای واقعی FOSS اشتباه میگیرن. این یه بحث آکادمیک نیست؛ بحث سر اینه که کنترل استک شما دست خودتونه یا دست یه شرکت دیگه. به نظر من، اکثر چیزایی که بهشون میگن "اپن"، صرفاً یه شکل جدیدی از vendor lock-in با روابط عمومی بهتره.
اینجا خیلی رک و بیتعارف میگم چی واقعیه، چی نیست و شما به عنوان یه مهندس که ددلاین داره، چی رو باید بدونید تا بعداً به مشکل نخورید.
اول از همه، یه "مدل هوش مصنوعی" فقط اون فایل weights که دانلود میکنید نیست. اون فایل یه محصول نهاییه که از یه فرآیند پیچیده و گرون تولید شده. اگه فقط weights رو داشته باشید، انگار یه ماشینی دارید که کاپوتش جوش داده شده. برای فهم، دیباگ یا بازتولید یه مدل، به کل خط تولیدش نیاز دارید: Training Data`، `Architecture و Training Code.
حالا بریم سراغ طیف "اپن" بودن که تو عمل باهاش روبرو میشیم:
* سطح ۱: Closed / API-Only
* مثالها: GPT-5, Claude 4.1, Gemini 2.5
* چیزی که گیرتون میاد: یه API endpoint و یه قبض ماهانه. همین.
* معنی در عمل: قفل کامل دست فروشنده (Total vendor lock-in). هیچ کنترلی روی آپتایم، قیمتگذاری و تغییر سیاستها ندارید.
* سطح ۲: Open-Weight
* مثالها: Llama 3, DeepSeek, Falcon, Gemma
* چیزی که گیرتون میاد: فقط فایل Model Weights. نه دیتای ترین، نه کد اصلی آموزش و معمولاً یه لایسنس محدودکننده.
* معنی در عمل: یه جعبهسیاه که میتونید خودتون هاست کنید. میتونید اینفرنس بگیرید و فاینتیون کنید، ولی نمیتونید بازتولیدش کنید، عمیقاً دیباگش کنید یا بایاسهای بنیادینش رو بفهمید. این بهتر از هیچیه، ولی اپن سورس نیست.
* سطح ۳: Open-Source AI
* مثالها: Mistral, DBRX, Phi-3
* چیزی که گیرتون میاد: Architecture`، `Training Code و Model Weights. دیتای آموزش معمولاً توی یه مقاله توضیح داده میشه ولی کامل منتشر نمیشه.
* معنی در عمل: یه سیستم قابل دیباگ. میتونید کد و معماری رو بررسی کنید و درک خوبی از متدولوژی آموزش داشته باشید. به نظر من، این حداقل استاندارد برای کارهای پروداکشن جدیه.
* سطح ۴: Radical Openness (شفافیت کامل)
* مثالها: OLMo, Pythia, SmolLM
* چیزی که گیرتون میاد: همه چیز. دیتای آموزش کامل و قابل بازتولید، معماری، کد آموزش و weights.
* معنی در عمل: یه جعبهشیشهای. اگه سختافزارش رو داشته باشید میتونید کل فرآیند آموزش رو از صفر بازتولید کنید. این استاندارد طلایی برای تحقیقات و هر کسیه که دنبال شفافیت و اعتماد کامل باشه.
اینکه غولهای تکنولوژی دارن مدلهای open-weight منتشر میکنن از سر خیرخواهی نیست. این یه حرکت استراتژیک در جواب به فشار جامعهی اپن سورسه. دیدن که دولوپرها دارن به سمت Llama و Mistral میرن و فهمیدن که با API های بسته، جنگ برای به دست آوردن ذهن دولوپرها رو میبازن. در واقع، جامعه اپن سورس اونها رو مجبور کرد که در زمین ما بازی کنن و این یه برد بزرگ برای اکوسیستمه.
این تغییر بدون ابزارهای فوقالعادهای که جامعه ساخته ممکن نبود. ابزارهایی مثل PyTorch برای ساخت، Unsloth برای فاینتیون بهینه، llama.cpp و Ollama برای اجرای مدلها روی سختافزار شخصی، و vLLM برای اینفرنس در مقیاس پروداکشن، موانع رو از بین بردن و به همه قدرت دادن.
در نهایت، اپن سورس تنها راه عملی برای تنوع زبانی در هوش مصنوعیه. شرکتهای تجاری انگیزهی مالی کمی برای پشتیبانی از زبانهای کممنابع دارن. ولی جامعه اپن سورس این کار رو میکنه. تکنیکهایی مثل LoRA فاینتیون کردن رو اونقدر ارزون و در دسترس کرده که هر کسی میتونه یه مدل بزرگ رو روی یه GPU معمولی برای زبان و فرهنگ خودش بهینه کنه.
این مطلب خلاصهای از یه ارائهی مفصلتر بود. اگه جزئیات بیشتر و اسلایدها رو میخواید، از لینکهای زیر ببینید.
📃 اسلایدها:
https://mshojaei77.github.io/open_source_ai.html
📝 پست وبلاگ:
https://dev.to/mshojaei77/open-source-ai-5aio
🛠 Join @LLMEngineers Community https://mshojaei77.github.io/open_source_ai.html https://mshojaei77.github.io/open_source_ai.html https://dev.to/mshojaei77/open-source-ai-5aio https://dev.to/mshojaei77/open-source-ai-5aio @LLMEngineers https://t.me/LLMEngineers Here's my take. Too many people are getting confused by marketing terms like "open-weight" and... Open Source AI