انتشار مدل یادگیری ماشینی DeepSeek R۱ از طرف یک شرکت چینی هیاهوی کمنظیری به پا کرده است. گرچه طی چند سال اخیر سروصدا پیرامون «هوش مصنوعی»[۱] کم نبوده، اما همیشه صحبت از دستاوردهای شرکتهای عظیم فناوری در غرب بوده است و اکثر مواقع هم در تأیید بزرگنماییهایی که دربارهی تواناییهای این الگوریتمها میشود. اما هیاهوی اخیر ضمن داشتن شباهتهایی با همهگیریهای خبری قبلی، تفاوتهایی با آنها دارد. اتفاقی افتاده است که بر اثر آن سهام ارزشمندترین شرکت جهان ۱۷درصد سقوط کرده است. اما چه اتفاقی افتاده؟ مدل تازه معرفیشده چیست و چه شرایطی این سقوط سهام را رقم زده است؟
شکلگیری حباب هوش مصنوعی
در این سالها و به خصوص پس از انتشار الگوریتم ChatGPT از شرکت OpenAi دیگر همگی به واکنشهای اغراقآمیز نسبت به الگوریتمهای یادگیری ماشینی عادت کردهایم. از رسانههای جریان اصلی تا شبکههای اجتماعی و پلتفورمهای محتوا پر شدهاند از بزرگنمایی دربارهی این الگوریتمها و بازاریابی برای شرکتهای عظیم فناوری. مدیرانعامل و سهامداران این شرکتها هم باهم در رقابتاند تا با عمومی کردن این بزرگنماییها آن را وسیلهی جذب بیشتر سرمایه برای شرکتهایشان کنند.
در چنین فضایی هر مدل جدید (که قاعدتاً از مدلهای پیش از خود توانمندتر است) بدل به دستمایهای برای راه انداختن سیلی از ادعاهای عجیب و غریب و به دنبال آن جذب سرمایههای کلان به نفع شرکتهای فعال در این زمینه شده است. این تاکتیک چنان اثربخش بوده که حتی شرکتهای سوخت فسیلی و خودروسازان هم دست به کار شدهاند تا با چسباندن برچسب «هوشمند» به خدمات/کالاهاشان از این آشفتهبازار چیزی دشت کنند.
مدت کوتاهی بعد از اوجگیری شهرت ChatGPT و StableDiffusion با سرازیر شدن سرمایه به شرکتهای فناوری بسیاری اخطار دادند که یک حباب سرمایهای پیرامون سهام شرکتهای هوش مصنوعی در حال شکلگیری است. شرکتهای فناوری ۲۵ سال پیش هم تجربهی مشابهی را از سر گذراندند. در دههی ۹۰ میلادی در نتیجهی اوجگیری اینترنت، یکشبه شرکتهای بزرگ و کوچک بسیاری در «سیلیکون ولی» آمریکا متولد شدند که هر یک مدعی بودند که با استفاده از اینترنت میتوانند سودهای کلانی برای سرمایهگذاران تولید کنند. نتیجهی بزرگنماییهای بسیار چیزی جز شکلگیری یک حباب سرمایهای پیرامون سهام شرکتهای اینترنتی نبود. وقتی حوالی سال ۲۰۰۰ خروج سرمایه از سیلیکون ولی شروع شد، بخش عمده شرکتهایی که با حباب دات-کام به ارزش بالایی رسیده بودند چند روزه هیچ شدند و اعلام ورشکستگی کردند.
تجربهی شکلگیری حبابهای مالی در بازارهای مختلف در تاریخ سرمایهداری کم نبوده است. هجوم سرمایه به بازارهای مختلف از جمله فناوریهای جدید به امید کسب سودهای کلان، پیشتر هم راهی جز به بحرانهای اقتصادی بزرگ نبرده است. در میانهی قرن ۱۹ام سرمایهگذاران به سهام راهآهن بریتانیا هجوم بردند. نتیجه شکلگیری یک حباب مالی بزرگ و بعدتر ترکیدن این حباب و از دست رفتن سرمایههایشان بوده. آنچه بحران اقتصادی بزرگ غرب در ۱۹۲۰ را شکل داد، جاری شدن حجم زیادی سرمایههای خرد و بدهی به بازارهای مالی به امید کسب سودهای نجومی در آینده بود که به رکود اقتصادی شدید در امریکا و رشد ملیگرایی و فاشیسم در قلب اروپا راه برد. حوالی ۱۹۹۰ ژاپن تجربهی ترکیدن یک حباب مالی در بازار مسکن را تجربه کرد که اثراتش برای یک دهه بر اقتصاد این کشور باقی ماند. حباب مالی بازار مسکن که در دههی نخست قرن ۲۱ در آمریکا شکل گرفت در سال ۲۰۰۸ ترکید و اقتصاد جهان را به رکودی عمیق کشاند که اثراتش تا امروز همچنان باقی است.
شاید حباب مالی شکلگرفته پیرامون برچسب «هوش مصنوعی» هنوز آنقدر بزرگ نباشد که اقتصاد سرمایهداری را در جهان زمینگیر کند اما به نظر میرسد امروز شاهد شکلگیری نوعی «حباب همهچیز» باشیم. نتیجهی سیاستهای مالی غرب برای بیرون آمدن از رکود بزرگ ۲۰۰۸ که تزریق پول به شرکتهای ثروتمند بود، افزایش ثروت ثروتمندترین مردم زمین بوده. همانها که با خلق حباب مالی بحرانی بزرگ پدید آوردند، از پس بحران با ثروتی بیش از پیش مشغول شکل دادن حبابهای تازه شدهاند. حباب مالی هوشمصنوعی تنها یکی از آنهاست.
دستاندرکاران این بازار مدعیاند که حبابی در کار نیست و رشد ابدی ارزش شرکتهای فناوری پیشرو در هوش مصنوعی ماندگار خواهد ماند و در نتیجه آنها که زودتر به سرمایههایشان را به این بازار بیاورند، سود بیشتری خواهند کرد. این ادعا بر پیشفرضهایی بنا شده که از این قرارند:
توانایی الگوریتمهای هوش مصنوعی با سرعت تصاعدی بیشتر میشود. برای این منظور ارجاعاتی به قانون مور[۲] و حتی رشد تصاعدی توان پردازشی در پردازندههای کوانتومی در محتوای بازاریابی برای شرکتهای هوشمصنوعی دیده میشود.
گرچه رشد توانایی این الگوریتمها به طرق مختلف ازجمله روشهای ریاضیاتی و الگوریتمی جدید ممکن است اما قابلاتکاترین روش برای گسترش توانایی این الگوریتمها افزایش توان پردازشی با استفاده از پردازندههای سریعتر و بیشتر است. (این پیشفرض تحت تأثیر یادداشت مهمی است که ریچارد ساتن در سال ۲۰۱۹منتشر کرد)[۳]
رشد تصاعدی هوش مصنوعی بهزودی به جایی میرسد که سرمایه بینیاز از حضور انسان میتواند سود خلق کند و از آنجا که هوش مصنوعی خود-بهبود-بخش میتواند با شتابی هرچهبیشتر تقویت شود، تنها مالکان بهترین هوش مصنوعی هستند که میتوانند از رقابت با سایرین پیروز درآیند.
یوفوریای سرمایهگذاران هوش مصنوعی را میتوان در متونی مثل «مانیفست تکنو-اپتیمیسم» از مارک اندرسون به وضوح دید. اندرسون که از سرمایهگذاران مشهور در پروژههای فناوریهای محاسباتی مدرن است، در مانیفستش بدون لکنت با حمله به همهی آنها که خواهان کنترل و وضع مقررات برای فناوریهای مدرن هستند، آنها را واپسگرا میخواند و در عوض نوید میدهد در عصر هوش مصنوعی بازار نیازی به کنترل حکومتی ندارد و بدون برنامهریزی میتوان به اتوپیای فناورانه رسید که حرف جدیدی نیست و پیش از او بسیاری گفتهاند. از دید او نه مسائل محیطزیستی و اکولوژیک مهم هستند و نه مشکلاتی که فناوریهای جدید در کوتاه مدت ایجاد میکنند. هدف افزایش جمعیت انسانها تا جای ممکن و رسیدن به اتوپیای فناورانه آینده است.
هم اندرسون و هم سایر سرمایهداران فناوریهای مدرن در زبان خود با اشاره به ادبیات فاشیستی خواهان دگرگونی روابط اجتماعی به نفع سرمایههای کلان و به قول یانیس واروفاکیس تکنوفئودالیستها هستند. چند روز پیش از انتشار مدل جدید شرکت چینی DeepSeek، سم آلتمن مدیرعامل اوپن ایآی در یک گفتوگو از لزوم بازنگری در قرارداد اجتماعی گفته بود و ایلان ماسک که در لجنپراکنی به ناقدان وضعیت لیبرالدموکراسیهای غربی مشهور است، در مراسم آغاز ریاستجمهوری دونالد ترامپ سلام نازی داده بود.
در میانهی این هیاهوی بسیار به بهانهی مشتی الگوریتم تحلیلگر زبان -که الگوی بین کلمات را استخراج و خروجی مناسب را تولید میکنند- که هدفش جذب سرمایه و تغییر قوانین و ساختارهای سیاسی و اجتماعی است، مدل یادگیری ماشینی یک شرکت چینی که کمتر در غرب شناخته شده بود آبی شد بر این آتش.
آب بر آتش هیاهو
نشریات غرب (و به دنبال آنها رسانههای فارسیزبان داخلی و خارجی) پر هستند از تیترها و مطالب رنگارنگ دربارهی ضعفها و ناتوانیهای چین. کشوری که سالهاست مجلهی اکونومیست میگوید هر لحظه ممکن است مثل اتحاد جماهیر شوروی فرو بپاشد!
هم مدیران و هم سهامداران شرکتهای فناوری غربی بارها در مصاحبههایشان از ناتوانی چین برای رقابت با غرب (بهخصوص با ایالات متحده آمریکا) در زمینهی نوآوریهای فناورانه گفتهاند. با استدلالهایی از این قبیل که چون در چین آزادی فردی نیست، امکان پرورش خلاقیت هم نیست. چون چین دیکتاتوری است امکان رشد بخش خصوصی که میتواند دست به تولید چیزهای جدید بزند در آن وجود ندارد. پس از آنکه معلوم شد این خبرها نیست و چین در یکی دو دهه فاصلهاش را با غرب در زمینهی فناوری کم کرده است، با وضع تحریمهای فناورانه تلاش شد که جلوی پیشرفت آن گرفته شود و به استدلالهای پیشین اینها هم اضافه شدند که: فاصلهی چین با آمریکا در تولید پردازنده یک دهه است و امکان ندارد که بتواند این فاصله را پر کند. وقتی شرکت هواوی پس از تحریم از پردازندهی جدیدش رونمایی کرد، مشخص شد این فاصله بسیار کمتر است و جنگ صنعتی و فناورانه با چین تشدید شد.
در فضای رسانهای غرب کسی توقع نداشت که یک شرکت ناشناختهی چینی ناگهان مدل یادگیری ماشینی همتراز پیشرفتهترین مدلهای مهمترین بازیگران غربی تولید کند. چه رسد به اینکه از لحاظ فنی تولید و استفاده از آن بسیار بهینهتر هم باشد و در آخر آن را بهرایگان به شکل متنباز در اختیار همه بگذارد. هر کدام از این دستاوردها بهتنهایی زلزلهای برای پیشفرضهای سرمایهداران فناوری در غرب بود و آنچه شرکت دیپسیک انجام داد طی همین چند روز به عنوان «لحظهی اسپوتنیک هوش مصنوعی»[۴] معروف شده است.
اما برای دنبالکنندگان دنیای یادگیری ماشینی و بهخصوص الگوریتمهای تحلیلگر زبان، دیپسیک شرکتی ناشناخته نبود. آنها همین چند هفته پیش نسخهی سوم مدل تحلیلگر زبان خود را منتشر کرده بودند که از لحاظ توانایی همپای مدل GPT4 شرکت اوپنایآی بود و بدون تحریم و محدودیت و بسیار ارزانتر از نمونههای غربی در اختیار همه قرار گرفت. اما مدل جدید دیپسیک که DeepSeek R1 نام گرفت[۵] مجموعهای از نوآوریهای تکنیکی در خود داشت که کمتر کسی تصور میکرد به این خوبی کار کنند.
بخشی از این نوآوریها در مقالههای قبلی دیپسیک در سال ۲۰۲۳ منتشر شده بود. محققان دیپسیک نشان داده بودند که تهیهی دادههای آموزشی با کیفیت بالا بسیار مهمتر از جمعآوری هر دادهی ممکن از هر جای ممکن و غرق کردن الگوریتم یادگیری ماشینی زیر سیلی از دادههای بیکیفیت است.[۶] از طرف دیگر در این مقاله محققان دیپسیک نشان دادند که به جای استفاده از روشی که معروف است به پیشآموزش[۷] میتوان از مجموعه الگوریتمهای یادگیری تقویتی[۸] که از شاخههای قدیمی یادگیری ماشینی است که ادبیاتی غنی دارد، برای آموزش مدلهای تحلیلگر زبانی استفاده کرد و در ضمن مجموعه این نوآوریها نیاز به پردازش طولانی و عظیم را بسیار کمتر میکند.
در مقالهی تازهی این شرکت سه نوآوری دیگر هم دیده میشود.
- استفاده از فن «زنجیرهی افکار»[۹] که به خودی خود نوآوری جدیدی نیست اما استفاده از آن در آموزش الگوریتم با استفاده از یادگیری تقویتی تازه بوده است و نام مدل استدلالگر با توجه به استفاده از این روش برای مدل انتخاب شده.
- دیپسیک نشان داد که میتواند از فرآیند آموزشی جدیدش برای «تقطیر دانش»[۱۰] از مدلهای بسیار بزرگتر در مدلهای کمحجم استفاده کرد. تقطیر دانش روشی شناخته شده در یادگیری ماشینی است که در آن یک مدل یادگیری ماشینی با تعداد پارامترهای قابل آموزش کمتر (در این مورد زیر ۱۰میلیارد پارامتر) دانش ذخیره شده در مدلهای چند صد میلیارد پارامتری را استخراج کرده و جذب میکند. این مدلهای کوچک روی بسیاری از سختافزارهای عمومی قابل اجرا هستند و نیاز نیست حتماً کوهی از پردازندههای گرافیکی انویدیا در اختیار داشته باشید تا بتوانید از آنها استفاده کنید.
- استفاده از معماری موسوم به «مجموعهی متخصصان»[۱۱] بسیار کاراتر از افزایش کور تعداد پارامترهای یادگیری در مدلهای تحلیلگر زبان است.
از مقاله و مدلهای تازه منتشر شدهی دیپسیک میتوان این نتایج را گرفت که:
- اولاً میتوان با استفاده از روشهای آموزشی جدید با نیاز پردازشی بسیار کمتر به نتایجی بهتر از آنچه در دسترس است رسید که یعنی رشد و سرعت پردازندهها مهمترین راه توسعهی توانایی الگوریتمهای یادگیری ماشینی نیست.[۱۲]
- ثانیاً از آنجا که میتوان دانش مدلهای بزرگ را در قالب مدلهای بسیار کوچکتر تقطیر کرد، نیاز کمتری به پردازندههای سریعتر و قویتر برای استفاده از بهترین مدلهای روز است.
هر دوی این نتایج پیشفرضهای شکلگیری حباب مالی هوش مصنوعی را هدف قرار میدهند. گرچه پردازندههای سریعتر، آموزش و استفاده از مدلهای یادگیری ماشینی را سریعتر میکنند اما تمرکز روی آنها ما را از دنیایی از امکانهای دیگر دور نگاه میدارد. از طرف دیگر میتوان از این الگوریتمها روی سختافزارهای بسیار ضعیفتر هم بهره برد و نیازی به مزارع عظیم سِروِر برای استفاده از آنها نیست در نتیجه میزان تقاضا برای سختافزارهای لازم برای آموزش و استفاده از این الگوریتمها بسیار کمتر از آنچه تصور میشد خواهد بود.
در نتیجهی شوکی که به پیشفرضهای شکلدهندهی حباب مالی هوش مصنوعی وارد شد، حجم عظیمی سرمایه از این بازار خارج شد که تا اینجا برآورد میشود حدود یک تریلیون دلار ارزش را در بازار سهام شرکتهای فناوری دود کرده باشد.
چین متخاصم
واکنشها در رسانههای جریان اصلی نسبت به انتشار مدلجدید دیپسیک مطابق معمول پر از اغراق بوده است اما اینبار به مبالغهها توهم توطئه و تخاصم هم اضافه شده است. بعضی میگویند امکان ندارد این مدلها با استفاده ۲-۳درصد منابع مورد نیاز در غرب برای آموزش مدلهای مشابه آموزش دیده باشند و حتماً کاسهای زیر نیمکاسه است و چین پردازندههای انویدیا را قاچاقی وارد کرده. یا حزب کمونیست چین مخفیانه رایانههای قدرتمندش را در اختیار این شرکت کوچک گمنام گذاشته. یا اصلا اینها دزدی است و تقطیر اطلاعات از مدلهای قدرتمند غربی است.
از طرف دیگر اخطار به کاربران غربی اوج گرفته. در ادامهی فضایی که پیرامون ممنوع کردن تیکتاک در امریکا به راه افتاد،[۱۳] حالا به کاربران غربی اخطار داده میشود که دیپسیک اطلاعات شما را میدزدد و هر چه به دیپسیک بگویید چین کمونیست آن را ذخیره و از آن علیه شما استفاده میکند.
از درون شرکتهای فناوری کمتر چنین ادعاهایی بیرون میآید. شاید چون آنها میدانند که این روشهای جدید واقعاً چقدر کاراست و از طرف دیگر اگر صحبت از ذخیره و پایش اطلاعات باشد، چین و شرکتهایش به گرد پای شرکتهای غربی در دزدیدن اطلاعات کاربران غربی نمیرسند. گرچه شرکت اوپنایآی بعد از چند روز ادعا کرده است که در فرآیند آموزش مدل دیپسیک از الگوریتمهای این شرکت کمک گرفته شده که نقض شروط استفاده از این الگوریتمهاست و کسی حق ندارد با استفاده از الگوریتمهای اوپنایآی با این شرکت رقابت کند! این در حالی است که بحث کپیرایت درباره این الگوریتمها بسیار داغ است و حقوقدانان بسیاری اوپنایآی و سایر غولهای فناوری را متهم میکنند که بدون توجه به حقوق مؤلفان از آثاری که آنها خلق کردهاند برای ساخت الگوریتمهایش استفاده میکند. اما تاکید بیشتر شرکتهای غربی در این مدت کوتاه بیشتر تاکید بر لزوم آغاز یک جنگ علمی/فناورانه جدید با چین بودهاست . میگویند که بیایید تا این لحظهی اسپوتنیک هوش مصنوعی را پلهای کنیم که همانطور که ماه را فتح کردیم، «هوش جامع مصنوعی»[۱۴] را بسازیم. ناگفته عیان است که چنین طرحهایی به پول بسیاری نیاز دارد که دولت ترامپ آماده است به شرکتهای فناوری امریکایی تزریق کند تا آنها را از رقابت در برابر شرکتهای چینی نجات دهد. در همین بلبشو طرح «پروژهی استارگیت» مطرح شد که در آن دولت ترامپ قول ۵۰۰میلیارد دلار پول برای شرکتهای فناوری را داده است تا بتوانند با آنچه خطر چین در رشد فناوریهای پردازشی خوانده مقابله کنند.
در چین هم سرورهای شرکت دیپسیک تحت حملهی سایبری قرار گرفته و دو روزی است که نیمه فعالاند. چینیهای بسیاری هم به سایت آن هجوم بردهاند تا ببینند این محصول چینی که اینطور در غرب هیاهو راه انداخته چیست. نخستوزیر چین با مدیرعامل شرکت دیپسیک دیدار کرده است تا از مشورت آنها در گزارشهای بعدی حزب کمونیست دربارهی فناوری استفاده کند.
اما موضوع محدود به دیپسیک نیست. پیش از آغاز سال نوی چینی طی یک هفته چندین شرکت چینی مدلهای یادگیری ماشینی جدید خود را منتشر کردند که بیشتر آنها رایگان و متنباز در اختیار همه است. هر یک از این مدلها رقبایی جدی برای مدلهای پولی شرکتهای غربی هستند. به نظر میرسد برخلاف آنطور که سرمایهگذاران غربی و کارشناسانشان در رسانهها تصور میکردند، چین میتواند نوآوری کند و حمایت کافی از نیروی کار متخصص پس از مدتی به خلق نوآوریهای جدید و تولید علم و فناوری میانجامد که میتوان آن را در تعداد مقالات و پتنتهای شرکتها و دانشگاههای چین در زمینههای مختلف فناوری از هوش مصنوعی و رباتیک گرفته تا باطریها و خودروهای الکتریکی و تولید انرژی تجدیدپذیر و هستهای و پزشکی و کشاورزی یافت.
محققان غربی در شبکههای اجتماعی با کنایه میگویند که چه کسی تصورش را میکرد که اگر به جای زیستن در نگرانی مداوم بابت از دست دادن خانه و ناتوانی از خرید غذا و اخراج از شرکت بخاطر افزایش سود سهامداران و از دست دادن گرنت آکادمیک بهخاطر تولید کم مقاله و نگرانی از دست دادن بیمه درمان و این دست مسائل، میتوانستی هر روز با حس امنیت زیست به فکر تحقیق و توسعه کاری معنادار باشی، از درون این فعالیتها دستاوردهایی بیرون خواهد آمد که جامعهی بشری را گامی جلو خواهد برد.
[۱] این عنوان مصطلح غلطانداز است. مثل آن میماند که به ماشینآلات کشاورزی که مجموعهای از پیچ و مهره و چرخدنده و اینها هستند بگوییم کشاورز مصنوعی. برنامههایی که امروز نام هوش مصنوعی میگیرند هم چیزی جز الگوریتمهای منطقی و آماری نیستند که با کشف ارتباطات آماری نهفته بین ورودیهایشان و کنار هم گذاشتن آنها، در خروجی خود الگوهایی «مناسب» را تولید میکنند. بهتر است آنها را با نام «الگوریتمهای مبتنی بر یادگیری ماشینی» بخوانیم. اصطلاح هوش مصنوعی بیش از نیمقرن پیش ابداع شد در دورانی که تصور از «هوشمندی» بسیار خامتر از امروز بود. اکثر محققان این رشته خود را محقق یادگیری ماشینی مینامند. گرچه اصطلاح هوش مصنوعی آنقدر روزمره شده که بعید است از دستش خلاص شویم.
[۲] قانون مور (Moors law) به الگویی در صنعت پردازش گفته میشود. طبق این الگو تعداد ترانزیستورها در قطعات سیلیکونی پردازندهها در هر واحد مساحت هر دو سال دو برابر میشود.
[۳] یادداشت کوتاه معروفی از محقق یادگیری ماشینی ریچارد ساتن در سال ۲۰۱۹ با عنوان «درسی تلخ» نتیجهگیری کرد که تجربهی ۷۰ساله دانش پردازشی نشان میدهد که مؤثرترین روش برای افزایش توانایی الگوریتمها افزایش توان پردازش است. این یادداشت اثر عمیقی بر جامعهی یادگیری ماشینی داشته است.
[۴] Ai Sputnik moment
[۵] DeepSeek Reasoning 1
[۶] این مشاهده بهطور مستقل توسط گروههای دیگری از محققان دیگر از کشورهای مختلف کشف و منتشر و مورد توجه قرار گرفته است.
[۷] حرف p درGPT
[۸] Reinforcement Learning
[۹] Chain of Thoughts
[۱۰] Knowledge Distillation
[۱۱] Mixture of Experts
[۱۲] این نتیجهای امیدبخش برای محققان یادگیری ماشینی است که تا حدی در برابر ایدهی «درس تلخ» ساتن قرار میگیرد.
[۱۳] اپلیکیشن تیکتاک در امریکا به بهانهی امنیت ملی مسدود و پس از مدتی موقتاً آزاد شده است. ادعای سیاستمداران آمریکایی این است که حزب کمونیست چین میتواند با استفاده از تیکتاک اطلاعات کاربران آمریکایی را بدزدد. منتقدان این طرح میگویند خرید اطلاعات کاربران از دلالان داده بسیار راحتتر از جمعآوری آن با تیکتاک است و در ضمن تمامی شرکتهای امریکایی مشغول جمعآوری و پایش دادههای کاربرانشان هستند. گمانهزنیهایی از نقش تیکتاک در دوران نسلکشی در غزه در شکلدهی فضای ضد اسرائیلی بین جوانان و همینطور میل شرکت متا برای مسدود شدن آن هم به عنوان دلایل اصلی مسدودسازی تیکتاک در آمریکا مطرح شدهاند.
[۱۴] AGI : Artificial General Intelligence
دیدگاهتان را بنویسید