«دیپسیک» چگونه دنیا را تکان داد؟
ایسنا/عرضه یک مدل جدید هوش مصنوعی از سوی یک استارتآپ چینی به نام «دیپسیک» توانسته دنیای هوش مصنوعی را تکان دهد و ما را بر آن داشته تا در قالب یک گزارش به بررسی ابعاد مختلف آن بپردازیم.
یک استارتآپ مرموز و مبتکر چینی، ورود باشکوهی به صحنه هوش مصنوعی داشته است، به طوری که غولهای «سیلیکون ولی» را ناامید کرده، بازارهای سهام جهانی را متلاطم کرده و مفروضات درباره آنچه که هوش مصنوعی میتواند به دست آورد را به چالش کشیده است.
هوش مصنوعی «دیپسیک»(DeepSeek)، هزینه اندک برای توسعه هوش مصنوعی و جاه طلبی منبعباز را در ماموریتی برای پیشی گرفتن از هوش انسانی در هم میآمیزد و موفق شده است از نامهای شناخته شدهای مانند اوپنایآی(OpenAI) پیشی بگیرد.
اکنون که شاهد چنین رشد سریعی هستیم، پرسشهایی به ذهن میآید. مثلا اینکه آیا ما شاهد یک انقلاب واقعی در هوش مصنوعی هستیم یا این جریان رسانهای طی یکی دو روز اخیر، تبلیغات بیش از حد است؟
در ادامه، پرده از راز تأسیس و فلسفه «دیپسیک» برمیداریم، مدل هوش مصنوعی آن را با دیگر مدلهای هوش مصنوعی مانند ChatGPT مقایسه میکنیم، تحولات خیرهکنندهای را که در بازار ایجاد میکند، تشریح میکنیم و نگرانیهای مربوط به حریم خصوصی را که مشابه با موضوع تیکتاک(TikTok) است، بررسی میکنیم.
«دیپسیک» چیست و چه کسی آن را اجرا میکند؟
شرکت «دیپسیک» در ژوئیه 2023 توسط لیانگ ونفنگ(Liang Wenfeng)، فارغالتحصیل برجسته دانشگاه ژیجیانگ(Zhejiang) تأسیس شد. این شرکت مستقر در هانگژو با پشتوانه مالی قابل توجه و ورود استراتژیک یک صندوق تامینی به نامهایفلایر(High-Flyer) که توسط لیانگ همبنیانگذاری شده، پشتیبانی میشود.
«دیپسیک» با استفاده از قدرت مالی «هایفلایر» که دارایی حدود 8 میلیارد دلاری دارد، با خرید تراشههای قابل توجه A100 شرکت انویدیا با وجود ممنوعیت صادرات آنها به چین، ورود جسورانهای به بخش هوش مصنوعی داشته است. این تراشهها برای پایه فناوری و ظرفیت نوآوری این شرکت بسیار مهم هستند.
شهرت «دیپسیک» از توسعه مدل DeepSeek-V3 آمده است که تنها به 6 میلیون دلار هزینه برای منابع محاسباتی نیاز داشت که کسری از آن چیزی است که معمولاً توسط غولهای فناوری ایالات متحده سرمایهگذاری و هزینه میشود.
کارآیی خیره کننده مدل هوش مصنوعی «دیپسیک»، این دستیار هوش مصنوعی را به صدر جدول بارگیری برنامههای رایگان در فروشگاه برنامههای ایالات متحده رسانده که حتی ChatGPT را نیز پشت سر گذاشته است. این دستاورد، پتانسیل «دیپسیک» را برای ارائه عملکرد بالا با هزینه کمتر، به چالش کشیدن هنجارهای فعلی و آغاز ارزیابی مجدد در صنعت جهانی هوش مصنوعی برجسته میکند.
نوآوریهای فناورانه در «دیپسیک» توسط یک گروه تحقیقاتی اختصاصی در «هایفلایر» هدایت میشود که قصد خود را برای تمرکز بر هوش عمومی مصنوعی(AGI) در اوایل سال 2023 اعلام کرد. این گروه که دارای کنترل عملیاتی بر روی خوشهای از 10 هزار تراشه A100 انویدیا است، قصد دارد هوش مصنوعی را فراتر از برنامههای کاربردی سنتی ارتقاء دهد تا به قابلیتهایی دست یابد که از عملکرد انسان در کارهای با ارزش اقتصادی پیشی بگیرد.
این ادغام عمیق منابع، تعهد جدی «دیپسیک» را برای پیشروی در حوزه هوش مصنوعی نشان میدهد که نشاندهنده یک همسویی استراتژیک است که میتواند به طور قابلتوجهی بر پیشرفتهای آینده در هوش مصنوعی تأثیر بگذارد.
«دیپسیک» چگونه به وجود آمد؟
پیدایش «دیپسیک» به جاهطلبی گستردهتری برمیگردد که با انتشار هوش مصنوعی ChatGPT توسط شرکت اوپنایآی(OpenAI) در اواخر سال 2022 شعلهور شد که تنور توسعه این فناوری را در میان شرکتهای فناوری چینی برای توسعه چتباتهای رقابتی هوش مصنوعی برانگیخت.
با وجود تلاشهای اولیه غولهای چینی مانند بایدو(Baidu)، شکاف قابلتوجه در قابلیتهای هوش مصنوعی بین فناوریهای ایالات متحده و چین مشهود بود که منجر به ناامیدی گسترده در جامعه فناوری چین شد.
این شکاف موجب ظهور «دیپسیک» در سال 2023 با یک ماموریت جسورانه برای پر کردن این شکاف و برتری در هوش عمومی مصنوعی(AGI) و توسعه یک هوش مصنوعی که میتواند از هوش انسانی پیشی بگیرد، شد.
روح پایهگذاری «دیپسیک»، شبیه به روزهای اولیه اوپنایآی، ریشه در یک ایدهآلیسم غیرتجاری دارد. آنها خود را به عنوان گروهی از ایدهآلگرایان معرفی کردهاند که نه به خاطر سود، بلکه برای دستیابی به پیشرفتهای پیشگامانه در هوش عمومی مصنوعی(AGI) تلاش میکنند.
این چشمانداز آرمانگرایانه با سرمایهگذاریهای فناورانه قابل توجه، بهویژه در توسعه مدلهای DeepSeek-V3 و DeepSeek-R1 پشتیبانی میشود. این مدلها خیلی زود به دلیل عملکردشان مورد تحسین قرار گرفتهاند که با وجود دسترسی محدود این شرکت به جدیدترین تراشههای انویدیا، از برخی جنبهها از مدلهای پیشرو شرکتهای اوپنایآی و متا پیشی میگیرند.
مدل DeepSeek-V3 به شکل ویژه به دلیل سرعت استنتاج برتر و هزینه کم برای توسعه شناخته میشود و گامهای مهمی در زمینههایی که نیاز به تواناییهای محاسباتی فشرده مانند کدنویسی و حل مسئله ریاضی دارند، برداشته است.
توانمندی این مدل در یک مقاله تحقیقاتی منتشر شده در Arxiv برجسته شد، جایی که به دلیل عملکرد بهتر از سایر مدلهای منبعباز و مطابقت با قابلیتهای مدلهای منبعبسته سطح بالا مانند GPT-4 و Claude-3.5-Sonnet مورد توجه قرار گرفت.
مقایسه DeepSeek با چتباتهای دیگر مانند ChatGPT
«دیپسیک» خود را از سایر برنامههای کاربردی هوش مصنوعی مانند ChatGPT از طریق رویکردهای معماری و عملیاتی منحصر به فرد خود متمایز میکند که به منظور افزایش کارایی و کاهش هزینههای عملیاتی طراحی شده است.
«دیپسیک» با استفاده از معماری «مخلوطی از متخصصان»(MoE)، تنها بخشهای مرتبط از شبکه خود را برای هر پرس و جوی خاص فعال میکند و به طور قابل توجهی در توان محاسباتی و هزینهها صرفهجویی میکند. این به شدت در تضاد با معماری مبتنی بر ترانسفورماتور ChatGPT است که وظایف را در کل شبکه خود پردازش میکند و منجر به مصرف بیشتر منابع میشود.
فناوری مبتکرانه و بهبود عملکرد
طراحی «مخلوطی از متخصصان» دیپسیک، امکان پردازش ویژه هر کار را فراهم میکند که عملکرد آن را در زمینههای تخصصی مانند کدنویسی و حل مشکلات فنی افزایش میدهد و زمان پاسخ را سرعت میبخشد.
برعکس، ChatGPT عملکرد ثابتتری را در طیف وسیعی از وظایف ارائه میدهد، اما ممکن است به دلیل روش پردازش جامع آن، از نظر سرعت عقب بماند.
با وجود این، ChatGPT اغلب پاسخهای ظریفتر و غنیتر ارائه میدهد و عمقی را ارائه میدهد که ممکن است DeepSeek در زمینههای وسیعتر فاقد آن باشد.
سفارشیسازی و موارد استفاده
چارچوب DeepSeek ذاتاً قابل تنظیمتر است و برای پاسخگویی به کاربران با نیازهای خاص با دانش فنی برای دستکاری قابلیتهای آن طراحی شده است. این باعث میشود که برای کارهای تخصصی که نیاز به کمک فنی دقیق دارند، بسیار مناسب باشد.
از سوی دیگر، گزینههای سفارشیسازی کاربرپسندتر ChatGPT برای مخاطبان وسیعتری جذاب است و آن را برای نوشتن خلاقانه، طوفان فکری و بازیابی اطلاعات عمومی ایدهآل میکند.
هزینه و دسترسی
با توجه به میزان دسترسی، ماهیت منبعباز DeepSeek، آن را کاملا رایگان میکند و به راحتی برای اصلاح و استفاده در دسترس قرار میدهد که میتواند برای جامعه توسعه دهندگان جذاب باشد.
از آن سو، ChatGPT در حالی که یک نسخه رایگان ارائه میدهد، شامل سطوح پولی نیز است و دسترسی به ویژگیهای پیشرفتهتر و قابلیتهای API بیشتر آن با پرداخت اشتراک فراهم میشود.
تجربه کاربر و ملاحظات اخلاقی
«دیپسیک» اگرچه قدرتمند است، اما سطح بالاتری از مهارتهای فنی را از کاربران خود میطلبد که میتواند پذیرش آن را در بین افرادی که پیشینه فنی ندارند، پیچیده کند. این در حالی است که رابط بصری ChatGPT و مدل تعاملی سادهتر و کاربرپسندتر آن، یادگیری آسانتری را ارائه میدهد.
از لحاظ اخلاقی، «دیپسیک» به دلیل شیوههای جمعآوری دادههای خود، از جمله ذخیره آدرسهای IP و اطلاعات دستگاه که احتمالاً با استانداردهای GDPR در تضاد است، نگرانیهایی را ایجاد میکند. اوپنایآی در مقایسه، بر ناشناسسازی دادهها و رمزگذاری برای هماهنگی بیشتر با مقررات حفظ حریم خصوصی تاکید دارد.
موفقیت «دیپسیک» برای بازارهای جهانی چه معنایی دارد؟
عرضه مدل DeepSeek R1 لرزشهای قابل توجهی را در بازارهای سهام جهانی ایجاد کرده است که به شکل ویژه بر بخش فناوری تأثیر میگذارد. به عنوان مثال بازار سهام Nasdaq آمریکا در یک روز معاملاتی کاهش شدید 3.1 درصدی را تجربه کرد و بیش از یک تریلیون دلار ارزش بازار از بین رفت.
بر اساس گزارش پایگاه CNBC، این رکود به شدت تحت تأثیر زیان شرکتهای بزرگ فناوری بود، به طوری که انویدیا با یک سقوط تاریخی روبرو شد و بیش از 700 میلیارد دلار ارزش بازار خود را از دست داد و بزرگترین ضرر یک روزه ثبت شده برای یک شرکت را تجربه کرد.
این سقوط باعث شد تا شرکت اپل از انویدیا به عنوان با ارزشترین شرکت در ایالات متحده پیشی بگیرد، در حالی که سایر غولهای فناوری مانند گوگل و مایکروسافت نیز با ضررهای قابل توجهی مواجه شدند.
پیامدهای پیشرفت DeepSeek فراتر از ارزشگذاری سهام است. بخش انرژی نیز شاهد کاهش قابل توجهی بود که ناشی از نگرانی سرمایهگذاران بود مبنی بر اینکه فناوری کارآمدتر DeepSeek میتواند تقاضای انرژی کلی صنعت فناوری را کاهش دهد. شرکتهایی مانند جنرال الکتریک Vernova و Vistra که به دلیل توربینهای بادی و گازی خود شناخته میشوند، به ترتیب شاهد کاهش ۲۱ درصدی و ۲۸ درصدی سهام خود بودند.
تحلیلگران وال استریت به دقت پیامدهای بلندمدت ظهور DeepSeek به عنوان یک رقیب قدرتمند در فضای هوش مصنوعی را بررسی میکنند. هزینههای پایینتر و کاهش نیازهای انرژی مدلهای DeepSeek سؤالاتی را در مورد پایداری نرخ بالای سرمایهگذاری در فناوری هوش مصنوعی توسط شرکتهای ایالات متحده ایجاد میکند که نشاندهنده هزینه اضافی بالقوه در این بخش است.
این وضعیت به واکنشهای متفاوتی منجر شده است، به طوری که برخی از تحلیلگران پیشنهاد میکنند که واکنش بازار با توجه به ادامه تقاضای بالا برای فناوری هوش مصنوعی که همچنان به زیرساختهای قابل توجهی نیاز دارد، ممکن است یک واکنش بیش از حد باشد.
علاوه بر این، ملاحظات ژئوپلیتیکی نیز مطرح است، زیرا ابهامات در مورد واکنشهای دولت ایالات متحده، به ویژه در مورد تعرفههای وارداتی چینی و اقدامات نظارتی که میتواند بر پذیرش و ادغام فناوریهایی مانند DeepSeek در بازارهای ایالات متحده تأثیر بگذارد، وجود دارد.
آیا باید نگران حریم خصوصی باشیم؟
«دیپسیک» با وجود پیشرفتهای فناورانه خود، از نظر مسائل بالقوه حفظ حریم خصوصی که یادآور نگرانیهایی است که قبلاً با سایر پلتفرمهای چینی مانند TikTok مرتبط بود، تحت نظارت است. این نگرانی عمدتاً از جمعآوری دادههای شخصی گسترده «دیپسیک» از جمله درخواست ثبت تاریخ تولد، ورودیهای متنی و صوتی، فایلهای آپلود شده و تاریخچه چت که در سرورهای چین ذخیره میشوند، ناشی میشود.
این عمل با توجه به قوانین سختگیرانه اطلاعات ملی در چین که همه نهادها را مجبور به همکاری با تلاشهای اطلاعاتی ملی میکند، نگرانیهای قابل توجهی را در مورد امنیت و حریم خصوصی دادههای کاربران ایجاد میکند.
علاوه بر این، مدلهای هوش مصنوعی برجسته مانند ChatGPT و جمینای گوگل نسبت به دیپسیک توصیه به احتیاط کردهاند.
این نگرانیها شامل پتانسیل بدافزارهای مخفی یا مکانیسمهای نظارتی است که در این نرمافزار قابل تعبیه است و میتواند امنیت کاربران را به خطر بیندازد.
اقدامات امنیتی دیپسیک پس از یک نقص امنیتی گزارش شده در ماه دسامبر که آسیبپذیریهایی را برای امکان سرقت احتمالی حسابها فراهم میکرد، مورد تردید قرار گرفت، اگرچه این مشکل متعاقباً اصلاح شد.
این وضعیت زمانی تشدید شد که شرکت «دیپسیک» در میان افزایش دانلودها فاش کرد که دستیار هوش مصنوعی آن هدف یک «حمله مخرب در مقیاس بزرگ» قرار گرفته است که نشاندهنده چالشهای امنیتی برای آن است. این حادثه بر خطرات مرتبط با استفاده از دیپسیک، بهویژه در مورد حفاظت از دادههای شخصی پردازش شده توسط هوش مصنوعی تاکید میکند.
کاربران و ذینفعان در فناوری هوش مصنوعی باید این خطرات حریم خصوصی و امنیتی را هنگام ادغام یا استفاده از ابزارهای هوش مصنوعی مانند DeepSeek در نظر بگیرند. نگرانیها فقط در مورد حریم خصوصی دادهها نیست، بلکه پیامدهای گستردهتری در مورد استفاده از دادههای جمعآوریشده برای اهدافی فراتر از کنترل یا آگاهی کاربر، از جمله آموزش مدلهای هوش مصنوعی یا سایر فعالیتهای فاش نشده است.
همانطور که فناوری هوش مصنوعی در حال تکامل است، اطمینان از شفافیت و اقدامات امنیتی قوی در حفظ اعتماد کاربران و محافظت از اطلاعات شخصی در برابر سوء استفاده بسیار مهم خواهد بود.
برخی از واکنشهای برجسته به دیپسیک
انویدیا کمکهای دیپسیک را به عنوان یک پیشرفت قابل توجه در هوش مصنوعی به رسمیت شناخته است، چرا که امکان ایجاد مدلهای جدیدی را فراهم میکند.
انویدیا ضمن تمجید از دیپسیک اشاره کرد که توسعه هوش مصنوعی به شدت به پردازندههای گرافیکی انویدیا و شبکههای پیشرفته متکی است که بر نیاز مداوم به سختافزار قابل توجه برای پشتیبانی از عملکردهای هوش مصنوعی تأکید میکند.
سم آلتمن(Sam Altman)، مدیرعامل اوپنایآی در مورد اثربخشی مدل DeepSeek R1 اظهار نظر کرد و به عملکرد چشمگیر آن نسبت به هزینه آن اشاره کرد.
آلتمن بر تعهد اوپنایآی به پیشبرد تحقیقات و افزایش ظرفیت محاسباتی برای دستیابی به اهدافش تأکید کرد و نشان داد که اگرچه DeepSeek یک توسعه قابل توجه است، اما اوپنایآی همچنان بر اهداف استراتژیک خود متمرکز است.
آراویند سرینیواس(Aravind Srinivas)، مدیرعامل پرپلکسیتی(Perplexity)، اشتیاق خود را برای موفقیت DeepSeek، بهویژه پیشی گرفتن از مدلهای دیگر مانند ChatGPT در معیارهای خاص ابراز کرد. حمایت وی نشاندهنده علاقه گستردهتر به ادغام نوآوریهای DeepSeek در پلتفرمها و خدمات موجود است.
پت گلسینگر(Pat Gelsinger)، مدیرعامل برکنار شده اینتل نیز DeepSeek را به خاطر یادآوری برخی درسهای ضروری به جامعه فناوری، مانند اینکه هزینههای کمتر باعث پذیرش گستردهتر میشود، محدودیتها میتوانند خلاقیت را تقویت کنند و رویکردهای منبعباز اغلب غالب هستند، تحسین کرد.
نظرات گلسینگر بر پیامدهای گستردهتر استراتژیهای DeepSeek و پتانسیل آنها برای تغییر شکل شیوهها در این صنعت تأکید میکند.
رسانههای دولتی و محافل سیاسی در چین نیز علاقه قابل توجهی به تأثیر DeepSeek نشان دادهاند و موفقیت آن را به عنوان یک متعادل کننده در برابر تسلط ایالات متحده در فناوری و گامی به سوی خودکفایی استراتژیک چین در هوش مصنوعی میدانند.
همانطور که رویترز گزارش داد، بنیانگذار دیپسیک در یک سمپوزیوم سطح بالا با لی کیانگ، نخست وزیر چین شرکت کرد که نشان دهنده اهمیت DeepSeek برای اهداف استراتژیک ملی چین است.
دونالد ترامپ، ظهور DeepSeek را هم یک چالش و هم یک فرصت برای صنعت فناوری ایالات متحده توصیف کرده است. او آن را زنگ خطری برای شرکتهای آمریکایی برای نوآوری و رقابت مؤثرتر در فناوری جهانی میداند که ابعاد ژئوپلیتیکی و اقتصادی ظهور DeepSeek را برجسته میکند.
دیپسیک که تازه سال گذشته تأسیس شده، محبوبیت ChatGPT را پشت سر گذاشته و ثابت کرده که هوش مصنوعی پیشرفته نیازی به هزینه میلیارد دلاری ندارد. با این حال، محبوبیت چشمگیر و شتابناک آن میتواند موج جدیدی باشد.
مطمئناً دیپسیک پویایی بازار را تغییر داده و بحثهای اخلاقی مختلفی را مطرح کرده است، اما برخی از سؤالات بزرگ هنوز باقی میمانند. مثلا آیا دیپسیک کتاب تاریخ هوش مصنوعی را بازنویسی میکند؟ چه موانع غیرمنتظرهای میتواند از شتاب توسعه آن بکاهد و محبوبیت آن را کاهش دهد یا شاید حتی منجر به نابودی آن شود؟
به هر حال، مسیر پیش رو برای این هوش مصنوعی انقلابی و بلندپرواز، پر از احتمالات و مشکلات است و تنها زمان نشان خواهد داد که این فناوری جسورانه چگونه عمل خواهد کرد.