Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonxeber.az

Telegramda izləyin

Dünyada Baxılıb: 881 Tarix: 28 dekabr 2024

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş

Oxşar xəbərlər

Zelenski ABŞ-nin Rusiya-Ukrayna münaqişəsinə son qoymaq üçün təklif etdiyi vaxtı açıqladı

"ABŞ Kiyevə bu ilin yayınadək Rusiya ilə münaqişəni bitirməyi təklif edib". -ın TSN-ə istinadən verdiyi xəbərə görə, bu barədə Ukrayna Prezidenti Volodimir Zelenski bildirib. V.Zelenski ABŞ-nin münaqişə tərəflərinə məsələni həmin müddətə qədər həll etmək üçün təzyiq göstərəcəyini istisna etməyib

7 fevral

Pekin Trampı Çinə səfərini ləğv etməklə hədələdi

Çin Vaşinqtonun Tayvana yeni silah partiyasının satışını davam etdirəcəyi təqdirdə ABŞ Prezidenti Donald Trampın aprel ayında Pekinə planlaşdırılan səfərini ləğv edə bilər. -ın xəbərinə görə, bu barədə "Financial Times" nəşri mənbələrə istinadən məlumat verib. Mənbələrin məlumatına görə, bəz

7 fevral

Britaniyada maraqlı vakansiya: Quşları saymaq

Böyük Britaniyada vəhşi təbiət həvəskarları üçün maraqlı bir vakant yer açılıb - Uelsdəki gözəl Skomer adasında quşları saymaq. Quşlar nəsli kəsilməkdədir, ona görə də sayı azdır və hər il hamısı əl ilə hesablanır. Qaynarifno xəbər verir ki, elanı "Wildlife Trust of South and West Wales" təşkilat

6 fevral

Pentaqon Harvard Universiteti ilə əlaqələrini kəsdi

Pentaqon Harvard Universiteti ilə əlaqələrini kəsir, hərbi təlim proqramlarını, təqaüd dəstəyini, sertifikatlaşdırma və təcrübə proqramlarını dayandırır. -ın Pentaqonun mətbuat xidmətinə istinadən xəbərinə görə, bu barədə ölkənin Müdafiə Nazirliyinin rəhbəri Pit Heqset məlumat verib. "Uzun müddə

7 fevral

Orban Aİ və NATO-nun Rusiya ilə birbaşa münaqişəyə yaxınlaşdığını bəyan edib

Avropa İttifaqı və NATO hər həftə onları Rusiya ilə birbaşa hərbi münaqişəyə yaxınlaşdıran təhlükəli addımlar atır. "Report" xəbər verir ki, bunu Macarıstan Baş naziri Viktor Orban ölkənin qərbindəki Şombatxey şəhərində hakim Macar Vətəndaş İttifaqı Partiyasının fəalları ilə görüşdə deyib

8 fevral

Türkiyədə 15 kənd karantinə alındı

Türkiyədə heyvandarlıq sektoruna ciddi zərbə vuran dabaq xəstəliyinin yeni halları qeydə alınıb. xəbər verir ki, xəstəliyin yayılma riskinin artması səbəbindən Aydın vilayətinin Sultanhisar rayonu və ətraf ərazilərdə genişmiqyaslı karantin tədbirləri tətbiq olunub. Yerli qurumların məlumatına görə, Sultanhisa

7 fevral

Bu ölkədə güclü partlayış oldu : ÖLƏNLƏR VAR

Çinin şimalındakı Şantsi əyalətində "Tsyapen" biotexnologiya şirkətinin sexində partlayış baş verib. xəbər verir ki, bu barədə "Xinhua" agentliyi məlumat yayıb. Əyalət hakimiyyət orqanlarının məlumatına görə, xilasedicilər qapalı vəziyyətdə çarəsiz qalmış beş işçini aşkar ediblə

7 fevral

Bu ölkənin də öz "Epşteyn"i varmış - Daha bir uşaq istismarı qalmaqalı

Avstraliyanın Kvinslend ştatında genişmiqyaslı uşaq istismarı qalmaqalı üzə çıxıb. "Qafqazinfo" xəbər verir ki, yerli polis Meriboro şəhərində yaşayan 27 yaşlı İtan Börnz-Dedərerin uşaq istismarı ilə bağlı ümumilikdə 596 ittihamla üz-üzə olduğunu açıqlayıb. Qeyd edilib ki, hadisə ABŞ-də milyarde

6 fevral

Ermənistanda hərbi hissədə əsgərin meyiti tapıldı

Ermənistanda hərbi hissələrin birində hərbçinin meyiti tapılıb. -ın erməni KİV-ə istinadən verdiyi məlumata görə, bu barədə Ermənistan Müdafiə Nazirliyinin mətbuat xidməti məlumat yayıb. "Fevralın 7-də Ermənistan Müdafiə Nazirliyinin N saylı hərbi hissəsində müqavilə ilə xidmət edən əsgər Davi

8 fevral