Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 337   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 051 7028255

Facebookda Paylaş


Oxşar xəbərlər

.

23 yaşlı qızdan DƏHŞƏTLİ ƏMƏL: Sevgilisindən hamilə qaldı - Ailəsindən gizlətdi: Uşağı dünyaya gətirəndə...

Yaponiyada ailəsindən gizli şəkildə hamilə qalan qadın uşağı Tokio hava limanında dünyaya gətirib. xəbər verir ki, uşağı tualetdə dünyaya gətirən qadın ardınca körpəni kağızla öldürüb. Bildirilir ki, Kobe şəhərindən Tokioya səfərə edən 23 yaşlı qadının hava limanında doğum vaxtı çatıb. O, tualetdə uşağ

17 sentyabr 2021
.

Paşinyan Batumidə "yoxa çıxdı"

Bir neçə gün əvvəl Ermənistanın baş naziri Nikol Paşinyan Gürcüstana rəsmi səfər edib. Onun səfəri Batumi şəhərində başa çatıb. Rəsmi məlumata görə, onunla Gürcüstanın baş naziri arasında qeyri-rəsmi görüş olub. Batumiyə səfər Ermənistan cəmiyyətinin əhəmiyyətli bir hissəsi və xüsusən də bəzi Rusiy

18 sentyabr 2021
.

"Vyetnamlı Tarzan" müharibədən qaçıb cəngəllikdə gizləndi: Görün başına nə gəldi - FOTO

40 il cəngəllikdə yaşayan 52 yaşındakı Xo Van Lanq, adamların arasına qayıtdıqdan 8 il sonra qaraciyər xərçəngindən ölüb. -a istinadla bildirir ki, 1972-ci ildə ABŞ təyyarələri həmin vaxt Xo Van Lanqın yaşadığı kəndi bombalayıblar. Kənddə yalnız o və atası Xo Van Txan sağ qalıblar. Düşməndən qorunma

15 sentyabr 2021
.

Şahzadə Harri ilə Meqan Marklın bu fotosu gülüş obyektinə çevrildi

Xəbər verdiyimiz kimi, ABŞ-ın "Time" jurnalı 2021-ci ilin ən nüfuzlu 100 şəxsinin siyahısını açıqlayıb. Həmin siyahıya daxil olan şahzadə Harri və Meqan Markl jurnalın bu mövzuya aid yeddi üz qabığından birində yer alıblar. "Qafqazinfo"ya istinadən xəbər verir ki, cütlüyün sözügedə

17 sentyabr 2021
.

Dünyanın ən nüfuzlu insanları açıqlandı

ABŞ-ın "Time" jurnalı 2021-ci ildə dünyanın ən nüfuzlu insanlarının siyahısını açıqlayıb. 100 nəfərdən ibarət siyahı "Liderlər", "İxtiraçılar", "İncəsənət xadimləri", "Yenilikçilər" kimi bir neçə bölməyə ayrılıb. Siyasətçilər arasında reytinqə ABŞ-ı

16 sentyabr 2021
.

Oğrular bu dəfə onları çəkən təhlükəsizlik kamerasını oğurladılar - VİDEO

Türkiyənin Bursa şəhərində dəfələrlə oğurluq olan anbara daxil olan şəxslərin kimliyini müəyyənləşdirmək üçün sahibi orada təhlükəsizlik kameraları quraşdırıb. Növbəti dəfə oğurluq etmək məqsədilə oraya daxil olan şəxslər əvvəl nəzərdə tutduqları malları, daha sonra isə onları qeydə alan təhlükəsizli

18 sentyabr 2021
.

Daha bir ölkədə iş yerində COVID-19 pasportu vacib oldu

İtaliyada oktyabrın 15-dən etibarən bütün sakinlər yalnız COVID-19 pasportunun olduğu halda işləyə biləcəklər. Belə bir sənədi ya COVID-19 əleyhinə peyvənd vurdurmaqla, ya yaxın günlərdə koronavirusdan sağalmanı təsdiqləyən sənədlə, ya da testin mənfi cavabı ilə əldə etmək mümkündür. Beləliklə, oktyabrı

17 sentyabr 2021
.

Məktəb avtobusunda inanılmaz hadisə - Sürücünün narkotika testi pozitiv çıxdı - VİDEO

Antalyada polis məktəb avtobusu sürücüləri üçün narkotik və spirt testləri keçirən zaman inanılmaz olayla rastlaşıb. -a istinadən xəbər verir ki, sürücülərdən birinin narkotik testi pozitiv çıxıb. Alınan nümunədə narkotik maddəsi "amfetamin" olduğu təsbit edilən sürücü ilə əlaqədar araşdırm

15 sentyabr 2021
.

Lukaşenko Düşənbəyə iti ilə səfər etdi

Belarusun lideri Aleksandr Lukaşenko sentyabrın 15-də Düşənbəyə işgüzar səfərə gedib. -a istinadla xəbər verir ki, Lukaşenko burada Tacikistan prezidenti Emomali Rahman, İrandan olan həmkarı İbrahim Rəisi ilə görüşüb. Məlumata görə, Lukaşenkonun Tacikistana səfərinin formal hissəsindən sonra Belaru

17 sentyabr 2021