Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 910   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

18 yaşlı tennisçinin geyimi sosial şəbəkələrdə ajiotaj yaratdı - FOTO

"US Open"in qalibi olan britaniyalı tennisçi Emma Radukanunun Açıq Çempionatda geyindiyi idman komplekti böyük ajiotaja səbəb olub. "Böyük Dəbilqə" turinirinin 18 yaşlı çempionu, "Nike" firmasının dar topunda və yubka-şortda korta çıxıb. Məlumata görə, elə həmin günü şirkəti

15 sentyabr 2021
.

Mənzili alovlara bürünən şəxs yanğınsöndürənləri karnizdə gözlədi – VİDEO

Mənzilində çıxan yanğından xilas olmağa çalışan kişi yanğınsöndürənləri binanın divarında quraşdırılmış karnizdə gözləyib. Yanğın Rusiyanın Anapa şəhərində baş verib. Bununla bağlı kadrlar sosial şəbəkələrdə paylaşıb. Son məlumatlara görə yanğın söndürülüb, zərərçəkən yoxdur

17 sentyabr 2021
.

Dünyanın ən nüfuzlu insanları açıqlandı

ABŞ-ın "Time" jurnalı 2021-ci ildə dünyanın ən nüfuzlu insanlarının siyahısını açıqlayıb. 100 nəfərdən ibarət siyahı "Liderlər", "İxtiraçılar", "İncəsənət xadimləri", "Yenilikçilər" kimi bir neçə bölməyə ayrılıb. Siyasətçilər arasında reytinqə ABŞ-ı

16 sentyabr 2021
.

DƏHŞƏTLİ QƏTL: Ailəsi ilə görüşə getdi, sevgilisini və özünü güllələdi - FOTO

Moldovada eyni vaxtda qətl və intihar hadisəsi baş verib. bu barədə Publika-ya istinadən xəbər verir. Bildirilib ki, qətl sentyabrın 12-də Hinceşti rayonunun Fundul Galbenei kəndində baş verib. Qeyd olunur ki, sevdiyi qızın qohumları ilə görüşə gələn gələcək kürəkən arasında mübahisə baş verib. 28 yaşl

16 sentyabr 2021
.

Qapını açdıqda ərini deyil, naməlum kişini gördü - Ona elə vəhşilik yaşatdı ki... - VİDEO

Bursada gecə saatlarında baş verən hadisə hər kəsin qəzəb və qorxusuna səbəb olub. -a istinadən xəbər verir ki, evdə ərini gözləyən Necibiye B. qapını açdıqda ərini deyil, oğrunu görüb. O da ona olmazın zülm verib. Başını divara vurub, sonra da bıçaqlayıb. Oğru hadisə yerindən qaçarkən qadın qışqırara

17 sentyabr 2021
.

Cərrahın eynəyi oğurlandı - Xəstələr əməliyyatsız qaldı

İngiltərənin Birminqem şəhərində ürək cərrahı Stiven Runi ürək əməliyyatı zamanı taxdığı fərdi durbin eynəkləri oğurlandığından onlarla xəstə əməliyyat oluna bilməyib. xəbər verir ki, bu barədə The Birmingham Mail məlumat yayıb. Oğurluq 11 sentyabr günü həkimin xəstəxananın kənarında dayanmış avtomobilində

15 sentyabr 2021
.

Qəbirdən çıxanı gördü, videonu titrəyərək çəkdi - VİDEO

ABŞ sakini tərəfindən çəkilən qorxunc kadrlar hər kəsi heyrətə salıb. -a istinadən xəbər verir ki, qəbiristanlıqdan çıxan saçları çəkən Coel Morrison saçların niyə çıxdığına təəccüblənib və səlahiyyətlilərdən məsələyə baxılmasını istəyib. Qəbirstanlıqda yaxınını ziyarət edən Morrison qəbirdən çıxan saçların

17 sentyabr 2021
.

"Ata tərəfim Azərbaycandandır" - Acun Ilıcalı

"TV 8"in rəhbəri, aparıcı Acun Ilıcalı "Müge ve Gülşen’le 2.Sayfa" proqramının qonağı olub. Axşam.az-a istinadən xəbər verir ki, aparıcılar Acuna gənc qalmasının sirrini soruşublar. O, isə söhbət zamanı ata tərəfinin Azərbaycan köklü olduğunu deyib. Acun bildirib ki, gənc qalmasını

16 sentyabr 2021
.

Məktəb avtobusunda inanılmaz hadisə - Sürücünün narkotika testi pozitiv çıxdı - VİDEO

Antalyada polis məktəb avtobusu sürücüləri üçün narkotik və spirt testləri keçirən zaman inanılmaz olayla rastlaşıb. -a istinadən xəbər verir ki, sürücülərdən birinin narkotik testi pozitiv çıxıb. Alınan nümunədə narkotik maddəsi "amfetamin" olduğu təsbit edilən sürücü ilə əlaqədar araşdırm

15 sentyabr 2021