შემდეგი თაობის AI სისტემა გვპირდება უპრეცედენტო მასშტაბურობას

AI21-ის მსგავსი ერთი ფანჯრის ბიზნეს გადაწყვეტის გამომუშავებით, ხოლო პროდუქტიულობის თვალსაზრისით ყველა ცნობილ მსოფლიო მოდელს აჯობა, Jambo ხდება პირველი მოდელი, რომელიც ხელმისაწვდომია წარმოების კლასის Mamba-ზე დაფუძნებული მეთოდით. Mamba SSM ტექნოლოგიის ინტეგრირებით და ძველი ტრანსფორმატორის არქიტექტურის ელემენტებით, ჯამბა დგას ახალ ხედვაზე უფრო დიდი ენის მოდელის (LLM) დიზაინში.

რევოლუციური LLM-ები

ჯამბას გარეგნობა მიუთითებს ეპოქის ცვლილებაზე LLM-ების შემთხვევაში, რომლებიც ეფექტურად უმკლავდებიან ჩვეულებრივი SSM და ტრანსფორმერების ტიპის არქიტექტურის შეზღუდვებს. 256K-მდე კონტექსტური ფანჯრის ზომით, Jamba, როგორც ჩანს, აქვს დიდი უპირატესობა სხვა მოდელებთან შედარებით მსგავსი რეგიონების სხვადასხვა კრიტერიუმებზე, რითაც ადგენს ახალ ზოლს საუკეთესო ეფექტურობისა და შესრულების საზომად.

ჯამბას არქიტექტურას მრავალი ასპექტი აქვს, რაც მას აყალიბებს ტრანსფორმატორების, მამბასების ჰიბრიდულ სისტემას და ექსპერტთა ნარევს (MoE), რომლებიც ერთად მოქმედებენ სინერგიულად. ეს ინტეგრაცია ახორციელებს მეხსიერების გამოყენების ოპტიმიზაციას გამტარუნარიანობასთან ერთად, რაც წარმოადგენს ფართომასშტაბიანი ენობრივი ამოცანის მთავარ აქცენტს და უბიძგებს შესრულების ლიმიტს.

მასშტაბირებადი არის ჯამბას დნმ, რაც იმას ნიშნავს, რომ მას შეუძლია 140 ათასზე მეტი კონტექსტის მართვა მხოლოდ ერთი GPU-ს გამოყენებით. ამ მასშტაბურობას შეუძლია ოპერაციებისა და ჩართულობის შენარჩუნება, ხელი შეუწყოს სწავლასა და კვლევას, ახალი ცოდნის გენერირებას და ინოვაციების ხელშეწყობას AI საზოგადოებაში.

მიღწევები

ჯამბას გავრცელება აღნიშნავს არა მხოლოდ თამაშის შემცვლელ ფენომენს, არამედ პიონერულ წინსვლას LLM კვლევის სფეროში. პირველ რიგში, ის წარმატებით აერთიანებს მამბას და ტრანსფორმერის არქიტექტურას ისე, რომ ორივე ერთად იმუშავებს სიმბიოტების მსგავსად, რომელთა კომბინაცია უფრო ძლიერი აღმოჩნდება, ვიდრე ცალკეული ნახევრები. გარდა ამისა, ტექსტში წარმოდგენილია ჰიბრიდული SSM-Transformer ვერსია, რომელიც აერთიანებს სხვა არსებული SSM-ტრანსფორმატორების სიმძლავრეს და სიჩქარეს ახალ კონტექსტში უკეთ მუშაობის უნართან.

თუმცა, დაგანმა, AI21-ის პროდუქტის ვიცე-პრეზიდენტმა, წარმოუდგენლად გამოხატა და ჯამბას შერეული არქიტექტურის სტრუქტურა წინა პლანზე შეინარჩუნა. მან განმარტა, თუ როგორ ჯამბას სისწრაფე იძლევა გამოყენების შემთხვევების სწრაფი მიწოდების საშუალებას უზარმაზარი მოცულობით და მხარს უჭერს რეალურ დროში სისწრაფეს, თუნდაც აჩქარებს კრიტიკული გამოყენების შემთხვევების დაწყებას.

ღია კოდის თანამშრომლობა

Jamba-ს ღია წონის გამოშვება Apache 2.0 ლიცენზიით გულისხმობს, რომ AI21-ს შეუძლია ამ ტიპის კომისიის განხორციელება ღია კოდის საზოგადოებაში. AI21 მოწოდებულია უზრუნველყოს გარემო, სადაც ახალი მიღწევების ხელშეწყობა შესაძლებელია შემდგომი წვლილისა და იდეების წახალისებით.

NVIDIA GPU მილსადენის, როგორც NIM დასკვნის მიკროსერვისის შერწყმა, ამარტივებს Jamba-ს ხელმისაწვდომობის გასაძლიერებლად საწარმოს აპლიკაციებს. ჰუმანიზაცია: ხახუნის გარეშე ინტეგრაცია იძლევა სწრაფ და უპრობლემოდ განთავსებას Jampa-ს აპლიკაციების განახლებისას პრაქტიკულად ყველა ყოველდღიურ სცენარში.

Jamba-ს AI21-ის გამოშვებამ მნიშვნელოვანი ეტაპია კორპორატიული AI სფეროში. ჯამბა მზად არის გარდაქმნას ენობრივი მოდელების ინდუსტრია ინოვაციური ჰიბრიდული არქიტექტურის, შეუსაბამო მასშტაბურობისა და მოდელის უნიკალური ინტეგრაციის მახასიათებლების შეთავაზებით. ამრიგად, ის აწვდის მომხმარებლებს, რათა შეასრულონ თავიანთი რთული ენობრივი ამოცანები მარტივად და სწრაფად, ვიდრე ადრე შესაძლებელი იყო.

AI21-მა ასევე აჩვენა თავისი მხარდაჭერა ღია კოდის თანამშრომლობისა და ბიზნეს პარტნიორობის მიმართ წამყვან AI კომპანიებთან, როგორიცაა NVIDIA, რაც კიდევ უფრო ადასტურებს მის ერთგულებას ტექნოლოგიური წინსვლის ტემპის მართვისა და მაღალეფექტური AI გადაწყვეტილებების მიღების გაზრდისკენ სხვადასხვა სფეროში.

ჯამბა, თუმცა, დარწმუნდება თავის ადგილს AI ფართო ლანდშაფტში, რადგან ის ეხება ენის დამუშავებას; ამდენად, გავლენა შეიგრძნობს ენების დამუშავების ტრადიციული პლატფორმების ფარგლებს სცილდება, რათა შეიქმნას ხელოვნური ინტელექტის მქონე ბიზნეს გადაწყვეტილებების ახალი წესრიგი.

წყარო: https://www.cryptopolitan.com/next-generation-ai-system-promises/