შევხედოთ ახალ Al Generative Art-ს

Al Generative Art არის ხელოვნების სახეობა, უმეტეს შემთხვევაში ვიზუალური, რომელიც დაფუძნებულია ადამიანისა და ავტონომიური სისტემის თანამშრომლობაზე. „ავტონომიური სისტემა“ განისაზღვრება, როგორც ა ხელოვნური ინტელექტი პროგრამა, ალგორითმი ან მოდელი, რომელსაც შეუძლია შეასრულოს რთული ოპერაციები პროგრამისტის ჩარევის გარეშე.

მიერ შექმნილი სურათების უცნაური შეერთებებიდან Dall-E Mini რომ NFT ბაზარზე, ხელოვნური ინტელექტის ალგორითმებით წარმოქმნილი სურათები სულ უფრო და უფრო შემოდის მთავარ წარმოსახვაში. ფაქტობრივად, ორი მნიშვნელოვანი პროექტი ამ თემაზე, რომელიც იმსახურებს ანალიზს, არის: შუა მოგზაურობა მდე DALL-E2.

რა თქმა უნდა, ახალი ამბები ტვიტერზეც გავიდა. მას სხვათა შორის კომენტარს აკეთებს ჩარლზ ჰოსკინსონი, რომელიც წერდა:

ხელოვნური ინტელექტის გენერირებული ხელოვნება. მე შევძელი ამ სურათის გადაღება სულ რამდენიმე წუთში. ვერ წარმომიდგენია, 3 წელიწადში რამდენად გამორჩეული იქნება ეს ტექნოლოგია pic.twitter.com/jOToCZj7ki
- ჩარლზ ჰოსკინსონი (@IOHK_Charles) თებერვალი 1, 2023

Al Generative Art: ადრეული ექსპერიმენტები და მახასიათებლები

იმის გაგებით, თუ რა არის გენერაციული ხელოვნება, მნიშვნელოვანია ხაზი გავუსვა მის ერთ-ერთ დამფუძნებელ პრინციპს: შემთხვევითობა. რაც გენერაციული ხელოვნების ფუნდამენტური თვისებაა.

სინამდვილეში, პროგრამული უზრუნველყოფის ტიპებიდან გამომდინარე, ავტონომიურ სისტემას შეუძლია დაამუშაოს შედეგები, რომლებიც ყოველთვის განსხვავებული და უნიკალურია გენერირების ბრძანების შესრულებისას, ან მას შეუძლია დააბრუნოს შედეგების ცვლადი რაოდენობა მომხმარებლის შეყვანის საპასუხოდ.

პირველი ექსპერიმენტები გენერაციულ ხელოვნებაში თარიღდება 1960-იანი წლებით ექსპერიმენტებით ჰაროლდ კოენი და მისი აარონი პროგრამა. კოენმა პირველად გამოიყენა დამოუკიდებელი პროგრამული უზრუნველყოფა პოპ არტის აბრეშუმის ეკრანებით შთაგონებული აბსტრაქტული ნამუშევრების შესაქმნელად. კოენის ნამუშევრები ახლა ლონდონის Tate Gallery-შია გამოფენილი.

გენერაციული ხელოვნების კიდევ ერთი ატრიბუტი, რომელიც სულ უფრო ნაკლებად პრეროგატივაა, არის პროგრამისტის მიერ მოწოდებული შაბლონების ან აბსტრაქტული ელემენტების გამეორება და დანერგილი პროგრამული კოდის ფარგლებში.

გარდა ამისა, მზარდი რთული ნერვული ქსელების განვითარებამ, რომლებიც მუშაობენ ტექსტ-გამოსახულების ასოციაციაზე, საშუალება მისცა გენერაციული მოდელების შემუშავება, რომელთაც შეუძლიათ შექმნან უფრო რეალისტური და ზუსტი სურათები. გენერაციული ხელოვნების ამ კატეგორიის ყველაზე ცნობილი მაგალითია დალ-ე.

Dall-E არის მულტიმოდალური ნერვული ქსელი, რომელიც დაფუძნებულია GPT-3 ღრმა სწავლის მოდელი OpenAIიგივე კომპანია, რომელიც ასევე ცოტა ხნის წინ განვითარდა ჩატი GPT, ჩატბოტი ამოქმედდა 2022 წლის ნოემბერში და ოპტიმიზირებულია "ზედამხედველობის ქვეშ" და გაძლიერებული სწავლის ტექნიკა.

თუ დავბრუნდებით Dall-E-ზე, ჩვენ ვხედავთ, რომ ამ სისტემას შეუძლია შექმნას სურათები ტექსტური აღწერილობიდან, რომელსაც ე.წ. "სწრაფი," ტექსტი-სურათის წყვილების მონაცემთა ნაკრების საფუძველზე.

Dall-E-ის პირველი ვერსია, რომელიც საზოგადოებას წარუდგინეს 2021 წლის იანვარში და დარჩა დარგის მცირე რაოდენობის პროფესიონალების პრეროგატივად, წარმოადგენდა ნამდვილ რევოლუციას ამ ტიპის გენერაციული მოდელის თვალსაზრისით, რომელიც აჭარბებდა GPT-ის ინოვაციებს. 3 თავად.

ასევე მნიშვნელოვანია ის ფაქტი, რომ Dall-E-ს მიერ დამუშავებული შედეგების სიზუსტე აღმოჩნდა შესანიშნავი სფერო სხვა OpenAI გადაწყვეტისთვის: CLIP (კონტრასტული ენა-გამოსახულების წინასწარი ტრენინგი).

გამოსახულების კლასიფიკაცია და რანჟირების ნერვული ქსელი, რომელიც მომზადებულია ტექსტურ-სურათის ასოციაციების საფუძველზე, როგორიცაა ინტერნეტში ნაპოვნი წარწერები. CLIP-ის ჩარევის წყალობით, რომელიც ამცირებს მომხმარებლისთვის შემოთავაზებული შედეგების რაოდენობას თითო მოთხოვნაზე 32-მდე, Dall-E-ს უმრავლეს შემთხვევაში დამაკმაყოფილებელ სურათებს უბრუნებს.

Midjourney: დიზაინი, ადამიანის ინფრასტრუქტურა და ხელოვნური ინტელექტი

როგორც მოსალოდნელი იყო, შუა მოგზაურობა მნიშვნელოვანი პროექტია, რომელიც განვითარებული Al Generative Art კონცეფციის ნაწილია. კერძოდ, Midjourney არის დამოუკიდებელი კვლევითი ლაბორატორია, რომელიც იკვლევს აზროვნების ახალ საშუალებებს და აფართოებს ადამიანის სახეობის წარმოსახვით ძალებს.

მისი გამოყენება მარტივია: ჯერ უნდა შეიქმნას ანგარიში უთანხმოება, პლატფორმა, რომელიც მასპინძლობს სხვადასხვა თემებს, სადაც Midjourney ერთ-ერთი მათგანია. აპლიკაციის ფარგლებში არის სხვადასხვა ჩატრუმები, რომლებშიც შეიძლება აქტიური მონაწილეობა იყოს თუ არა დისკუსიებში.

მნიშვნელოვანია აღინიშნოს, რომ პირველად რომ სცადოთ ხელოვნური ინტელექტის გამოყენება, უნდა გადახვიდეთ "ახალბედები" არხები, სადაც 25 უფასო რენდერი არის შესაძლებელი.

ერთი რენდერი შეესაბამება ოთხი განსხვავებული ვარიანტის წარმოქმნას, რომლებიც გენერირებულია ერთი და იგივე ტექსტური შეყვანისგან.

ამრიგად, 25 რენდერი ეხება Midjourney ბოტის მიერ შესრულებულ 25 დამუშავების სამუშაოს. შესაბამისად, გამოსახულების გენერირება მოითხოვს Midjourney ბოტთან ინტერაქციას ტექსტური შეტყობინების საშუალებით, სახელწოდებით „მოწოდება“, რომელშიც იქნება საკვანძო სიტყვები, რომლებიც აღწერს იმ სურათს, რომელიც მომხმარებელს აქვს მხედველობაში.

შეგიძლიათ დაამატოთ იმდენი დეტალი, რამდენიც გსურთ, მთავარია საკვანძო სიტყვები მძიმით გაიყოთ. რენდერის დასრულების შემდეგ, კომპიუტერი აბრუნებს ოთხ განსხვავებულ სურათს არჩევის აღწერილობების საფუძველზე.

გარდა ამისა, როგორც კი პროგრამა დაასრულებს რენდერირებას, შეგიძლიათ თქვენი პრეფერენციების კომუნიკაცია სურათების საფუძველზე და, სურვილის შემთხვევაში, კიდევ ოთხი ვერსიის გენერირება ხელახლა.

DALL-E 2: ახალი ხელოვნური ინტელექტის სისტემა ნამუშევრებისთვის

Midjourney-ის გარდა, DALL-E 2 ასევე არის ახალი AI სისტემა, რომელსაც შეუძლია შექმნას რეალისტური სურათები და ნამუშევრები ბუნებრივი ენის აღწერილობიდან. არა მხოლოდ ეს, DALL-E 2-ს შეუძლია ცნებების, ატრიბუტებისა და სტილის გაერთიანება.

ახალი ხელოვნური ინტელექტის სისტემის სიძლიერე ასევე მდგომარეობს იმაში, რომ შეუძლია გააფართოვოს სურათები ორიგინალურ ტილოში არსებულზე მიღმა, შექმნას ახალი ექსპანსიური კომპოზიციები. გარდა ამისა, მას შეუძლია რეალისტური ცვლილებები შეიტანოს არსებულ სურათებში ბუნებრივი ენის წარწერიდან და შეუძლია ელემენტების დამატება და წაშლა ჩრდილების, ასახვისა და ტექსტურების გათვალისწინებით.

DALL-E 2-ის შესაძლებლობებში ასევე შედის სურათის გადაღება და მისი რამდენიმე ვარიაციის შექმნა ორიგინალური შთაგონებით. DALL-E 2-მა შეიტყო კავშირი სურათებსა და მათ აღწერისთვის გამოყენებულ ტექსტს შორის.

ის იყენებს პროცესს ე.წ "დიფუზია", რომელიც იწყება შემთხვევითი წერტილების ნიმუშით და თანდათან ცვლის ამ შაბლონს გამოსახულების მიმართ, როდესაც ამოიცნობს ამ სურათის კონკრეტულ ასპექტებს.

ასე რომ, მას შემდეგ, რაც OpenAI-მ DALL-E შემოიღო 2021 წლის იანვარში, ახლა უახლესი სისტემა, DALL-E 2, ქმნის უფრო რეალისტურ და ზუსტ სურათებს ოთხჯერ მეტი გარჩევადობით.

DALL-E 2 დაიწყო როგორც კვლევითი პროექტი და ახლა ხელმისაწვდომია როგორც ა ბეტა ვერსია. უსაფრთხოების შერბილებები, რომლებიც სისტემამ შეიმუშავა და განაგრძობს გაუმჯობესებას, მოიცავს: სისტემის ძალადობრივი, სიძულვილის ან ზრდასრული სურათების გენერირების შესაძლებლობის შეზღუდვას და სწავლაზე დაფუძნებულ ეტაპობრივ გამოყენებას.

წყარო: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/