მანქანის აუდიოს ახალი ხელოვნური ინტელექტი შეიძლება გაუმჯობესდეს იმაზე მეტი, ვიდრე უბრალოდ მელოდიები

ჰოლივუდმა მუდამ წარმოაჩინა ხელოვნური ინტელექტი (AI), როგორც დისტოპიური რობოტების მოქმედი ფენა, რომლებიც ცვლიან უეჭველ ადამიანებს და ქმნიან მზარდ, ცენტრალურ კონფლიქტს. საუკეთესო შემთხვევაში, შეგიძლიათ წარმოიდგინოთ ახალგაზრდა ჰეილი ჯოელ ოსმენტი, რომელიც თამაშობს დევიდს, თვითშეგნებულ, ხელოვნურ ბავშვს სპილბერგის პოლარული ქუდები-გადებული და დატბორილი სანაპირო ქალაქების სამყაროში (ჟღერს ნაცნობი?) AI: ხელოვნური ინტელექტი რომელიც (სპოილერის გაფრთხილება) მხოლოდ თავს იკლავს. ან იქნებ გახსოვთ რობინ უილიამსის ხმა როგორც Bicentennial Man რომელიც, კიდევ ერთხელ, არის თვითშეგნებული რობოტი, რომელიც ცდილობს აყვავდეს და (კიდევ ერთხელ სპოილერის გაფრთხილება), მისი ერთადერთი მსხვერპლი ხდება. და, რა თქმა უნდა, არის თითქმის კლიშე მითითება Terminator და მისი პოსტ-აპოკალიფსური სამყარო მანქანებით, რომლებიც ცდილობენ გაანადგურონ ადამიანები და, ასევე, (არც ისე სპოილერის გაფრთხილება) უამრავი მსხვერპლი რამდენიმე ათწლეულის განმავლობაში. თუმცა არცერთ ამ სცენარში ადამიანები არ თანაარსებობენ გაუმჯობესებულ ცხოვრებასთან, რომ აღარაფერი ვთქვათ გაძლიერებულ გართობასა და უსაფრთხოებასთან.

თუმცა, ეს არის ახალი რეალობა. ხელოვნური ინტელექტის ალგორითმები შეიძლება ჩართული იყოს აუდიო დიზაინში და მუდმივად გაუმჯობესდეს საჰაერო განახლებების მეშვეობით მართვის გამოცდილების გასაუმჯობესებლად. ჰოლივუდის ამ მაგალითებთან პირდაპირ ეწინააღმდეგება, ასეთმა ხელოვნურმა ინტელექტუალმა შესაძლოა რეალურად გააუმჯობესოს ადამიანის გადარჩენის ალბათობა.

მხოლოდ სიამოვნებისთვის

ბოლო დრომდე, ყველა მომხმარებლის ინტერფეისი (UI) აუდიო განვითარების ჩათვლით საჭიროებდა კომპლექსურ პროგრამირებას ექსპერტი კოდირების მიერ მანქანის პროგრამის სტანდარტული ოცდათექვსმეტი (36) თვის განმავლობაში. ლითონის ფურცლის სტილის და ელექტრონული ყუთები მითითებულია, მოპოვებული და შემუშავებულია პარალელურად მხოლოდ გვიან შემუშავების ცალკეული ელემენტების დაკალიბრებისთვის. ბრენდირებული ხმები. აკუსტიკური ხელმოწერები. ყველა ცალკეული ინიციატივა იმავე, ანემიური სისტემის დიზაინის ფარგლებში, რომელსაც აქვს მწარმოებლებს მილიარდები დაუჯდათ.

მაგრამ ხელოვნურმა ინტელექტმა დაუშვა ბევრად უფრო მოქნილი და ეფექტური გზა აუდიო გამოცდილების დიზაინთან მიახლოების მიზნით. „რაც ჩვენ ვხედავთ არის ტენდენციების კონვერგენცია“, - ამბობს ჯოშ მორისი, DSP Concept-ის მანქანათმცოდნეობის ინჟინერიის მენეჯერი. ”აუდიო ხდება უფრო დომინანტური ფუნქცია ავტომობილებში, მაგრამ ამავე დროს თქვენ ხედავთ, რომ თანამედროვე პროცესორები ძლიერდებიან მეტი მეხსიერებითა და შესაძლებლობებით.”

ამასთან, სისტემაზე ორიენტირებული განვითარების პლატფორმის გამოყენებით, ხელოვნური ინტელექტი და ეს უფრო ძლიერი პროცესორები მძღოლებსა და მგზავრებს ადაპტირებულ, რეალურ დროში რეაგირების ახალ დონეს აძლევს. . „ყოველი წარმოსახვითი სცენარისთვის კოდის დაწერის ისტორიული საჭიროების ნაცვლად, ხელოვნური ინტელექტი ხელმძღვანელობს სისტემის რეაგირებას გარემო პირობებისა და მოვლენების შესწავლის საფუძველზე, ამბობს სტივ ერნსტი, DSP Concept-ის საავტომობილო ბიზნესის განვითარების ხელმძღვანელი.

ასეთი სასწავლო სისტემის გამოყენების ძალიან აშკარა გზაა ავტომობილის „ხმაურის ამოღება“ ისე, რომ პრემიუმ აუდიო შეიძლება იყოს მორგებული და გაუმჯობესებული, მიუხედავად იმისა, რომ შეიცვლება ზამთრის საბურავები ან სხვა მსგავსი გარემო ცვლილებები. მაგრამ LG Electronics-მა შეიმუშავა ალგორითმები, რომლებიც მუშაობს DSP Concept-ის აუდიო Weaver-ში პლატფორმა, რომელიც საშუალებას აძლევს ფილმის დიალოგის ხმის გაუმჯობესებას უკანა სავარძელში გასართობი დროს, რათა ხაზი გაუსვას მას ფილმში აფეთქებების წინააღმდეგ, რითაც მგზავრს საშუალებას აძლევს უკეთესად მოისმინოს კრიტიკული შინაარსი

კიდევ ერთი არააშკარა ასპექტი იქნება ის, თუ როგორ ხდება ბრენდირებული აუდიო ხმების ორკესტრირება სხვა ხმების შუაგულში. საჭიროებს თუ არა ამ კონკრეტულ მანქანას ჩატვირთვის მზარდი თანმიმდევრობა, რომ დაუკრას სხვა ხმები, როგორიცაა რადიო და ზარები ავტომატურად გამორთულია? თითოეული გამოცდილების კორექტირება შესაძლებელია.

უფრო სავარაუდოა, რომ აყვავდეს

როდესაც მსოფლიო იბრძვის როგორც ელექტრომობილებზე, ასევე ავტონომიურ მართვაზე, ხმოვანი გაფრთხილებების სიხშირე და საჭიროებები სავარაუდოდ მკვეთრად შეიცვლება. მაგალითად, ავტონომიური ტაქსის უსაფრთხოების ინჟინერს არ შეუძლია ივარაუდოს, რომ მგზავრები ვიზუალურ ჩვენებასთან ახლოს არიან, როცა დროული გაფრთხილებაა საჭირო. და რამდენად ისმის ეს გაფრთხილება დაახლოებით 25 მილიონი შეზღუდული შესაძლებლობის მქონე ამერიკელი ვისთვის ავტონომიურმა მანქანებმა უნდა გახსნას მობილობის ახალი შესაძლებლობები? „ახლა აუდიო არ არის მხოლოდ თქვენი საყვარელი სიმღერის მოსასმენად“, — ამბობს ერნსტი. ”ავტონომიური მართვის დროს, არსებობს ყველა სახის გაფრთხილება, რომელიც საჭიროა მძღოლის ჩართულობის შესანარჩუნებლად ან არაჩართული მძღოლის გასაფრთხილებლად მათ გარშემო მიმდინარე მოვლენების შესახებ.”

„და რაც უფრო რთულს ხდის მას, - ამბობს ადამ ლევენსონი, DSP Concepts-ის მარკეტინგის ხელმძღვანელი, - არის ყველაფერი, რაც ერთდროულად მუშავდება მანქანაში: ტელეფონი, ჩაძირული ან სივრცითი ხმა, ძრავის ხმაური, გზის ხმაური, მანქანის აკუსტიკური გამაფრთხილებელი სისტემები, ხმის სისტემები და ა.შ. ჩვენ გვსურს ვთქვათ, რომ ყველაზე რთული აუდიო პროდუქტი არის მანქანა.

მაგალითად, წარმოიდგინეთ სცენარი, როდესაც მძღოლმა ჩართო ავტონომიური მართვის რეჟიმი გზატკეცილზე, აამაღლა თავისი მელოდიები და სასიამოვნოდ არ იცის მოახლოებული სასწრაფო დახმარების მანქანა. ავტომობილის მიკროფონ(ებ)ის გამოყენებით სირენის ამოცნობის რა სიზუსტით (და მანძილით) აფრთხილებს მანქანა თავის კვაზი-გაფანტულ მძღოლს? როგორ უნდა იყოს წარმოდგენილი ეს გაფრთხილება გარემოს ხმაურის დასაძლევად, საკმარისი ყურადღების მიქცევისთვის, მაგრამ მძღოლის უაზროდ გაოცებისთვის? ამ ყველაფრის დარეგულირება შესაძლებელია წინასწარ შემუშავებული მოდელების, წინასწარი ვარჯიშის სხვადასხვა სირენების და შემდგომ ღრუბელზე დაფუძნებული ტუნინგის მეშვეობით. „აქ არის საერთო ორკესტრირება მართლაც მნიშვნელოვანი“, განმარტავს მორისი. „ჩვენ შეგვიძლია ავიღოთ [AI-ს აღმოჩენის] მოდელის გამოსავალი და მივმართოთ მანქანის სხვადასხვა ადგილას. შესაძლოა, აუდიო ჩართოთ, ამოქმედოთ რაიმე ხმოვანი გამაფრთხილებელი სიგნალი და აანთოთ რაღაც დაფაზე, რათა მძღოლმა ყურადღება მიაქციოს.”

იგივე ეხება გარე სიგნალებს. მაგალითად, წყნარ ელექტრო მანქანას შეიძლება ჰქონდეს სიგნალიზაცია ფეხით მოსიარულეებისთვის. ასე რომ, ახალი კალიბრაციები შეიძლება შეიქმნას ოფლაინში და ჩამოიტვირთოს მანქანებში, როგორც პროგრამული განახლებები ჩართული ინოვაციის საფუძველზე.

ინოვაცია ყველგან. და ხელოვნური ინტელექტი კვებავს უტოპიურ გამოცდილებას, ვიდრე ქმნის ჰოლივუდის დისტოპიურ სამყაროს.

ავტორის პროგნოზი

აი, ჩემი პროგნოზი კვირის შესახებ (და ეს მხოლოდ სამშაბათია, ხალხო): აუდიოს შემდეგი ევოლუცია მოიცავს სრულ, მყისიერ გამოხმაურებას, დახვეწილი, რეალურ დროში მომხმარებლების სიამოვნების ჩათვლით. დიახ, ამჟამინდელი დიზაინის დიდი ნაწილი, სავარაუდოდ, აუმჯობესებს გამოცდილებას, მაგრამ მომხმარებელზე ორიენტირებული დიზაინის (UCD) მიმდინარე კალიბრაცია შეიძლება დამატებით გაუმჯობესდეს მგზავრების გამონათქვამების, სხეულის ენისა და კომენტარების საფუძველზე, რითაც ინდივიდუალურად არეგულირებს კმაყოფილებას რეალურ დროში. ყველა გამაძლიერებელი არსებობს: კამერა, AI, პროცესორები და ადაპტური პლატფორმა.

დიახ, ჩვენ ადრე გვსმენია ადაპტური განწყობის განათება და მოწყენილობის, სტრესის და ა.შ. დისტანციური გამოვლენა უსაფრთხოების გასაუმჯობესებლად, მაგრამ არაფერი აძლიერებს კომბინირებულ გამოცდილებას რეალურ დროში, ყველა მომხმარებლის მიმართული სენსორის სწავლის ალგორითმებზე დაყრდნობით.

ალბათ ძალიან ბევრს ვაკეთებ ექსტრაპოლაციას. მაგრამ ისევე, როგორც რობინ უილიამსის პერსონაჟი, მე ორი საუკუნე გავატარე… ასე რომ, შესაძლოა, მე ასევე მგრძნობიარე ვარ იმის მიმართ, რაც შეიძლება სურდეს ადამიანებს.

წყარო: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/