MacWhisper არის უფასო ტრანსკრიფციის პროგრამა, რომელსაც მე ველოდები

ეძებთ Mac პროგრამას აუდიო ფაილების წერილობით ტექსტურ ფაილებად გადასაწერად? არსებობს უამრავი ფასიანი ინსტრუმენტი, როგორიცაა Otter.ai და Trint, რომლებიც შეიძლება რეალურ ფულს ღირდეს, როდესაც მათ ზედმეტად ბევრს დაიწყებთ. მაგრამ მაკუისპერი არის უფასო გამოსავალი, რომელსაც ინტერნეტი ელოდა. ან, ყოველ შემთხვევაში, ის, რომელსაც ველოდი.

OpenAI-მ გამოუშვა წარმოუდგენლად მძლავრი უფასო პროგრამა ჯერ კიდევ 2022 წლის სექტემბერში, რომელიც საშუალებას აძლევდა ადამიანებს, რომლებსაც აქვთ გარკვეული ტექნიკური ცოდნა, გადაექციათ თავიანთი აუდიო და ვიდეო ფაილები წარმოუდგენლად ზუსტ ტრანსკრიპტებად. პრობლემა ის იყო, რომ ის არ იყო ძალიან ხელმისაწვდომი საშუალო მომხმარებლისთვის, რადგან თქვენ უნდა გაეცნოთ ტერმინალის აპში ბრძანებების გამოყენებას.

მაგრამ MacWhisper-ით, რომელიც პირველად შენიშნა 9to5Mac, ვიღაცამ საბოლოოდ შეიმუშავა GUI, ანუ გრაფიკული მომხმარებლის ინტერფეისი, რომელიც ეყრდნობა OpenAI-ს Whisper-ს და ტოვებს ყველა დამაბნეველ ტექნიკურ საკითხს, რაც საშუალებას მოგცემთ უბრალოდ გადმოიტანოთ და ჩამოაგდოთ თქვენი აუდიო ფაილი და მიიღოთ ტრანსკრიფცია ძალიან სწრაფად. და MacWhisper უკიდურესად ზუსტია, რადგან OpenAI-ის Whisper-ზე გაწვრთნილი იყო 680,000 საათი აუდიო მონაცემები ინტერნეტში.

MacWhisper-ის ერთ-ერთი კარგი რამ არის ის, რომ თქვენ არ ატვირთავთ აუდიო ან ვიდეო ფაილს, რომლის ტრანსკრიბცია გსურთ ინტერნეტში. ეს მნიშვნელოვანია ჟურნალისტებისთვის, რომლებიც შესაძლოა მუშაობენ სენსიტიურ ამბავზე, ან მათთვის, ვინც უბრალოდ ზოგადად უფრთხილდება მათი პირადი ფაილების ღრუბელში ატვირთვას. ფაილი რჩება თქვენს დესკტოპზე, რაც იმას ნიშნავს, რომ არ არსებობს შანსი, რომ ვინმემ შეძლოს თქვენი აუდიოს ჩაჭრა.

ისევ, MacWhisper არის მხოლოდ ახალი მომხმარებლის ინტერფეისი უფასო პროგრამისთვის, რომელიც OpenAI-მ გასული წლის ბოლოს შემოიტანა, მაგრამ ის ნამდვილად გააადვილებს აუდიო ტრანსკრიფციას თითქმის ყველასთვის. იმიტომ, რომ მე ვიყენებ Whisper-ს და გამოსვლის დღიდან ის ძალიან სასარგებლო აღმოჩნდა. მე კი ახლა გამოვიყენებ MacWhsiper-ს, რადგან ის აუცილებლად დააჩქარებს ჩემს სამუშაო პროცესს.

როგორც მხოლოდ ერთი მაგალითი, კრიპტო კომპანიის FTX-ის დაშლის შესახებ ამბის შემდეგ, მე Whisper გამოვიყენე ათობით საათის ძველი YouTube ინტერვიუს გადასაწერად კომპანიის დამფუძნებელ სემ ბანკმენ-ფრიდთან. იქიდან მე შევძელი ტრანსკრიპტების მოძიება და უცნაური და საინტერესო იდეების პოვნა სტატიების დასაწერად, მაგალითად, როდესაც SBF-მა თქვა 2021 წლის ივნისში, რომ ბლოკჩეინი ენრონს გამოასწორებდა. SBF-ის შედარება Enron-თან უცნაური დამთხვევა იყო, თუ გავითვალისწინებთ ყველაფერს, რაც ახლა ვიცით იმის შესახებ, თუ როგორ დაინგრა FTX. მაგრამ მე ვერასდროს ვიპოვიდი იმ მომენტს ძველ ბუნდოვან ინტერვიუში, რომ არ მქონოდა ათობით ჩანაწერი, რომლის ძებნაც შემეძლო. და ეს პროცესი, მიუხედავად იმისა, რომ უფრო ადვილია, ვიდრე საათობითა და საათობით კასეტების მოსმენა, მაინც რთული და არც თუ ისე ავტომატიზირებული იყო.

Whisper-ის დაინსტალირების შემდეგ ჩემს კომპიუტერზე, მე ვაკრეფდი „whisper audiofilename.mp3 —model tiny.en“ Mac-ის ტერმინალის აპში, როცა მინდოდა ფაილის ტრანსკრიფცია. WhisperMac-ით მე შემიძლია უბრალოდ გადმოვწიო და ჩამოაგდო ჩემი აუდიო ფაილი და ის თავის მაგიას აკეთებს ზედმეტი აკრეფის გარეშე.

მე გამოვცადე MacWhisper NBC Nightly News-ის ეპიზოდით, რომელიც გადმოვწერე YouTube-დან. და გარდა რამდენიმე შეცდომისა, როგორიცაა სიტყვა „ქარის ქარის“ ინტერპრეტაცია, როგორც „ქარის ქარი“, და ლესტერ ჰოლტის მოსმენა, როგორც „ლესტერ ჰოლდი“, ტრანსკრიპტი ძალიან ზუსტი იყო. MacWhisper უფასოა, მაგრამ არსებობს პროგრამული უზრუნველყოფის ფასიანი დონე, რომელიც შეიძლება იყოს ოდნავ უფრო ზუსტი, რადგან ის იყენებს OpenAI-ის უფრო ინტენსიურ ტრენინგ მოდელებს, მაგრამ უფასო ვერსია უბრალოდ მშვენივრად იმუშავებს ადამიანების უმეტესობისთვის.

MacWhisper საშუალებას გაძლევთ გადაიტანოთ ტრანსკრიბირებული სიტყვა რამდენიმე სხვადასხვა ფორმატში, მათ შორის უბრალო ტექსტში, CSV ან თუნდაც სუბტიტრების ფაილის ფორმატში, როგორიცაა SRT და VTT.

და MacWhisper არ არის მხოლოდ ინგლისურისთვის. შეგიძლიათ აუდიოს გადაწერა 100 სხვადასხვა ენაზე, რაც წარმოუდგენლად მოსახერხებელია. ერთადერთი ფუნქცია MacWhisper-ს არ გააჩნია, რითაც მე სიამოვნებით ვითამაშებდი Whisper-ზე ტერმინალის აპში, არის ენის თარგმნა. მე ვთარგმნე ვირუსული ვიდეოები რუსულ და ჩინურ ენებზე და ადამიანებმა, რომლებიც ლაპარაკობენ ენებზე Twitter-ზე, მითხრეს, რომ თარგმანები არის ზუსტი.

სხვა ფუნქცია, რომელიც MacWhisper-ს არ გააჩნია, თუმცა ის ასევე არ არის ხელმისაწვდომი OpenAI-ს Whisper-იდან, არის დინამიკების დიფერენცირების შესაძლებლობა. მაგალითად, თუ თქვენ აწერთ ინტერვიუს ორ სპიკერთან, არ არის მკაფიო ნიშნები, რომლებიც აჩვენებს, როდის შეჩერდა ერთი სპიკერი და მეორე დაიწყო. მაგრამ მე ეჭვი მაქვს, რომ ვიღაცამ საბოლოოდ ჩამოაყალიბა ეს შესაძლებლობები. ფასიანი სერვისები, როგორიცაა Trint, ამას ავტომატურად აკეთებს და კარგი იქნება, რომ საბოლოოდ გქონდეთ უფასოდ, მაგრამ თქვენ იღებთ იმას, რასაც იხდით.

ასევე არის ფუნქცია MacWhisper-თან, სადაც შეგიძლიათ თქვენი კომპიუტერის მიკროფონიდან მეტყველება ტექსტად გარდაქმნათ, რაც შეიძლება მოსახერხებელი იყოს, თუ გსურთ რაღაცის გადაწერა.

თვეები მაინტერესებდა, ბოლოს როდის შეიმუშავებდა ვინმე Whisper-ის GUI-ს, რადგან რამდენიმე ადამიანმა აჩვენა ის, მაგრამ არ შექმნა რაიმე ძალიან მოსახერხებელი მომხმარებლისთვის. მაგრამ MacWhisper, რომელიც შეიქმნა Jordi Bruin-ის მიერ, არის პროგრამული უზრუნველყოფა, რომელსაც მე ველოდები. ბრუინმა ასევე შეიმუშავა პროგრამული უზრუნველყოფა, როგორიცაა მაკგპტი, რომელიც მომხმარებლებს საშუალებას აძლევს წვდომის ChatGPT-ს მათი მენიუს ზოლიდან.

შეგიძლიათ ჩამოტვირთოთ MacWhisper უფასოდელ.ფოსტის რეგისტრაციით, Bruin-ის ვებსაიტზე.

წყარო: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/