GPT-4, ხელოვნური ინტელექტის (AI) ჩატბოტის უახლეს ვერსიას, ChatGPT, შეუძლია გაიაროს საშუალო სკოლის ტესტები და იურიდიული სკოლის გამოცდები 90-ე პროცენტული ქულებით და აქვს ახალი დამუშავების შესაძლებლობები, რაც შეუძლებელი იყო წინა ვერსიით.
GPT-4-ის ტესტის ქულების ფიგურები 14 მარტს გააზიარა მისმა შემქმნელმა OpenAI-მ და გამოავლინა, რომ მას ასევე შეუძლია გადაიყვანოს სურათი, აუდიო და ვიდეო შეყვანები ტექსტად, გარდა იმისა, რომ უფრო კრეატიულად და საიმედოდ გაუმკლავდეს „ბევრად ნიუანსურ ინსტრუქციებს“.
”ის გადის იმიტირებულ ადვოკატთა გამოცდას ქულით, რომელიც ტესტირების საუკეთესო 10%-ს შეადგენს,” დასძინა OpenAI-მ. ”საპირისპიროდ, GPT-3.5-ის ქულა იყო დაახლოებით ქვედა 10%.
ციფრები აჩვენებს, რომ GPT-4-მა მიაღწია 163 ქულას 88-ე ცენტილში LSAT გამოცდაზე - სატესტო კოლეჯის სტუდენტებმა უნდა ჩააბარონ შეერთებულ შტატებში, რათა მიიღონ იურიდიულ სკოლაში.
GPT4-ის ქულა მას კარგ მდგომარეობაში აყენებს 20 საუკეთესო იურიდიულ სკოლაში დასაშვებად და მხოლოდ რამდენიმე ქულით ჩამოუვარდება პრესტიჟულ სკოლებს, როგორიცაა ჰარვარდი, სტენფორდი, პრინსტონი ან იელი, საჭირო ქულებს.
ChatGPT-ის ადრინდელმა ვერსიამ მხოლოდ 149 ქულა დააგროვა LSAT-ზე, რაც მას ბოლო 40%-ში აყენებს.
GPT-4-მა ასევე მოიპოვა 298 ქულა 400-დან ერთიან ადვოკატთა გამოცდაში - ტესტი, რომელიც ჩაატარეს ახლახან დაამთავრეს იურიდიული სტუდენტების მიერ, რომელიც მათ საშუალებას აძლევს ივარჯიშონ ადვოკატად აშშ-ს ნებისმიერ იურისდიქციაში.
ChatGPT-ის ძველმა ვერსიამ იბრძოდა ამ ტესტში და ბოლო 10%-ში დაასრულა 213-დან 400 ქულით.
რაც შეეხება SAT მტკიცებულებებზე დაფუძნებულ კითხვასა და წერას და SAT მათემატიკის გამოცდებს, რომლებიც ჩაატარეს აშშ-ს საშუალო სკოლის მოსწავლეების მიერ კოლეჯის მზადყოფნის შესაფასებლად, GPT-4-მა მიიღო ქულები შესაბამისად 93-ე და 89-ე პროცენტულში.
GPT-4 გამოირჩეოდა "მყარ" მეცნიერებებშიც და აქვეყნებდა საშუალო პროცენტულ ქულებს AP ბიოლოგიაში (85-100%), ქიმიაში (71-88%) და ფიზიკა 2-ში (66-84%).
თუმცა მისი AP Calculus ქულა საკმაოდ საშუალო იყო, 43r-დან 59-ე პროცენტულამდე.
კიდევ ერთი სფერო, სადაც GPT-4-ს აკლდა იყო ინგლისური ლიტერატურის გამოცდები, რომელიც აქვეყნებდა ქულებს მე-8-დან 44-ე პროცენტულში ორ ცალკეულ ტესტში.
OpenAI-მ თქვა, რომ GPT-4-მა და GPT-3.5-მა ეს ტესტები აიღეს 2022-2023 წლების პრაქტიკული გამოცდებიდან და რომ ენის დამუშავების ინსტრუმენტებით „კონკრეტული ტრენინგი“ არ ჩატარებულა:
„ამ გამოცდებისთვის კონკრეტული ტრენინგი არ ჩაგვიტარებია. გამოცდებში არსებული პრობლემების უმცირესობა მოდელმა დაინახა ტრენინგის დროს, მაგრამ მიგვაჩნია, რომ შედეგები რეპრეზენტატიულია. ”
შედეგებმა შიში გამოიწვია Twitter-ის საზოგადოებაშიც.
ამავე თემაზე: როგორ იმოქმედებს ChatGPT Web3 სივრცეზე? ინდუსტრია პასუხობს
ნიკ ალმონდი, FactoryDAO-ს დამფუძნებელი განუცხადა მისი 14,300 14 Twitter-ის მიმდევარი 4 მარტს, რომ GPTXNUMX აპირებს ხალხის „შეშინებას“ და ის „დაანგრევს“ გლობალურ განათლების სისტემას.
შეფასების თეორია იყო ჩემი ცხოვრების დიდი ნაწილი რამდენიმე წლის განმავლობაში. ბევრი წლის წინ დადგომა ამ დღეს ვცდილობდი. მე სიტყვასიტყვით ჟღერდა როგორც რეზიდენტი crank იმ დროს.
მაგრამ... მართლაც, ეს ნიშნავს, რომ ამ მომენტიდან ყველაფერი, გარდა დაკვირვებული შეფასებისა, დასრულდა.
— დრნიკი ️² (@DrNickA) მარტი 14, 2023
Coinbase-ის ყოფილმა დირექტორმა, კონორ გროგანმა თქვა, რომ მან ჩადო ცოცხალი Ethereum ჭკვიანი კონტრაქტი GPT-4-ში და მყისიერად მიუთითა რამდენიმე „უსაფრთხოების დაუცველობაზე“ და აჩვენა, თუ როგორ შეიძლება გამოიყენოს კოდი:
მე გადავყარე ცოცხალი Ethereum კონტრაქტი GPT-4-ში.
მყისიერად, მან ხაზი გაუსვა უსაფრთხოების უამრავ დაუცველობას და მიუთითა ზედაპირული ადგილები, სადაც შესაძლებელია კონტრაქტის გამოყენება. შემდეგ მან გადაამოწმა კონტრაქტის გამოყენების კონკრეტული გზა pic.twitter.com/its5puakUW
— კონორი (@jconorgrogan) მარტი 14, 2023
ადრეულმა ჭკვიანური კონტრაქტის აუდიტმა ChatGPT-ზე დაადგინა, რომ მის პირველ ვერსიას ასევე შეეძლო კოდის შეცდომების გონივრულ დონეზე გამოვლენა.
როუან ჩუნგმა, ხელოვნური ინტელექტის საინფორმაციო ბიულეტენი "The Rundown"-ის დამფუძნებელმა გააზიარა ვიდეო GPT-ით, რომელიც ქაღალდის ფურცელზე ხელით დახატულ ყალბ ვებსაიტს აწერს კოდს.
ახლახან ვუყურე GPT-4-ს, როგორ აქცევს ხელით დახატული ესკიზი ფუნქციურ ვებსაიტად.
Ეს სიგიჟეა. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) მარტი 14, 2023
წყარო: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts