ChatGPT V4 აწვდის ზოლს, SAT-ებს და შეუძლია ამოიცნოს ექსპლოიტები ETH კონტრაქტებში

GPT-4, ხელოვნური ინტელექტის (AI) ჩატბოტის უახლეს ვერსიას, ChatGPT, შეუძლია გაიაროს საშუალო სკოლის ტესტები და იურიდიული სკოლის გამოცდები 90-ე პროცენტული ქულებით და აქვს ახალი დამუშავების შესაძლებლობები, რაც შეუძლებელი იყო წინა ვერსიით.

GPT-4-ის ტესტის ქულების ფიგურები 14 მარტს გააზიარა მისმა შემქმნელმა OpenAI-მ და გამოავლინა, რომ მას ასევე შეუძლია გადაიყვანოს სურათი, აუდიო და ვიდეო შეყვანები ტექსტად, გარდა იმისა, რომ უფრო კრეატიულად და საიმედოდ გაუმკლავდეს „ბევრად ნიუანსურ ინსტრუქციებს“.

”ის გადის იმიტირებულ ადვოკატთა გამოცდას ქულით, რომელიც ტესტირების საუკეთესო 10%-ს შეადგენს,” დასძინა OpenAI-მ. ”საპირისპიროდ, GPT-3.5-ის ქულა იყო დაახლოებით ქვედა 10%.

ციფრები აჩვენებს, რომ GPT-4-მა მიაღწია 163 ქულას 88-ე ცენტილში LSAT გამოცდაზე - სატესტო კოლეჯის სტუდენტებმა უნდა ჩააბარონ შეერთებულ შტატებში, რათა მიიღონ იურიდიულ სკოლაში.

GPT-4 და GPT-3.5 გამოცდის შედეგები აშშ-ს ბოლო გამოცდებზე. წყარო: OpenAI

GPT4-ის ქულა მას კარგ მდგომარეობაში აყენებს 20 საუკეთესო იურიდიულ სკოლაში დასაშვებად და მხოლოდ რამდენიმე ქულით ჩამოუვარდება პრესტიჟულ სკოლებს, როგორიცაა ჰარვარდი, სტენფორდი, პრინსტონი ან იელი, საჭირო ქულებს.

ChatGPT-ის ადრინდელმა ვერსიამ მხოლოდ 149 ქულა დააგროვა LSAT-ზე, რაც მას ბოლო 40%-ში აყენებს.

GPT-4-მა ასევე მოიპოვა 298 ქულა 400-დან ერთიან ადვოკატთა გამოცდაში - ტესტი, რომელიც ჩაატარეს ახლახან დაამთავრეს იურიდიული სტუდენტების მიერ, რომელიც მათ საშუალებას აძლევს ივარჯიშონ ადვოკატად აშშ-ს ნებისმიერ იურისდიქციაში.

UBE-ის ქულები საჭირო იყო აშშ-ს თითოეულ იურისდიქციაში სამართლის პრაქტიკაში დასაშვებად. წყარო: ადვოკატთა გამომცდელთა ეროვნული კონფერენცია

ChatGPT-ის ძველმა ვერსიამ იბრძოდა ამ ტესტში და ბოლო 10%-ში დაასრულა 213-დან 400 ქულით.

რაც შეეხება SAT მტკიცებულებებზე დაფუძნებულ კითხვასა და წერას და SAT მათემატიკის გამოცდებს, რომლებიც ჩაატარეს აშშ-ს საშუალო სკოლის მოსწავლეების მიერ კოლეჯის მზადყოფნის შესაფასებლად, GPT-4-მა მიიღო ქულები შესაბამისად 93-ე და 89-ე პროცენტულში.

GPT-4 გამოირჩეოდა "მყარ" მეცნიერებებშიც და აქვეყნებდა საშუალო პროცენტულ ქულებს AP ბიოლოგიაში (85-100%), ქიმიაში (71-88%) და ფიზიკა 2-ში (66-84%).

GPT-4 და GPT-3.5 გამოცდის შედეგები აშშ-ს ბოლო გამოცდებზე. წყარო: OpenAI.

თუმცა მისი AP Calculus ქულა საკმაოდ საშუალო იყო, 43r-დან 59-ე პროცენტულამდე.

კიდევ ერთი სფერო, სადაც GPT-4-ს აკლდა იყო ინგლისური ლიტერატურის გამოცდები, რომელიც აქვეყნებდა ქულებს მე-8-დან 44-ე პროცენტულში ორ ცალკეულ ტესტში.

OpenAI-მ თქვა, რომ GPT-4-მა და GPT-3.5-მა ეს ტესტები აიღეს 2022-2023 წლების პრაქტიკული გამოცდებიდან და რომ ენის დამუშავების ინსტრუმენტებით „კონკრეტული ტრენინგი“ არ ჩატარებულა:

„ამ გამოცდებისთვის კონკრეტული ტრენინგი არ ჩაგვიტარებია. გამოცდებში არსებული პრობლემების უმცირესობა მოდელმა დაინახა ტრენინგის დროს, მაგრამ მიგვაჩნია, რომ შედეგები რეპრეზენტატიულია. ”

შედეგებმა შიში გამოიწვია Twitter-ის საზოგადოებაშიც.

ამავე თემაზე: როგორ იმოქმედებს ChatGPT Web3 სივრცეზე? ინდუსტრია პასუხობს

ნიკ ალმონდი, FactoryDAO-ს დამფუძნებელი განუცხადა მისი 14,300 14 Twitter-ის მიმდევარი 4 მარტს, რომ GPTXNUMX აპირებს ხალხის „შეშინებას“ და ის „დაანგრევს“ გლობალურ განათლების სისტემას.

Coinbase-ის ყოფილმა დირექტორმა, კონორ გროგანმა თქვა, რომ მან ჩადო ცოცხალი Ethereum ჭკვიანი კონტრაქტი GPT-4-ში და მყისიერად მიუთითა რამდენიმე „უსაფრთხოების დაუცველობაზე“ და აჩვენა, თუ როგორ შეიძლება გამოიყენოს კოდი:

ადრეულმა ჭკვიანური კონტრაქტის აუდიტმა ChatGPT-ზე დაადგინა, რომ მის პირველ ვერსიას ასევე შეეძლო კოდის შეცდომების გონივრულ დონეზე გამოვლენა.

როუან ჩუნგმა, ხელოვნური ინტელექტის საინფორმაციო ბიულეტენი "The Rundown"-ის დამფუძნებელმა გააზიარა ვიდეო GPT-ით, რომელიც ქაღალდის ფურცელზე ხელით დახატულ ყალბ ვებსაიტს აწერს კოდს.