კულტურა
კითხვის სავარაუდო დრო 2 წუთი

ყველაზე ჭკვიანი AI-მოდელები

ყველაზე ჭკვიანი AI-მოდელები

Visual Capitalist-მა, Tracking AI-ის მიერ შეგროვებულ მონაცემებზე დაყრდნობით, ხელოვნური ინტელექტის ყველაზე ჭკვიანი მოდელების სია შემოგვთავაზა. AI-მოდელების შესაფასებლად კი Mensa Norway IQ-ის ტესტი გამოიყენა. აღსანიშნავია, რომ ის ადამიანის ინტელექტის შესაფასებლად შექმნილ ერთ-ერთ ყველაზე რთულ IQ-ტესტად არის მიჩნეული.

გასული წლის მონაცემებს თუ შევადარებთ, დავინახავთ, რომ AI-მოდელების ქულებს შორის სხვაობა მნიშვნელოვნად არის შემცირებული. გარდა ამისა, სიის ლიდერობა ამჯერად ორმა მოდელმა გაიყო: Grok-4.20 Expert Mode-მა და OpenAI GPT 5.4 Pro (Vision)-მა, რომლებმაც 145 ქულა დააგროვეს. მათთან ქულებით საკმაოდ ახლოსაა Gemini 3.1 Pro Preview, რომლის შედეგიც 141-ს შეადგენს.

საინტერესოა, რომ ერთი წლის წინ მაქსიმალური შედეგი მხოლოდ 135 ქულა იყო, რომელიც OpenAI-ის ტექსტურმა o3 მოდელმა აჩვენა. დღევანდელი ლიდერების 145 ქულა კი მიუთითებს, რამდენად სწრაფად ვითარდება ხელოვნური ინტელექტის მოდელები, განსაკუთრებით აბსტრაქტული აზროვნებისა და ლოგიკური ამოცანების ამოხსნის მიმართულებით.

თუმცა ეს პროგრესი AI-სექტორის ყველა მოთამაშისთვის ერთნაირი არ ყოფილა. ბაზარზე კვლავ არის მკვეთრი ჩამორჩენა გარკვეული კომპანიების მხრიდან. მაგალითად, Mistral AI-ის საუკეთესო მოდელი ამ რეიტინგში მნიშვნელოვნად დაბალ პოზიციაზეა და მხოლოდ 97 ქულას აფიქსირებს, რაც ლიდერებთან შედარებით სერიოზულ სხვაობას ქმნის.

ცნობისთვის, Mensa Norway-ის ტესტი 35 ვიზუალური ლოგიკური ამოცანისგან შედგება. ტესტირებისას ვიზუალური AI-მოდელები სურათებს იღებენ, ხოლო ტექსტურ მოდელებს ამოცანები სიტყვიერად მიეცემა. არ უნდა დაგვავიწყდეს, რომ შედეგები აღიქმება, როგორც საორიენტაციო შედარება და არა როგორც საერთო ინტელექტის საბოლოო საზომი.

აქვე აღსანიშნავია, რომ IQ ტიპის ტესტი არ ზომავს ყველაფერს, რაც რეალურ ცხოვრებაში AI-ის გამოყენებისას მნიშვნელოვანია, მათ შორის კოდის წერას, ფაქტობრივ სიზუსტეს, ინსტრუმენტების გამოყენებასა და კონკრეტულ პროფესიულ დავალებებზე პასუხს.

მიუხედავად ამისა, ერთი რამ ცხადია – ხელოვნური ინტელექტის განვითარება დაჩქარებული ტემპით მიმდინარეობს და ხვალ შესაძლოა ამ სიის სათავეში AI-სექტორის სრულიად ახალი მოთამაშის პროდუქტი აღმოჩნდეს.

Mensa Norway IQ-ის ტესტის მიხედვით, ყველაზე ჭკვიანი AI-მოდელების ათეული ასე გამოიყურება:

# მოდელი IQ (აპრილი, 2026)
1 Grok-4.20 Expert Mode 145
1 OpenAI GPT 5.4 Pro (Vision) 145
3 Gemini 3.1 Pro Preview 141
4 OpenAI GPT 5.4 Thinking (Vision) 139
5 OpenAI GPT 5.3 136
6 Grok-4.20 Expert Mode (Vision) 133
6 OpenAI GPT 5.4 Thinking 133
6 Meta Muse Spark 133
9 Gemini 3.1 Pro Preview (Vision) 132
10 Qwen 3.5 130
10 Claude-4.6 Opus 130
12 Kimi K2.5 127
13 Manus 115
14 DeepSeek R1 112
15 DeepSeek V3 111
16 Gemini 3.1 Flash Preview 110
16 Llama 4 Maverick 110
18 OpenAI GPT 5.3 (Vision) 109
19 Claude-4.6 Sonnet 106
20 Bing Copilot 101