AI агенттері заңгер болуға жақындап қалды

2026 жылғы ақпан айының басында Mercor компаниясы заңгерлік және корпоративтік талдау сияқты кәсіби міндеттерді орындауда AI агенттерінің қабілеттерін бағалайтын жаңа тест нәтижелерін жариялады. Осы тестте Anthropic компаниясының Opus 4.6 моделі біржақты сынақтарда шамамен 30% нәтиже көрсетіп, бірнеше қайта қарау арқылы орташа есеппен 45% деңгейіне жетті. Бұл көрсеткіштер бұрынғыдан әлдеқайда жоғары болып, AI-дың кәсіби салада жетістіктерге жеткенін білдіреді.
AI модельдерінің дамуы
Anthropic-тің жаңа моделі бірнеше агентті біріктіретін «агент паразиттері» сияқты көпсатылы мәселені шешу әдістерімен жабдықталған. Бұл технологиялардың енгізілуі бағалаудың айтарлықтай жақсаруына себепші болды. Mercor компаниясының бас директоры Брендан Фуди нәтижені ерекше жетістік деп бағалады, өйткені төрт ай ішінде нәтижелер 18,4%-дан 29,8%-ға дейін өсті.
Заңгерлер мен AI болашағы
Қазіргі күні AI агенттерінің нәтижелері 100%-дан әлі алыс болғанымен, заңгерлік саладағы AI қолданылуы бұрынғыға қарағанда қарқынды дамып жатыр. Бұл заңгерлердің өз қызметтерін AI-ға толықтай алмастыру жайлы қауіпсіздігінің төмендейтінін көрсетеді.
Дереккөз: TechCrunch



