ИИ наступает на пятки: GPT-5 и Claude почти сравнялись с профессионалами
OpenAI заявляет, что GPT-5 и Claude близки к экспертам в ключевых отраслях, но не заменят людей, а избавят от рутины,позволяя сосредоточиться на творчестве.

эпоху стремительного развития искусственного интеллекта, компания OpenAI опубликовала результаты инновационного сравнительного теста, демонстрирующие впечатляющие успехи больших языковых моделей (БЯМ). Согласно исследованию, модели GPT-5 и Claude Opus 4.1 от Anthropic уже вплотную приблизились к уровню профессионалов в ряде ключевых отраслей.
"Мы стремимся к созданию общего искусственного интеллекта (AGI) – состояния, при котором ИИ может решать сложные задачи, как это делают люди, без дополнительного контекста", - заявили представители OpenAI.
Компания OpenAI разработала новый эталон GDPval, ориентированный на оценку эффективности ИИ при решении "экономически ценных, реальных задач". Тестирование охватило 44 профессии в 9 отраслях, вносящих наибольший вклад в валовой внутренний продукт (ВВП) США, включая государственное управление, здравоохранение, финансы и розничную торговлю.
N.B. Читайте также интересную новость «Последний билет в офлайн? Российские турагентства вооружаются против онлайн-гигантов и Искусственного Интеллекта».
В ходе испытаний специалистов попросили сравнить отчеты, составленные ИИ, с отчетами, подготовленными экспертами-людьми. Результаты показали, что GPT-5 high (версия GPT-5 с повышенной вычислительной мощностью) превзошла людей в 35,48% случаев, в то время как Claude Opus 4.1 от Anthropic продемонстрировала еще более впечатляющий результат – 43,56% "побед". При этом, по словам OpenAI, модель достигает уровня отраслевых экспертов, когда общий процент составляет 50 %.
"Claude преуспел в эстетических аспектах… GPT-5 лучше справляется с точностью", - отметили в OpenAI.
Несмотря на опасения по поводу возможной потери рабочих мест из-за развития ИИ, OpenAI подчеркивает, что GDPval не является доказательством неминуемой замены людей. "Большинство профессий – это нечто большее, чем просто набор задач, которые можно описать", - утверждают в компании.
В OpenAI видят будущее, в котором ИИ берет на себя рутинные задачи, позволяя людям сосредоточиться на более творческих и сложных аспектах работы.