Нейросеть против почерка врачей: что показал эксперимент с GPT-4o по расшифровке

Экономика

17.05.2024 05:16

Почерк врачей – объект шуток и то, что не под силу разобрать обычному человеку. Айтишник проверил, как новая версия GPT-4o справляется с расшифровкой медицинских справок и рецептов. Kursiv LifeStyle рассказывает.

Программисты вовсю тестируют новую нейросеть GPT-4o от компании OpenAI. Это сервис, который может одновременно распознавать текст, видео и аудио и при этом общается почти как человек. Чтобы проверить возможности последней версии GPT, айтишники придумывают оригинальные задания. Например, пользователь X (Твиттера) Sergey Pakhandrin решил узнать, сможет ли искусственный интеллект справиться с почти непосильной для обычного человека задачей — разобрать почерк врача. Всего было пять уровней сложностей, с первым GPT-4o справилась легко и даже разобрала смайлики.

1/ Самый простой вариант и gpt-4o прекрасно справляется.

Даже смайлики двух поколений распознала ????

Удивляет! Но справится ли дальше? pic.twitter.com/GEjP3ZDYWj
— Sergey Pakhandrin (@pakhandrin) May 15, 2024

Вторая справка далась нейросети сложнее — GPT-4o допустила ошибку в возрасте. А вот с третьего уровня для искусственного интеллекта начались настоящие трудности — сначала GPT-4o разобрала рецепт от врача как список покупок в продуктовом магазине, а потом выдала случайные названия лекарств.

3/ Ещё сложнее.

Я сам смог прочитать только первый: виферон. Дальше для меня шифр.

GPT-4o же сначала распознала как список покупок. Посмеялся от души ????

Скорректировал запрос, указав что это почерк врача. Но и тут просто какой-то случайный список лекарств. Я бы не доверился ???? pic.twitter.com/HzZbwoE2i9
— Sergey Pakhandrin (@pakhandrin) May 15, 2024

С четвертым и пятым рецептом искусственный интеллект тоже едва справился. В чате GTP-4o жалуется на неразборчивый почерк и показывает неполные расшифровки. Однако ни автор твита, ни другие пользователи соцсети доверять нейросети не спешат.

5/ Ну и на десерт

Сплошные галлюцинации. Но вопрос у кого: у меня или у модели?

На второй попытке модель целый список написала, но совпало ли что-нибудь с реальной «писаниной»? Мне сложно судить ???? pic.twitter.com/d3jN55wMyd
— Sergey Pakhandrin (@pakhandrin) May 15, 2024

Кажется, нейросеть гораздо больше похожа на обычного человека, ведь ей тоже с трудом даётся сложный врачебный почерк, который давно стал мемом. Зато, как шутят в Сети, фармацевты в аптеках могут быть спокойны – их искусственный интеллект не заменит.