Сообщение MetaEra, 13 мая (UTC+8), OpenAI объявила о запуске нового оценочного бенчмарка для AI медицинских систем HealthBench, разработанного 262 врачами из 60 стран, охватывающего 5000 реальных смоделированных диалогов. HealthBench проверяет точность, полноту и клиническую полезность ответов моделей по критериям оценки, установленным врачами, и теперь открыт код и набор данных.
Кроме того, OpenAI сегодня утром заявила, что все пользователи Plus, Team и Pro могут экспортировать глубокие исследовательские отчеты в хорошо отформатированные PDF-файлы, которые включают таблицы, изображения, цитат
Посмотреть Оригинал