Skip to main content

Большие языковые модели (LLM) могут генерировать достоверные, но неточные ответы, поэтому исследователи разработали методы количественной оценки неопределенности для проверки надежности прогнозов. Один из популярных методов заключается в многократной отправке одного и того же запроса, чтобы проверить, выдает ли модель один и тот же ответ. Но этот метод измеряет уверенность в себе, и даже самый выдающийся магистр права может ошибаться. Чрезмерная самоуверенность может ввести пользователей в заблуждение относительно точности прогноза, что может привести к разрушительным последствиям в таких сферах, где ставки высоки, например, в здравоохранении или финансах.

Новости от techxplore