Meta анонсировала новую ИИ-модель “Self-Taught Evaluator”, которая может автономно оценивать и обучать другие модели искусственного интеллекта.
Это новшество направлено на снижение затрат и ускорение разработки ИИ, устраняя необходимость в человеческом участии, которое требуется в методе “Обучение с подкреплением на основе человеческой обратной связи” (RLAIF).
Self-Taught Evaluator использует технику “цепочка рассуждений”, позволяющую разбивать сложные задачи на более простые шаги, что повышает точность ответов в таких областях, как наука, программирование и математика. Модель была обучена исключительно на данных, сгенерированных ИИ, и, по словам исследователя Джейсона Уэстона (Jason Weston), в будущем ИИ сможет проверять свою работу лучше, чем средний человек.
Эта разработка может значительно сократить участие человека в различных областях, приближая нас к будущему, где ИИ будет полностью автономным.
Источник: The Times of India