https://bdtechtalks.com/2021/07/07/ai-reward-is-not-enough-herbert-roitblat/?fbclid=IwAR0z4zGCabTp_zq657i9eQKvlT6R0d9ZfYsqmCRyGvpC7bWzue7J9WKf45Y

В недавней статье команда DeepMind ( Silver et al., 2021 ) утверждает, что награды достаточно для всех видов интеллекта. В частности, они утверждают, что «максимального вознаграждения достаточно, чтобы управлять поведением, которое проявляет большинство, если не все атрибуты интеллекта». Они утверждают, что простые награды - это все, что нужно агентам в богатой среде для развития мультиатрибутного интеллекта, необходимого для создания общего искусственного интеллекта. Это звучит как смелое заявление, но на самом деле оно настолько расплывчато, что почти бессмысленно. Они подтверждают свой тезис, не предлагая конкретных доказательств, а неоднократно заявляя, что вознаграждения достаточно, потому что наблюдаемые решения проблем согласуются с решенной проблемой.