Развитие ИИ замедляется из-за переизбытка бесполезных данных

В мире
04 Май 2026
17:46
52
Развитие ИИ замедляется из-за переизбытка бесполезных данных

Дальнейшее развитие систем искусственного интеллекта, включая переход к так называемому «физическому ИИ» и моделям окружающего мира, сдерживается не нехваткой, а переизбытком некачественных и бесполезных данных.

Как сообщает БР со ссылкой на издание Fortune, отрасль приближается к новому этапу, где ИИ-системы должны будут функционировать в физическом мире - от управления транспортом до выполнения бытовых и медицинских задач. Однако для формирования необходимых когнитивных навыков таким системам требуются не просто большие объемы информации, а структурированные и многогранные данные высокого качества.

Отмечается, что рост числа ИИ-стартапов, включая Scale AI, Surge AI и Mercor, привел к резкому увеличению спроса на обучающие данные. В результате на рынке возник избыток информации, значительная часть которой не способствует улучшению моделей. Это, в свою очередь, усложняет процесс обучения и снижает эффективность ИИ-систем.

Эксперты подчеркивают, что обучение моделей для работы в сложной и многомерной среде требует данных, которые зачастую трудно получить. В связи с этим разработчики все чаще используют синтетические данные, создаваемые с помощью виртуального моделирования реальных сценариев - например, для обучения роботов и беспилотных автомобилей.

В то же время использование некачественных данных может привести к непредсказуемым результатам. Как отмечает Fortune, проблемы с качеством данных стали одной из причин, по которой OpenAI прекратила поддержку видеоприложения Sora: модель испытывала трудности с пониманием физических закономерностей и не обеспечивала реалистичных прогнозов.

В публикации подчеркивается, что ключевым фактором дальнейшего прогресса становится способность эффективно отбирать и обрабатывать данные. Для этого необходимы инструменты, позволяющие очищать, структурировать и анализировать информацию, выделяя действительно ценные элементы.

Таким образом, именно доступ к качественным данным становится главным ограничением для развития ИИ. Компании, которые смогут эффективно решить эту задачу, получат значительное преимущество в создании по-настоящему работающих интеллектуальных систем, отмечает издание.

Новости