███╗ ███╗███████╗███╗ ██╗ █████╗ ██████╗███████╗ ████╗ ████║██╔════╝████╗ ██║██╔══██╗██╔════╝██╔════╝ ██╔████╔██║█████╗ ██╔██╗ ██║███████║██║ █████╗ ██║╚██╔╝██║██╔══╝ ██║╚██╗██║██╔══██║██║ ██╔══╝ ██║ ╚═╝ ██║███████╗██║ ╚████║██║ ██║╚██████╗███████╗ ╚═╝ ╚═╝╚══════╝╚═╝ ╚═══╝╚═╝ ╚═╝ ╚═════╝╚══════╝
В 1961 году Дональд Мичи создал «машину» для игры в крестики-нолики из 304 спичечных коробков и цветных бусин. Без компьютеров. Без кода. Только физические объекты и простое правило обучения.
Она научилась играть в крестики-нолики методом проб и ошибок — и это работало.
Недавно я реализовал MENACE (Machine Educable Noughts And Crosses Engine) на TypeScript, и этот опыт научил меня большему об обучении с подкреплением, чем любой туториал по нейросетям.
Физический MENACE был прекрасно прост:
Вот и всё. Никаких градиентов. Никакого обратного распространения. Никаких нейросетей. Только бусины и спичечные коробки.
И он учился. После примерно 200 игр MENACE становился практически непобедимым.
Основная идея прекрасно переводится в код. Вместо спичечных коробков и бусин используем объекты и числа.
Ключевой инсайт: количество бусин = вес вероятности для этого хода.
Если центральная клетка имеет 10 бусин, а угол 5, ИИ в два раза вероятнее сыграет в центр.
Одна из крутейших частей: мозг сохраняется между сессиями. Когда закрываешь страницу и возвращаешься, MENACE помнит всё, чему научился.
Это создаёт мощный цикл: чем больше играешь, тем умнее он становится. Оставь его на несколько сотен игр, и его станет почти невозможно победить.
Современный ИИ стал невероятно сложным. Но в своей основе он всё ещё делает то, что делал MENACE: пробует разное, смотрит, что работает, и корректирует вероятности.
Мы добавили слои сложности — нейросети, обратное распространение, градиентный спуск — но фундаментальная идея остаётся: учиться на опыте.
Я создал живую реализацию, с которой можно поиграть. Смотри, как MENACE учится в реальном времени:
Совет: Дай ему проиграть первые 20-30 игр. Смотри, как он адаптируется. К игре 100 тебе будет сложно его победить.
Это обучение с подкреплением в действии — никаких изменений кода, только опыт.
Создание MENACE оказалось одним из тех редких проектов, где реализация была даже более образовательной, чем я ожидал.
Это напоминание, что ИИ не обязательно должен быть чёрным ящиком нейросетей, обученных на миллионах примеров. Иногда простейшие алгоритмы — те, которые можно объяснить спичечными коробками и бусинами — самые элегантные.
И в 2025, когда мы тонем в трансформерных моделях и сетях с миллиардами параметров, есть что-то освежающее в ИИ, который можно полностью понять за полдня.
Дональд Мичи был на правильном пути в 1961. Нам стоит это помнить.