» » Какой размер у шахматных фигур. Определяем веса шахматных фигур регрессионным анализом. Как ходит ферзь в шахматах

Какой размер у шахматных фигур. Определяем веса шахматных фигур регрессионным анализом. Как ходит ферзь в шахматах

Многих новичков беспокоят различные вопросы о том, Как ходят фигуры - это основа всех перемещений и ходов. Именно с этого и начинается обучение. Стоит остановиться на них подробнее.

Всего существует 6 пешка, ладья (или тура), слон (его еще называют офицером), конь, ферзь (иначе королева) и король. Все они ходят по-разному. Также имеются свои тонкости в передвижениях в зависимости от игровой ситуации. Итак, поговорим о каждом в отдельности.

Пешка

Как ходят из второго ряда? Пешки самые многочисленные (их 8 штук), но и самые слабые персонажи. Идти они могут только вперед и только на одну клетку. Вернуться назад им уже нельзя. Бьют данные фигуры несколько иначе - смещаясь по диагонали. Единственный случай, когда пешка может прыгнуть на 2 клетки вперед - это в самом начале боя, совершая свой первый ход.

С другой стороны, пешка, достигнувшая противоположного края доски, может превратиться в любую другую фигуру. Чаще всего шахматисты останавливают выбор на ферзе из-за его универсальности, но, если потребует игровая ситуация, «рядовой» может стать и офицером, и ладьей, и конем.

Тура

Перейдем к первому ряду. Как ходят фигуры в шахматах, спрятанные за пешками? Тура ходит по прямой, как горизонтально, так и вертикально. Количество клеток, которое она может перешагнуть, неограниченно. Остановиться она также способна в любой точке. Движение назад не запрещено. Но ладья не может перепрыгивать через другие фигуры. Бьет она по ходу: идет по прямой, уничтожает соперника и занимает его место. Все это не отклоняясь от своей линии движения.

Есть особенный ход - рокировка. В нем могут принимать участие только не делавшие хода король и тура. Если один из них или оба уже двигались по полю, то рокировка не может состояться. Суть данного перемещения в том, что король сдвигается на 2 клетки к туре, а та переставляется за короля. Это единственный случай, когда в пределах одного хода задействованы сразу 2 фигуры.

Конь

Продолжим изучать шахматы. Как ходят фигуры, о которых слышали даже далекие от игры люди? Перемещение коня похоже на букву «Г». Он перепрыгивает через 2 клетки и встает на третью, перпендикулярно предыдущему движению. Шаг может быть сделан как вертикально, так и горизонтально. Повернуть конь также способен в любую сторону. Поэтому у данной фигуры, стоящей в центре поля, есть 8 вариантов передвижений. В результате хода конь всегда оказывается на поле противоположного цвета.

Еще одно преимущество коня - он может перепрыгивать через другие фигуры, в том числе и вражеские, не съедая их. Без последствий для себя он атакует ферзя, ладью или слона, т. к. они ходят совсем иначе и не смогут настигнуть хитреца. Чтобы бить, конь должен занять место атакуемой фигуры. В противном случае он просто через нее перепрыгнет.

Офицер

Как ходят фигуры в шахматах, если это слоны? По диагоналям. У каждого игрока есть «белый» и «черный» слон. Такое название дается из-за начального цвета поля, на котором стоит фигура. Изменить его невозможно. Офицер не может перепрыгивать через другие фигуры. В остальном его перемещения не ограничены: в любом диагональном направлении на какое угодно количество клеток. Чтобы съесть вражескую фигуру, стоящую на пути офицера, нужно поставить его на ее место.

Ферзь

Самая маневренная и мощная фигура. Ходит так же, как слон и ладья, вместе взятые. То есть по вертикали, горизонтали и диагонали на любое количество клеток и во всех направлениях. У него есть только одно ограничение: нельзя перепрыгивать через фигуры. В случае опасности ферзь может скрыться в любом направлении. При необходимости - атаковать с какой угодно точки доски. Ферзь - самое сильное оружие в руках шахматиста.

Король

Самая важная и требующая постоянной защиты фигура. Ей и завершим изучение вопроса о том, как ходят фигуры в шахматах. У короля практически нет возможности скрыться, т. к. он может переместиться только на 1 клетку. Конечно, ходить он может в любом направлении: по диагонали, вертикали или горизонтали. Но и контролировать его тоже довольно легко при условии значительного удаления. Король ест вражеские фигуры так же, как и ходит, - перемещаясь на 1 клетку. Вот все, что можно сказать про то, как ходят фигуры в шахматах.

Именно с королем связано окончание игры. Ему ставят мат. Это означает, что самая главная фигура находится под ударом, и скрыться ей негде: кругом противники. Своих фигур, за которыми можно спрятаться, тоже нет поблизости. Если создается такое положение, партия заканчивается. А тот, кому поставили мат, считается проигравшим.

Шах - это такое положение, когда король под ударом, но он может уйти или заслониться. Также не исключено, что угрожающую фигуру можно съесть. Короля нельзя оставлять под ударом. Как ходят шахматные фигуры в этом случае? Все действия игрока должны быть направлены на защиту короля.

Пат - очень интересная ситуация в игре. В этом случае сам король не под ударом, ему не объявлен шах, но и ходить ему некуда: все остальные клетки контролируются вражескими фигурами. Свита при этом тоже не может прийти на помощь. Пат засчитывают за ничью, партия заканчивается.

Вот и все, что касается основного элемента при игре в шахматы. Как ходят фигуры, известно, можно приступать к партии.

В шахматах существует шесть разных (видов или наименований) фигур - король, ферзь, ладья, слон, конь и пешка. В шахматы играют два соперника; один играет белыми фигурами, другой чёрными. У каждого игрока 16 фигур - один король, один ферзь, две ладьи, два слона, два коня и восемь пешек. Каждая из этих фигур ходит по шахматной доске по-своему.

Описания фигур:

Король

Ходит на одно поле в любом направлении. Кроме того, может участвовать в рокировке. Самая важная фигура, поскольку невозможность защитить короля от атаки противника (эта ситуация называется «мат») означает проигрыш партии. В комплекте шахматных фигур король обычно - самая высокая фигура, либо одна из двух самых высоких фигур (вторая - ферзь).

Ферзь


Ходит на любое число полей по вертикали, горизонтали или диагонали (соединяет в себе ходы ладьи и слона). В общем случае, самая сильная фигура на шахматной доске. Изначально (в старом арабском шатрандже) ферзь ходил лишь на одно поле по диагонали; превращение его в наиболее сильную фигуру произошло уже в европейских шахматах. В современной шахматной теории ферзь относится к «тяжёлым фигурам», наряду с ладьёй. Внешний вид фигуры в традиционных «стаунтоновских» шахматах аналогичен королю, но фигура увенчана небольшим шариком и обычно несколько ниже, в отличие от короля, который, как правило, выше ферзя и увенчан крестом.

Ладья

Ходит на любое число полей по вертикали или горизонтали. Может участвовать в рокировке. Игрок начинает партию с двумя ладьями, стоящими на крайних полях первой горизонтали. Как и ферзь, относится теорией к «тяжёлым фигурам». Фигура обычно имеет вид стилизованной круглой крепостной башни (что соответствует европейскому её названию, с разных языков переводящимся именно как «крепостная башня»). В старых русских шахматных комплектах имела вид стилизованного корабля (ладьи). По некоторым предположениям, различные наименования данной фигуры связаны с её первоначальным названием и видом. В чатуранге она называлась «колесница», то есть «ратх». В арабском шатрандже название превратилось в «Рух» (имелась в виду мифическая птица). Её стилизованные изображения, по предположениям шахматных историков, на Руси были приняты за изображения визуально похожей русской ладьи, от чего и произошло русское название фигуры. В Европе же изображение фигуры было связано с названием, созвучным с «rook» (утёс, башня), в результате соответствующая европейская шахматная фигура стала изображаться в виде крепостной башни.

Слон

Ходит на любое число полей по диагоналям. В чатуранге и шатрандже ходил через одно поле по диагонали, являясь, как и конь, «прыгающей» фигурой (при ходе перешагивал через свои и чужие фигуры, стоящие на пути). В начале игры у игрока есть два слона - белопольный и чёрнопольный. В силу геометрии шахматной доски, слоны перемещаются только по диагоналям своего цвета. Относится к классу «лёгких фигур», вместе с конём. Фигура обычно ниже короля и ферзя, верхняя часть имеет вид капли (или капюшона) заострением вверх, представляет собой стилизацию одеяния католических и протестантских священников, что соответствует английскому названию «bishop» - «епископ».

Конь

Ходит русской буквой «Г» (или буквой "L") - сначала на два поля по вертикали или горизонтали, потом ещё на одно поле по горизонтали или вертикали перпендикулярно первоначальному направлению. Единственная фигура в современных шахматах, которая ходит не по прямой линии и является «прыгающей» - может «перепрыгивать» через свои и неприятельские фигуры. Одна из двух фигур (вторая - король), ход которой не изменился со времён чатуранги. В начале партии у каждого игрока два коня, стоящих на вторых слева и справа полях первой от него горизонтали. Относится к «лёгким фигурам». Фигура имеет вид головы коня на подставке. Английское название «knight» - рыцарь.

Пешка

Ходит на одно поле по вертикали вперёд. Из исходного положения может сделать один ход на два поля вперёд. Бьёт на одно поле по диагонали вперёд. При выполнении хода на два поля может быть следующим ходом взята на проходе пешкой противника (т. н. взятие «энпассан»). Единственная фигура в шахматах, у которой тихий ход и ход со взятием различаются. В комплекте фигур у каждого игрока по восемь пешек, в начальной позиции пешки стоят на второй от игрока горизонтали, прикрывая фигуры. Если в процессе игры пешка достигает последней горизонтали, то она превращается в любую фигуру, по желанию игрока, кроме короля. За редкими исключениями, обычно пешку превращают в ферзя. Фигура самая маленькая из всех в комплекте. Несмотря на слабость, пешки очень важны в шахматной партии, так как зачастую составляют основу оборонительной структуры игрока, являясь и «наполнителем» поля, и «пушечным мясом». В эндшпиле роль пешек многократно возрастает обычно за счёт того, что часть из них являются так называемыми «проходными пешками», потенциально способными достигнуть последней горизонтали и превратиться в фигуру.

Классификация

Фигуры делятся на:

  1. Лёгкие фигуры - конь и слон.
  2. Тяжёлые фигуры - ладья и ферзь.
  3. Король - из-за своей особой роли в партии не относится ни к лёгким, ни к тяжёлым фигурам.
  4. Пешка - так же, как и король, не относится ни к лёгким, ни к тяжёлым фигурам.

В терминологии имеется неоднозначность: в узком смысле фигурами называются все шахматные фигуры, кроме пешек. Обычно слово «фигура» в комментарии к шахматной партии употребляется именно в этом смысле, например, выражение типа «потеря фигуры» означает потерю лёгкой или тяжёлой фигуры, но не пешки.

Сравнительная сила фигур

Проблема сравнительной силы и ценности тех или иных групп фигур постоянно возникает в шахматных партиях, когда стоит вопрос о размене. В шахматной теории силу фигур принято измерять в пешках. Общеприняты следующие примерные соотношения:


Следует учитывать, что приведённые соотношения вовсе не достаточны для объективной оценки тех или иных действий в конкретной партии. В игре к ним добавляются многочисленные дополнительные соображения. На сравнительную ценность фигур может влиять тип разыгрываемой позиции, этап партии, на котором производится размен, положение конкретных фигур. Так, практически любая фигура в центре доски держит под ударом больше полей, чем на стороне и, тем более, в углу, поэтому размен своей угловой фигуры на равнозначную центральную фигуру противника может быть выгодным. Конь и слон формально считаются равноценными, но на практике их сравнительная ценность очень сильно зависит от ситуации. Два слона почти всегда сильнее двух коней. Слон сильнее коня в игре против пешек, слон и пешки сильнее в игре против ладьи противника, чем конь и то же количество пешек. Слон и ладья обычно сильнее, чем конь и ладья, однако ферзь и конь часто оказываются сильнее, чем ферзь и слон. Двумя слонами можно дать мат одинокому королю, двумя конями - нет. В шахматах действия дальнобойных фигур почти всегда ограничены другими фигурами, в то время как конь может перепрыгивать через них. От шаха коня невозможно закрыться - нужно либо отходить королем, либо забирать коня.

Здравствуй, Хабр!

В этой статье речь пойдёт о небольшом программистском этюде на тему машинного обучения. Замысел его возник у меня при прохождении известного здесь многим курса «Machine Learning» , читаемого Andrew Ng на Курсере. После знакомства с методами, о которых рассказывалось на лекциях, захотелось применить их к какой-нибудь реальной задаче. Долго искать тему не пришлось - в качестве предметной области просто напрашивалась оптимизация собственного шахматного движка.

Вступление: о шахматных программах


Не будем детально углубляться в архитектуру шахматных программ - это могло бы стать темой отдельной публикации или даже их серии. Рассмотрим только самые базовые принципы. Основными компонентами практически любого небелкового шахматиста являются поиск и оценка позиции .

Поиск представляет собой перебор вариантов, то есть итеративное углубление по дереву игры. Оценочная функция отображает набор позиционных признаков на числовую шкалу и служит целевой функцией для поиска наилучшего хода. Она применяется к листьям дерева, и постепенно «возвращается» к исходной позиции (корню) с помощью альфа-бета процедуры или её вариаций.

Строго говоря, настоящая оценка может принимать только три значения: выигрыш, проигрыш или ничья - 1, 0 или ½. По теореме Цермело для любой заданной позиции она определяется однозначно. На практике же из-за комбинаторного взрыва ни один компьютер не в состоянии просчитать варианты до листьев полного дерева игры (исчерпывающий анализ в эндшпильных базах данных - это отдельный случай; 32-фигурных таблиц в обозримом будущем не появится… и в необозримом, скорее всего, тоже). Поэтому программы работают в так называемой модели Шеннона - пользуются усечённым деревом игры и приближённой оценкой, основанной на различных эвристиках.

Поиск и оценка не существуют независимо друг от друга, они должны быть хорошо сбалансированы. Современные переборные алгоритмы давно уже не являются «тупым» перебором вариантов, они включают в себя многочисленные специальные правила, связанные в том числе и с оценкой позиции.

Первые такие усовершенствования поиска появились ещё на заре шахматного программирования, в 60-х годах XX в. Можно упомянуть, например, технику форсированного варианта (ФВ) - продление отдельных ветвей поиска до тех пор, пока позиция не «успокоится» (закончатся шахи и взаимные взятия фигур). Продления существенно увеличивают тактическую зоркость компьютера, а также приводят к тому, что дерево поиска становится очень неоднородным - длина отдельных ветвей может в несколько раз превышать длину соседних, менее перпективных. Другие улучшения поиска, наоборот, представляют собой отсечения или сокращения поиска - и здесь критерием отбрасывания плохих вариантов может, в числе прочего, служить всё та же статическая оценка.

Параметризация и улучшение поиска методами машинного обучения - отдельная интересная тема, но сейчас мы оставим её в стороне. Займёмся пока только оценочной функцией.

Как компьютер оценивает позицию


Статическая оценка представляет собой линейную комбинацию различных признаков позиции, взятых с некоторыми весовыми коэффициентами. Какие это признаки? В первую очередь, количество фигур и пешек у той и другой стороны. Следующий важный признак - положение этих фигур, централизация, занятие дальнобойными фигурами открытых линий и диагоналей. Опыт показывает, что учёт только этих двух факторов - суммы материала и относительной ценности полей (зафиксированной в виде таблиц для каждого типа фигур) - при наличии качественного поиска уже может обеспечивать силу игры в диапазоне до 2000-2200 пунктов Эло. Это уровень хорошего первого разряда или кандидата в мастера.

Дальнейшее уточнение оценки может включать всё более и более тонкие признаки шахматной позиции: наличие и продвинутость проходных пешек, близость фигур к позиции неприятельского короля, его пешечное прикрытие и т. д. Легендарная «Каисса», первая чемпионка мира среди программ (1974) имела оценочную функцию из нескольких десятков признаков . Все они подробно описаны в книге «Машина играет в шахматы», библиографическая ссылка на которую приводится в конце статьи.


Одна из самых «навороченных» оценочных функций была у машины Deep Blue, прославившейся своими матчами с Каспаровым в 1996-97 гг. (подробную историю этих матчей можно прочитать в недавней серии статей на Geektimes .)

Широко распространено мнение, что сила Deep Blue основывалась исключительно на колоссальной скорости перебора вариантов. 200 миллионов позиций в секунду, полный (без отсечений) перебор на 12 полуходов - к таким параметрам шахматные программы на современном железе только-только приближаются. Однако, дело было не только в быстродействии. По объёму «шахматных знаний» в оценочной функции эта машина также намного превосходила всех. Оценка Deep Blue была реализована аппаратно и включала до 8000 различных признаков. Для настройки её коэффициентов привлекались сильные гроссмейстеры (достоверно известно о работе с Джоэлем Бенджамином, тестовые партии с разными версиями машины играл Давид Бронштейн).

Не располагая такими ресурсами, как создатели Deep Blue, ограничим задачу. Из всех признаков позиции, учитываемых для подсчёта оценки, возьмём самый значимый - соотношение материала на доске.

Стоимость фигур: простейшие модели

Если взять любую шахматную книгу для начинающих, сразу за главой с объяснением шахматных ходов обычно приводится табличка сравнительной ценности фигур, примерно такая:
Королю иногда приписывается конечная стоимость, заведомо бóльшая, чем сумма всего материала на доске - например, 200 единиц. В данном исследовании мы оставим Его Величество в покое, и рассматривать королей не будем вообще. Почему? Ответ простой: они всегда присутствуют на доске, поэтому их материальная оценки взаимно вычитаются, и на общий баланс сил не влияют.

Приведённые стоимости фигур должны рассматриваться только как некоторые базовые ориентиры. В реальности фигуры могут «дорожать» и «дешеветь» в зависимости от ситуации на доске, а также от стадии партии. В качестве поправки первого порядка обычно рассматривают комбинации из двух-трёх фигур - своих и противника.

Вот как оценивал различные сочетания материала в своём классическом «Учебнике шахматной игры» третий чемпион мира :


С точки зрения общей теории слона и коня следует считать одинаково ценными, хотя, по моему убеждению, слон в большинстве случаев оказывается более сильной фигурой. Между тем считается вполне установленным, что два слона почти всегда сильнее двух коней.

Слон в игре против пешек сильнее коня, а вместе с пешками также оказывается более сильным против ладьи, нежели конь. Слон и ладья тоже сильнее коня и ладьи, но ферзь и конь могут оказаться сильнее, чем ферзь и слон. Слон часто стоит больше трех пешек, о коне же это редко можно сказать; он даже может оказаться слабее трех пешек.

Ладья по силе равна коню и двум пешкам или же слону и двум пешкам, но, как сказано выше, слон в борьбе против ладьи сильнее коня. Две ладьи несколько сильнее ферзя. Они немного слабее двух коней и слона и еще слабее двух слонов и коня. Сила коней падает по мере размена фигур на доске, сила же ладьи, напротив, возрастает.

Наконец, как правило, три легкие фигуры сильнее ферзя.

Оказывается, большей части подобных правил можно удовлетворить, оставаясь в рамках линейной модели, и просто слегка сместив стоимости фигур от их «школьных» значений. Например, в одной из статей приводятся следующие граничные условия:

B > N > 3P B + N = R + 1.5P Q + P = 2R
И значения, им удовлетворяющие:

P = 100 N = 320 B = 330 R = 500 Q = 900 K = 20000


Имена переменных соответствуют обозначениям фигур в английской нотации: P - пешка, N - конь, B - слон, R - ладья, Q - ферзь, K - король. Стоимости здесь и далее указаны в сотых долях пешки.

На самом деле, приведённый набор значений не является единственным решением. Более того, даже несоблюдение каких-то из «неравенств им. Капабланки» не приведёт к резкому падению силы игры программы, а только повлияет на её стилевые особенности.

В качестве эксперимента я провёл небольшой матч-турнир четырёх версий своего движка GreKo с разными весами фигур против трёх других программ - каждая из версий сыграла 3 матча по 200 партий со сверхмалым контролем времени (1 секунда + 0.1 сек. на ход). Результаты приведены в таблице:

Версия Пешка Конь Слон Ладья Ферзь vs. Fruit 2.1 vs. Crafty 23.4 vs. Delfi 5.4 Рейтинг
GreKo 12.5 100 400 400 600 1200 61.0 76.0 71.0 2567
GreKo A 100 300 300 500 900 55.0 69.0 73.0 2552
GreKo B 100 320 330 500 900 57.0 71.0 64.0 2548
GreKo C 100 325 325 550 1100 72.5 74.5 69.0 2575
Мы видим, что некоторые вариации в весах фигур приводят к колебаниям силы игры в диапазоне 20-30 пунктов Эло. Более того, одна из тестовых версий показала даже лучший результат, чем основная версия программы. Впрочем, однозначно утверждать об усилении игры на таком малом количестве партий преждевременно - доверительный интервал вычисления рейтинга составляет сравнимую величину в несколько десятков пунктов Эло.

«Классические» стоимости шахматного материала были получены интуитивно, путём осмысления шахматистами своего практического опыта. Предпринимались также попытки подвести под эти значения какую-то математическую базу - например, на основе мобильности фигур, числа полей, которые они могут держать под контролем. Мы же попробуем подойти к вопросу экспериментально - на базе анализа большого количества шахматных партий. Для вычисления стоимостей фигур нам не понадобится приближённая оценка позиций из этих партий - только их результаты, как самая объективная мера успеха в шахматах.

Материальный перевес и логистическая кривая

Для статистического анализа был взят PGN-файл, содержащий почти 3000 шахматных партий в блиц между 32 разными шахматными движками, в диапазоне от 1800 до 3000 пунктов Эло. С помощью специально написанной утилиты для каждой партии был составлен список материальных соотношений, возникших на доске. Каждое соотношение материала попадало в статистику не сразу после взятия фигуры или превращения пешки - сначала должны были произойти ответные взятия или несколько «тихих» ходов. Таким образом отфильтровывались краткосрочные «скачки материала» на 1-2 хода при разменах.

Затем по уже известной нам шкале «1-3-3-5-9» рассчитывался материальный баланс позиции, и для каждого его значения (от -24 до 24) накапливалось количество очков, набранных белыми. Полученная статистика представлена на следующем графике:

По оси x - материальный баланс позиции ΔM с точки зрения белых, в пешках. Он вычисляется как разность суммарной стоимости всех белых фигур и пешек и такой же величины для чёрных. По оси y - выборочное математическое ожидание результата партии (0 - победа чёрных, 0.5 - ничья, 1 - победа белых). Мы видим, что экспериментальные данные очень хорошо описываются логистической кривой :

Простой визуальный подбор позволяет определить параметр кривой: α=0.7 , размерность его - обратные пешки.
Для сравнения на графике приведены ещё две логистические кривые с другими значениями параметра α .

Что это означает на практике? Пусть мы видим случайно выбранную позицию, в которой у белых перевес в 2 пешки (ΔM = 2 ). С вероятностью, близкой к 80%, мы можем утверждать: партия закончится победой белых. Аналогично, если у белых не хватает слона или коня (ΔM = -3 ), их шансы не проиграть всего лишь около 12%. Позиции с материальным равенством (ΔM = 0 ), как и можно было ожидать, чаще всего заканчиваются вничью.

Постановка задачи

Теперь мы готовы сформулировать задачу оптимизации оценочной функции в терминах логистической регрессии.
Пусть нам дан набор векторов следующего вида:

Где Δ i , i = P...Q - разность количества белых и чёрных фигур типа i (от пешки до ферзя, короля не считаем). Эти вектора представляют собой материальные соотношения, встретившиеся в партиях (одной партии обычно соответствует несколько векторов).

Пусть дан также вектор y j , компоненты которого принимают значения 0, 1 и 2. Эти значения соответствуют исходам партий: 0 - победа чёрных, 1 - ничья, 2 - победа белых.

Требуется найти вектор θ стоимостей фигур:

Минимизирующий функцию стоимости для логистической регрессии:

,
где
- логистическая функция для векторного аргумента.

Для предотвращения «переобучения» и эффектов неустойчивости в найденном решении в функцию стоимости можно добавить параметр регуляризации, не дающий коэффициентам в векторе принимать слишком большие значения:

Величина коэффициента при параметре регуляризации выбирается небольшая, в данном случае использовалось значение λ=10 -6 .

Для решения задачи минимизации применим простейший метод градиентного спуска с постоянным шагом:

Где компоненты градиента функции J reg имеют вид:

Так как мы ищем симметричное решение, при материальном равенстве дающее вероятность исхода партии ½, нулевой коэффициент вектора θ полагаем всегда равным нулю, и нам для градиента нужно только второе из данных выражений.

Вывод приведённых формул мы здесь рассматривать не будем. Всем интересующимся их обоснованием настоятельно рекомендую уже упоминавшийся курс по машинному обучению на Coursera.

Программа и результаты

Так как первая часть задачи - разбор PGN-файлов и выделение для каждой позиции набора признаков - уже была практически реализована в коде шахматного движка, оставшуюся часть было решено также написать на C++. Исходный код программы и тестовые наборы партий в PGN-файлах доступны на github . Программа может быть собрана и запущена под Windows (MSVC) или Linux (gcc).

Возможность использовать в дальнейшем специализированные средства вроде Octave, MATLAB, R и т.п. также предусмотрена - в процессе работы программа генерирует промежуточный текстовый файл с наборами признаков и исходами партий, который легко может быть импортирован в эти среды.

Файл содержит текстовое представление набора векторов x j - матрицы размерности m x (n + 1) , в первых 5 столбцах которой содержатся компоненты материального баланса (от пешки до ферзя), а в 6-м - результат партии.

Рассмотрим простой пример. Ниже приводится PGN-запись одной из тестовых партий.

1. d4 d5 2. c4 e6 3. e3 c6 4. Nf3 Nd7 5. Nbd2 Nh6 6. e4 Bb4 7. a3 Ba5 8. cxd5 exd5 9. exd5 cxd5 10. Qe2+ Kf8 11. Qb5 Nf6 12. Bd3 Qe7+ 13. Kd1 Bb6 14. Re1 Bd7 15. Qb3 Be6 16. Re2 Qc7 17. Qb4+ Kg8 18. Nb3 Bf5 19. Bb1 Bxb1 20. Rxb1 Nf5 21. Bd2 a5 22. Qa4 h6 23. Rc1 Qb8 24. Bxa5 Qf4 25. Qb4 Bxa5 26. Nxa5 Kh7 27. Nxb7 Rab8 28. a4 Ne4 29. h3 Rhc8 30. Ra1 Rc7 31. Qa3 Rcxb7 32. g3 Qc7 33. Rc1 Qa5 34. Rxe4 dxe4 35. Rc5 Qa6 36. Nd2 Nxd4 37. Rc4 Nb3 38. Nxb3 Qxc4 39. Nd2 Rd8 40. Qc3 Qf1+ 41. Kc2 Qe2 42. f4 e3 43. b4 Rc7 44. Kb3 Qd1+ 45. Ka2 Rxc3 46. Nb1 Qxa4+ 47. Na3 Rc2+ 48. Ka1 Rd1# 0-1
Соответствующий фрагмент промежуточного файла имеет вид:

0 0 0 0 0 0 1 0 0 0 0 0 2 0 0 0 0 0 2 -1 0 0 0 0 2 0 0 -1 0 0 1 0 0 -1 0 0 1 1 0 -2 0 0
В 6-м столбце везде 0 - это результат партии, победа чёрных. В остальных столбцах - баланс числа фигур на доске. В первой строке полное материальное равенство, все компоненты равны 0. Вторая строка - лишняя пешка у белых, это позиция после 24-го хода. Обратим внимание, что предшествующие размены никак не отражены, они происходили слишком быстро. После 27-го хода у белых уже 2 лишних пешки - это строка 3. И т.д. Перед заключительной атакой чёрных у белых пешка и конь за две ладьи:

Как и размены в дебюте, финальные ходы в партии на содержимое файла не повлияли. Они были отсеяны «фильтром тактики», потому что представляли собой серию взятий, шахов и уходов от них.

Такие же записи создаются для всех анализируемых партий, в среднем получается по 5-10 строк на игру. После разбора PGN-базы с партиями этот файл поступает на вход второй части программы, занимающейся собственно решением задачи минимизации.

В качестве начальной точки для градиентного спуска можно, например, взять вектор со значениями весов фигур из учебника. Но интереснее не давать алгоритму никаких подсказок, и стартовать из нуля. Оказывается, наша функция стоимости достаточно «хорошая» - траектория быстро, за несколько тысяч шагов, выходит на глобальный минимум. Как изменяются при этом стоимости фигур, показано на следующем графике (на каждом шаге выполнялась нормировка на вес пешки = 100):

График сходимости функции стоимости


Текстовый вывод программы

C:\CHESS>pgnlearn.exe OpenRating.pgn Reading file: OpenRating.pgn Games: 2997 Created file: OpenRating.mat Loading dataset... [ 20196 x 5 ] Solving (gradient method)... Iter 0: [ 0 0 0 0 0 ] -> 0.693147 Iter 1000: [ 0.703733 1.89849 2.31532 3.16993 6.9148 ] -> 0.470379 Iter 2000: [ 0.735853 2.08733 2.51039 3.47418 7.7387 ] -> 0.469398 Iter 3000: [ 0.74429 2.13676 2.56152 3.55386 7.95879 ] -> 0.46933 Iter 4000: [ 0.746738 2.15108 2.57635 3.57697 8.02296 ] -> 0.469324 Iter 5000: [ 0.747467 2.15535 2.58077 3.58385 8.0421 ] -> 0.469324 Iter 6000: [ 0.747685 2.15663 2.58209 3.58591 8.04785 ] -> 0.469324 Iter 7000: [ 0.747751 2.15702 2.58249 3.58653 8.04958 ] -> 0.469324 Iter 8000: [ 0.747771 2.15713 2.58261 3.58672 8.0501 ] -> 0.469324 Iter 9000: [ 0.747777 2.15717 2.58265 3.58678 8.05026 ] -> 0.469324 Iter 10000: [ 0.747779 2.15718 2.58266 3.58679 8.0503 ] -> 0.469324 PIECE VALUES: Pawn: 100 Knight: 288.478 Bishop: 345.377 Rook: 479.66 Queen: 1076.56 Press ENTER to finish


После нормировки и округления получаем следующий набор величин:
Проверим, выполняются ли «правила Капабланки»?
Соотношение Численные значения Выполняется?
B > N 345 > 288 да
B > 3P 345 > 3 * 100 да
N > 3P 288 < 3 * 100 нет
B + N = R + 1.5P 345 + 288 ~= 480 + 1.5 * 100 да (с погрешностью < 0.5%)
Q + P = 2R 1077 + 100 > 2 * 480 нет
Результат вполне обнадёживающий. Не зная ничего о реально происходящих на доске событиях, рассматривая только исходы партий и снятый с доски материал наш алгоритм сумел вывести стоимости фигур, достаточно близкие к их традиционным значениям.

Можно ли полученные значения использовать для усиления игры программы? Увы, на данном этапе ответ отрицательный. Тестовые блиц-матчи показывают, что сила игры GreKo от использования найденных параметров практически не изменилась, а в ряде случаев даже снизилась. Почему так произошло? Одна из очевидных причин - уже упоминавшаяся тесная связь поиска и оценки позиции. В поиске движка заложен целый ряд эвристик для отсечения неперспективных ветвей, и критерии этих отсечений (пороговые значения) тесно завязаны на статическую оценку. Меняя стоимости фигур, мы резко сдвигаем масштаб величин - форма дерева поиска меняется, требуется новая балансировка констант для всех эвристик. Это достаточно трудоёмкая задача.

Эксперимент с партиями людей

Попробуем расширить наш эксперимент, рассмотрев игры не только компьютеров, но и людей. В качестве массива данных для обучения возьмём партии двух выдающихся современных гроссмейстеров - чемпиона мира Магнуса Карлсена и экс-чемпиона Ананда Вишванатана , а также представителя романтических шахмат XIX столетия Адольфа Андерсена .


Ананд и Карлсен соперничают за мировую корону

В таблице ниже представлены результаты решения регрессионной задачи для партий этих шахматистов.
Легко заметить, что «человеческие» значения стоимости фигур оказались вовсе не такими, каким учат начинающих в учебниках. В случае Карлсена и Ананда бросается в глаза меньший масштаб шкалы - ферзь стоит чуть больше 7.5 пешек, соответственно сжался весь диапазон для других фигур. Слон по-прежнему чуть дороже коня, но и тот, и другой не дотягивают до традиционных трёх пешек. Две ладьи оказываются слабее ферзя, и т.д.

Надо сказать, что похожая картина наблюдается не только у Виши и Магнуса, но и для большинства гроссмейстеров, партии которых удалось протестировать. Причём какой-то зависимости от стиля не выяснилось. Значения смещены от классических в одну и ту же сторону и у позиционных мастеров вроде Михаила Ботвинника и Анатолия Карпова, и у атакующих шахматистов - Михаила Таля, Юдит Полгар…

Одним из немногих исключений стал Адольф Андерсен - лучший европейский игрок середины XIX века, автор знаменитой «вечнозелёной партии» . Вот для него значения стоимости фигур оказались очень близки к тем, которые используют компьютерные программы. Напрашиваются самые разнообразные фантастические гипотезы, вроде тайного читерства немецкого маэстро через портал во времени… (Шутка, конечно. Адольф Андерсен был крайне порядочным человеком, и никогда бы себе такого не позволил.)


Адольф Андерсен (1818-1879),
человек-компьютер

Почему наблюдается такой эффект со сжатием диапазона стоимости фигур? Конечно, не стоит забывать о крайней ограниченности нашей модели - учёт дополнительных позиционных факторов мог бы внести существенные коррективы. Но, возможно, дело в слабой технике реализации человеком материального перевеса - относительно современных шахматных программ, конечно. Проще говоря, человеку тяжело безошибочно играть ферзём, потому что у того слишком много возможностей. Вспоминается хрестоматийный анекдот о Ласкере (в других вариантах - Капабланке / Алехине / Тале), якобы игравшем с форой со случайным попутчиком в поезде. Кульминационной фразой было: «Ферзь только мешает!»

Заключение

Мы рассмотрели один из аспектов оценочной функции шахматных программ - стоимость материала. Убедились, что эта часть статической оценки в модели Шеннона имеет вполне «физический» смысл - она гладким образом (через логистическую функцию) связана с вероятностью исхода партии. Затем рассмотрели несколько распространённых комбинаций весов фигур, и оценили порядок их влияния на силу игры программы.

С помощью аппарата регрессии на партиях различных шахматистов, как живых так и компьютерных, мы определили оптимальные стоимости фигур в предположении чисто материальной оценочной функции. Обнаружили интересный эффект меньшей стоимости материала для людей по сравнению с машинами, и «заподозрили в читерстве» одного из шахматных классиков. Попробовали применить найденные значения в реальном движке и… не добились особого успеха.

Куда двигаться дальше? Для более точной оценки позиции можно добавлять в модель новые шахматные знания - то есть увеличивать размерность векторов x и θ . Даже оставаясь в области только материальных критериев (без учёта полей, занимаемых фигурами на доске), можно добавить целый ряд релевантных признаков: два слона, пара из ферзя и коня, пара из ладьи и слона, разноцвет, последняя пешка в эндшпиле… Шахматистам хорошо известно, как ценность фигур может зависеть от их сочетания или стадии партии. В шахматных программах соответствующие веса (бонусы или штрафы) могут достигать десятых долей пешки и более.

Один из возможных путей (наряду с увеличением размера выборки) - использовать для обучения партии, сыгранные предыдущей версией той же самой программы. В таком случае есть надежда на бóльшую согласованность одних признаков оценки с другими. Можно также в качестве функции стоимости использовать не успех предсказания исхода партии (которая может закончиться через несколько десятков ходов после рассматриваемой позиции), а корреляцию статической оценки с динамической - т.е. с результатом альфа-бета поиска на определённую глубину.

Однако, как уже было отмечено выше, для непосредственного усиления игры программы полученные результаты могут оказаться непригодными. Часто случается так: после обучения на сериях тестов программа начинает лучше решать тесты (в нашем случае - предсказывать результаты партий), но не лучше играть ! В настоящее время в шахматном программировании мейнстримом стало интенсивное тестирование исключительно в практической игре. Новые версии топ-движков перед выпуском тестируются на десятках и сотнях тысяч партий со сверхкороткими контролями времени…

В любом случае, я планирую провести ещё ряд экспериментов по статистическому анализу шахматных партий. Если данная тема представляет интерес для аудитории Хабра, при получении каких-либо нетривиальных результатов статья может получить продолжение.

В ходе исследований ни одна шахматная фигура не пострадала.

Библиография

Адельсон-Вельский, Г.М.; Арлазаров, В.Л.; Битман, А.Р. и др. - Машина играет в шахматы. М.: Наука, 1983
Книга авторов советской программы «Каисса», подробно описывающая как общие алгоритмические основы шахматных программ, так и конкретные детали реализации оценочной функции и поиска «Каиссы».

Корнилов Е. - Программирование шахмат и других логических игр. СПб.: БХВ-Петербург, 2005
Более современная и «практическая» книга, содержит большое количество примеров кода.

Feng-hsiung Hsu - Behind Deep Blue. Princeton University Press, 2002
Книга одного из создателей шахматной машины Deep Blue, в подробностях рассказывающая об истории её создания и внутреннем устройстве. В приложении приведены тексты всех шахматных партий, сыгранных Deep Blue в официальных соревнованиях.

Ссылки

Chessprogramming Wiki - обширная коллекция материалов по всем теоретическим и практическим аспектам шахматного программирования.

Machine Learning in Games - сайт, посвящённый машинному обучению в играх. Содержит большое количество научных статей по исследованиям в области шахмат, шашек, го, реверси, нардов и т.д.

Kaissa - страница, посвящённая «Каиссе». Детально представлены коэффициенты её оценочной функции.

Stockfish - сильнейшая на сегодня программа, с открытым исходным кодом.

A comparison of Rybka 1.0 beta and Fruit 2.1
Детальное сравнение внутреннего устройства двух популярных шахматных программ.

GreKo - шахматная программа автора статьи.
Была использована в качестве одного из источников тестовых компьютерных партий. Также на основе её генератора ходов и парсера PGN-нотации была изготовлена утилита для анализа экспериментальных данных.

pgnlearn - код утилиты и примеры файлов с партиями на github.

Эти фигуры подходят к вот этой классической шахматной доске.

В шахматах существует шесть разных фигур - король, ферзь, ладья, слон, конь и пешка. Всего в шахматах два набора фигур отличающихся по цвету: черные и белые. В каждом наборе 16 фигур - один король, один ферзь, две ладьи, два слона, два коня, и восемь пешек. Каждая из этих фигур ходит по шахматной доске по-своему.

Фигуры подразделяются на тяжелые и легкие. К легким относятся конь и слон, к тяжелым - ладья и ферзь, пешки фигурами называть не принято, и король из-за своей особой роли в партии ни к тяжелым ни к легким не относится.

Для того, чтобы распечатать картинку нажмите для увеличения. (Откроется в новом окне)

Расстановка шахматных фигур

Первый горизонтальный ряд занимают фигуры, второй - пешки.
Начиная с крайней левой клетки фигуры расставляются так:
Белые фигуры - Ладья, конь, слон, ферзь, король, слон, конь, ладья.
Черные фигуры - Ладья, конь, слон, король, ферзь, слон, конь, ладья.
Разница в местоположении короля и ферзя. Чтобы запомнить расстановку обычно говорят, что Ферзь любит свой цвет, то есть белый ферзь стоит на белом поле, черный - на черном.

Комментариев: 12

  1. Андрей пишет:

    Могу ли я использовать данные изображения для создания шахматной игры для своего сайта?

  2. admin пишет:

    Андрей, используйте. Если есть возможность - поставьте ссылку.

  3. Player пишет:

    Король не имеет право на рокировку, если он или ладья с которой производится рокировка уже делали ход. Так же нельзя делать рокировку, если поле через которое король перескакивает находится по боем фигуры противника.

  4. Вадим пишет:

    (admin)Скажите пожалуйсто уважаемый администратор сайта если я хочу взять картинку с сайта и вставить в нужное мне место обязательно ли внизу указывать ваш сайт?

  5. Елена пишет:

    А я могу использовать изображения некоторых шахматных фигур в своей книге?))

  6. AndryU пишет:

    Отличные фигуры. Могу ли я их использовать на своём сайте?

  7. admin пишет:

    Я не проверяю, кто и где в интернете использует мои рисунки шахматных фигур. Если они Вам нужны - пользуйтесь на здоровье.
    .

    Вадим, если Вы используете картинку с сайта напрямую, как вы описали, то дополнительную ссылку ставить не обязательно.

  8. Николай пишет:

    Добрый день,нетли у вас картинок шахматных фигур в векторном формате?
    Если можно пошлите их мне на почту
    Спасибо

  9. Ирэн пишет:

    А я воспользуюсь Вашей информацией в целях создания конспекта для моего 6-ти летнего сына:)) Спасибо за локаничные и важные объяснения!

  10. Рома пишет:

    Замечательные фигуры, зачот.

  11. я бох ты лох пишет:

    классные фигуры

  12. Татьяна пишет:

    Мой четырехлетний внук решил поиграть в шахматы. А я последний раз играла 40 лет назад. Сильно-сильно подзабыла. Пришлось выкручиваться. Отложила на время партию и благодаря Вам восстановила в память основные моменты. Партия длилась недолго, но судя по всему придется не раз к Вам заглядывать. Учиться играть будем паралельно.

Шахматная фигура это специальная игровая единица, которая обладает определенными свойствами, заданными правилами игры. К этим свойствам относяться правила передвижения на шахматной доске, начальная позиция, название и силу.

Шахматные фигуры – это несколько шахматных фигур, образующих определенный комплект для каждого игрока. Как правило их 32 шкуки по 16 для каждого игрока. Один комплект имеет цвет "Черный", а другой "Белый".

К внешним свойствам шахматных фигур относится материал, размер и дизайн. Основным материалом, из которого изготавливают шахматы - это дерево и пластик. На рисунке показан пример профессиональных турнирных фигур:

Расстановка шахматных фигур

В начале игры Белые фигуры ставятся на 1-й и 2-й горизонталях, Черные фигуры – на 8-й и 7-й горизонталях, в строгом порядке, согласно правилу игры. На одном поле может размещена только одна фигура.

Ладьи ставят по углам доски, на вертикалях "a" и "h". Кони ставятся рядом с ладьями. После коней ставим слонов, а в середине ставятся ферзь и король. Как правило, проблем с запоминанием расстановки шахматных фигур на доске не возникает пробелм, но иногда начинающие шахматисты путают местами ферзя и короля. Чтобы всегда правильно ставить ферзь, нужно запомнить такую поговорку: "Ферзь любит свой цвет". Она говорит о том, что Белый ферзь ставиться на белое поле (d1), а Черный ферзь на черное (d8). Ниже показана расстановка начальных фигур:

Игровые особенности

У нас есть шесть уникальных шахматных фигур, каждая из которых имеет свое название: король, ферзь, ладья, слон, конь, пешка. У каждой фигуры есть свои определенные возможности. Некоторые малоподвижны с маленькой ударной силой, некоторые более подвижны, с большей силой. Одни ходят по белым, другие только по черным полям, есть которые ходят по всем полям доски. Даже есть фигуры, которые нужно защищать, под угрозой проигрыша. Поэтому, в шахматах не все фигуры равных.

Когда мы играем партию, то должны аккуратно разменивать фигуры, пытаясь разменять более слабую фигуру на более сильную фигуру оппонента. Иначе наш соперник получить большое материальное преимущество и с легкостью выиграет партию.

В этой таблице, мы приводим описание фигур, их ценность и на какие фигуры их можно менять:

Если против ферзя стоит три легкие фигуры, то это означает, что ферзя можно менять на три фигуры. Если Вы поменяете ферзя на одну легкую фигуры, то произойдет невыгодный размен и вы понесете материальные потери, а ваш противник получит шансы выиграть партию.

Если разменять ладью на слона с двумя пешками, то произойдет равноценный размен, но если ладь поменять на коня или слона, то здесь уже идет потеря качества (ладья более качественная, чем слон или конь). Обычно говорят, что игрок проиграл качество. Если вы меняете ладью на одну или две пекшу, то это уже материальные потери.

Во время партии, бывает возникают такие позиции, в которые слабые фигуры ведут успешную больбу против сильных шахматных фигур. Например: Слон сильнее ладьи, или ладья сильнее ферзя и т.д. Таким образом есть абсолютная и относительная сила фигур. Абсолютная сила указана в таблице, приведенной выше, а вот относительную силу измерить нельзя. Она зависит от игровой ситуации и в каждой позиции она может менять.

Высшее мастерство в шахматном искусстве это умения создавать такие позиции, когда слабые фигуры оказываются сильнее сильны.

В следующих уроках, мы подробно рассмотрим особенности каждой шахматной фигуры.