Международный гроссмейстер
Сообщений: 1138
Зарегистрирован: 21.02.10
|
Renal написал:
При расчета рейтинга в ИКЧФ появился новый показатель RD. Что он обозначает, откуда берется и как влияет на рейтинг?
https://webfiles....system.pdf
Вот перевод текста системой Промт 2022, основанной на нейросетях:
Руководство начинающего по пересмотренной системе рейтингов ICCF
Марк Гликман, Департамент статистики, Гарвардский университет
Начиная с 2023 года ICCF примет новую систему оценок для оценки результатов игр, сыгранных в событиях ICCF. Решение пересмотреть систему рейтингов стало результатом осознания того, что старая система уже не в состоянии адекватно рассчитать точные рейтинги. Это было особенно очевидно на верхних уровнях игры, где частота розыгрышей выросла до такой степени, что рейтинги игроков с высоким рейтингом едва изменятся.
В 2021 году делегаты ICCF признали необходимость новой системы, которая решала бы проблему увеличения частоты розыгрышей игр. С этой целью они заказали разработку специальной системы доктору Марку Гликману, уважаемому эксперту в области рейтинговых систем и старшему преподавателю Гарвардского университета. Доктор Гликман известен своей работой над рейтинговыми системами Глико и Glicko-2, которые были реализованы в различных шахматных организациях, таких как chess.com и lichess.org. Он также был одним из со-разработчиков Универсальной рейтинговой системы, используемой Grand Chess Tour.
Доктор Гликман разрабатывал пересмотренную систему ICCF с августа 2021 года по май 2022 года, используя результаты игр ICCF за шесть лет и текущую информацию о рейтингах для точной настройки формул. Детали новой системы были представлены делегатам ICCF в июне 2022 года, а приняты в августе 2022 года. Вскоре после этого началась реализация формул для использования ИКЧС.
Данный документ описывает основные особенности новой системы рейтингов и предназначен для нетехнической аудитории.
Оценки и отклонения оценок:
Одним из существенных изменений в старой системе оценок является добавление отклонения рейтинга (сокращенно RD) для каждого игрока. Это понятие, которое было заимствовано из система1 оценок Glicko, разработанная примерно 30 лет назад. Рейтинг, как и в старой системе ICCF, является мерой своей игровой силы. RD - мера ненадежности рейтинга. Чем больше РД игрока, тем менее надежен рейтинг игрока. RD около 75 или ниже указывает, что рейтинг игрока надежен и заслуживает доверия.
Игроки, не имеющие рейтингов (при условии отсутствия других внешних рейтингов, таких как рейтинг ФИДЕ), стартуют с рейтингом 1800 и RD 250, самым большим из возможных RD в новой системе. Это назначение означает, что наше лучшее предположение о рейтинге игрока, без какой-либо дополнительной информации, 1800. Однако РД 250 указывает, что рейтинг 1800 очень неопределенный. Для игроков ФИДЕ, которые не имеют рейтинга ICCF, начальный RD устанавливается равным 150. Обычно игроки, имеющие высокие РД, являются либо временными игроками, либо теми, кто не соревновался в последнее время и имеет устаревшие рейтинги. И наоборот, игроки, которые установили рейтинги и которые часто соревнуются, как правило, имеют низкие RD. Включение RD в пересмотренную систему рейтингов ICCF имеет некоторые важные последствия для рейтинговых игр. RD может повлиять на то, насколько меняется рейтинг игрока от результатов игры и насколько меняется и рейтинг их противника.
Например, допустим, два игрока, Сара и Джо, с одинаковым рейтингом, играют в игру, и Сара выигрывает. Если оба игрока имеют низкие RD, что означает, что их рейтинги являются надежными отражениями их игровой силы, то новая система рейтингов, скорее всего, не изменит рейтинг Сары и Джо сильно, потому что их рейтинги уже были надежными до того, как они играли. Но если бы РД Сары было низким, а РД Джо большим, указывая, что его рейтинг ненадежен, то рейтинг Сары едва повысился бы, потому что она победила соперника с ненадежным рейтингом. Однако рейтинг Джо, скорее всего, значительно уменьшится, потому что он проиграл сопернику с точным рейтингом, и его собственный рейтинг был ненадежен для начала. Наконец, если RD Сары был высоким, а RD Джо - низким, то рейтинг Сары повысится на большую сумму, учитывая, что её рейтинг был ненадежным, а рейтинг Джо - точным.
В целом, когда RD игрока велик, можно ожидать, что их изменение рейтинга будет более значительным. И наоборот, когда RD игрока низкий, их рейтинговые изменения, как правило,
1 http://www.glicko.net/glicko/glicko.pdf
меньше. При этом при соперничестве с соперником с большим РД результат игры обычно мало влияет на собственный рейтинг. Но при соперничестве с соперником с небольшим РД результат игры может вызвать более существенные изменения в рейтинге игрока.
Пересмотренная система рейтингов ICCF была разработана, чтобы предоставить игрокам с высокими RD возможность повышать свои рейтинги более высокими темпами, чем раньше. Поскольку игроки с высокими RD имеют тенденцию получать большее увеличение рейтинга (в абсолютном выражении), чем игроки с низкими RD, игрок с высокими RD может играть в несколько игр и быстро улучшать свой рейтинг за относительно короткое время. Этот подход направлен на стимулирование игроков, которые новички в мероприятиях ICCF, начать играть в рейтинговые игры, и вознаграждение временных игроков, которые последовательно соревнуются и участвуют в более рейтинговых играх.
Процедура оценки:
Пересмотренная система рейтингов ICCF обновляет рейтинги игроков и RD каждые три месяца, как и старая система. Ниже приведены шаги, связанные с процессом оценки, который повторяется каждый квартал:
1. Определите рейтинг каждого игрока и RD в начале 3-месячного периода рейтинга.
2. Обновление рейтинга каждого игрока и РД с использованием новых формул рейтинга, основанных на играх, выполненных в течение 3-месячного периода. Этот шаг приведет к снижению RD для каждого игрока.
3. Используйте формулы для увеличения РД каждого игрока в связи с течением времени для создания нового РД, который используется в начале следующего 3-месячного периода.
Следует упомянуть несколько замечаний, касающихся этого процесса. Во-первых, в начале каждого периода рейтинга каждому игроку присваивается рейтинг и RD, даже если они не оценены. Игрокам без оценки присваивается рейтинг и RD (как правило, высокое значение), которые не основаны на результатах игры ICCF. Они могут быть основаны на известной рейтинговой информации из другой рейтинговой системы (например, ФИДЕ), или, как упомянуто выше, им будет присвоен рейтинг 1800 и RD 250, если другая информация отсутствует.
Во-вторых, все результаты игры за 3-месячный период оцениваются одновременно. Это означает, что рейтинг каждого игрока и RD обновляются одновременно на основе всех игр, выполненных в течение периода рейтинга. В то время как рейтинг игрока может подниматься или опускаться, RD, основанный на шаге 2, всегда снижается. Это отражает идею о том, что по мере записи большего количества результатов игры обновленный рейтинг игрока становится более надежным мерилом его игровой силы.
Наконец, важно отметить, что после уменьшения RD из-за результатов игры на этапе 2, RD затем увеличивается на этапе 3, чтобы учесть прохождение времени, и это новое значение используется в начале следующего 3-месячного периода оценки. Даже если игрок не закончит никаких игр в течение этого периода, их RD все равно увеличится. Это потому, что с течением времени появляется больше неуверенности в способности игрока - они могли бы активно улучшать свою игру, или они могли бы ржаветь, пренебрегая шахматами. Увеличение РД отражает идею о том, что мы чуть менее уверены в силе игрока по прошествии нескольких месяцев. Однако стоит отметить, что РД выше 120 не увеличиваются из-за прохождения времени; они могут увеличиваться только после того, как RD опустятся ниже 120.
Отдельные вероятности для побед, поражений и ничьих:
Одной из основных мотиваций пересмотра системы рейтингов ICCF была существенно более высокая частота розыгрышей игр среди игроков с самым высоким рейтингом по сравнению с игроками с более низким рейтингом. Это привело к как правило меньшим изменениям рейтинга для лучших игроков, которые редко имеют решающие игры против противников аналогичной силы. Одним из ограничений предыдущей системы было то, что она основывалась на формулах Арпада Эло 1950-х годов, которые не учитывали вероятность ничьей, основанной на уровнях способностей игроков. Система опиралась исключительно на формулу для определения ожидаемого результата или продолжительности выигрыша игры, которая основывалась исключительно на разнице в рейтингах между двумя игроками. В результате система не смогла решить проблему высокой частоты розыгрышей игр среди лучших игроков.
Пересмотренная система рейтингов ICCF включает три отдельные вероятности для каждого типа результата игры (выигрыш, проигрыш или ничья), вместо одной продолжительности выигрыша, основанной исключительно на разнице оценок между двумя вовлеченными игроками. Вероятности каждого
результат рассчитывается на основе оценок и РД игроков. Чем ближе два рейтинга друг к другу, тем выше вероятность ничьей. Также, чем выше РД для двух игроков, что указывает на ненадежность рейтингов игроков, тем выше вероятность ничьей. Кроме того, пересмотренная система признает, что игроки с высоким рейтингом имеют тенденцию притягиваться друг к другу с большей скоростью, чем игроки с более низким рейтингом. Следствием признания того, что игроки с высоким рейтингом играют друг против друга высокими темпами, является то, что выигрыш и потери рейтинга, основанные на решающих играх, могут быть более выраженными. Например, игрок с рейтингом 1500, побеждающий игрока с рейтингом 1300, получает прирост рейтинга в 20 очков (предполагая, что RD 100 для обоих игроков), в то время как игрок с рейтингом 2500, побеждающий игрока с рейтингом 2300, будет иметь свой рост рейтинга на 24 очка, что больше, чем выигрыш рейтинга для пары игроков с более низким рейтингом.
Формулы для вычисления вероятностей каждого результата игры и формулы для изменения рейтинга на основе этих вероятностей были получены из анализа за шесть лет предыдущих результатов игры ICCF. Оптимизация системы рейтингов с единственной целью создания точных вероятностей приведет к изменению рейтингов на слишком большие суммы, а рейтинги лучших игроков едва изменятся на основе нарисованных игр. Вместо этого, выведение формул было компромиссом между тремя факторами: (1) получение точных вероятностных расчетов результатов игры, (2) предотвращение рейтинговой инфляции и (3) поддержание распределения рейтингов во времени. В то время как число розыгрышей среди лучших игроков в последние годы значительно превышает 95%, окончательные формулы вычисляют вероятности, которые составляют около 80%. Эта незначительная неточность позволяет увеличить движение рейтингов на верхних уровнях и предотвращает непреднамеренные дрейфы в среднем по всем рейтингам.
Ниже представлены графики, которые иллюстрируют вероятности выигрыша, ничьей и проигрыша для игрока с заданным рейтингом и RD, и соответствующее изменение рейтинга для каждого результата игры.
Рисунок выше соответствует игроку с рейтингом 1500 и RD 100. График слева показывает вероятности выигрыша (синяя кривая), розыгрыша (серая кривая) и проигрыша (красная кривая) против противника с рейтингом, указанным на горизонтальной оси (и с RD 100). Например, при соревновании против соперника с рейтингом 1400 и RD 100 вероятность проигрыша этому сопернику составляет около 0,16, вероятность розыгрыша - около 0,565, а вероятность выигрыша - около 0,28. Вероятность ничьей наибольшая (высшая точка на серой кривой на левом графике), когда рейтинг противника также 1500. Стоит отметить, что вероятность ничьей против соперника оценивалась в 1900 (на 400 очков выше, чем у игрока с рейтингом 1500) немного выше, чем вероятность ничьей против соперника с рейтингом 1100 (на 400 точек ниже, чем у игрока с рейтингом 1500), что видно из сравнения высоты серой кривой на правой и левой сторонах графика. Это потому, что пересмотренная система оценок признает, что пары игроков с более высоким рейтингом имеют тенденцию рисовать игры чаще, чем
пары игроков с более низким рейтингом. В этом случае вероятность ничьей между игроками с рейтингом 1500 и 1900 выше, чем вероятность ничьей между игроками с рейтингом 1500 и 1100, поскольку первый набор оценок в среднем выше последнего.
График справа показывает изменение рейтинга, основанное на поражении (синий), рисовании (серый) и проигрыше (красный) сопернику с рейтингом, указанным на горизонтальной оси. Если рейтинг соперника составляет 1500 (а их РД - 100), рейтинг игрока не меняется, если результатом является ничья, но прирост рейтинга составляет около 27 очков за победу, и падение на 27 очков за проигрыш. Опять же стоит отметить асимметрию в изменении рейтинга при игре соперника с рейтингом на 400 очков выше против 400 очков ниже. Например, при розыгрыше соперника, оцениваемого на 400 очков выше, выигрыш в рейтинге для 1500-игрока составляет 11 очков. Но при розыгрыше соперник оценил на 400 очков ниже, потеря рейтинга для 1500-игрока составляет 13 очков. Эта асимметрия отражает то, что рисование соперника с более высоким рейтингом является более вероятным, чем рисование противника с более низким рейтингом, потому что вероятность решительного исхода выше.
Такой же анализ может быть проиллюстрирован для игрока с рейтингом 2500 и RD 100.
Есть несколько отличий в сравнении с анализом игрока с рейтингом 1500. На основании графика слева вероятность ничьей значительно превышает 0,6, когда игрок с рейтингом 2500 играет против соперника с рейтингом между 2100 и 2900 (и RD 100), с пиком около 0,8, когда рейтинг соперника также составляет 2500. Это намного выше, чем вероятность ничьей игрока с рейтингом 1500, играющего против соперника в пределах 400 рейтинговых очков. График справа, показывающий изменение рейтинга в результате выигрыша, ничьей или проигрыша, имеет некоторые важные особенности, которые стоит отметить. В то время как повышение рейтинга за выигрыш у соперника с таким же рейтингом примерно одинаково (27 очков у игроков с рейтингом 1500, и 28 очков у игроков с рейтингом 2500), повышение рейтинга за выигрыш на игрока с рейтингом 2500 зависит не столько от рейтинга соперника, сколько от игрока с рейтингом 1500. Другими словами, игрок с рейтингом 2500, побеждающий соперника с рейтингом 200 очков ниже (с RD 100), приводит к увеличению рейтинга на 24 очка, в то время как игрок с рейтингом 1500, побеждающий соперника с рейтингом 200
более низкие баллы будут иметь только 20-балльное увеличение. Кривые на правом графике для 2500-плеера «более плоские», чем кривые на правом графике для 1500-рейтингового игрока. Это означает, что для игроков с более высоким рейтингом решающие результаты игры могут привести к более значительным изменениям рейтинга.
Завершение:
Пересмотренная система оценок признает, что пары игроков с более высоким рейтингом имеют тенденцию рисовать игры чаще, чем пары игроков с более низким рейтингом, что приводит к несколько большим изменениям рейтинга для решающих результатов игры для игроков с более высоким рейтингом. Кроме того, включение RD в качестве показателя ненадежности рейтинга выгодно игрокам всех рейтингов, что приводит к более точным рейтингам, которые лучше отражают уровень мастерства игрока.
Для перехода на новую систему рейтингов ICCF будет использовать существующие рейтинги несколько лет назад в качестве отправной точки. При запуске новой системы будет инициироваться RD игрока на основе количества последних выполненных игр. Более подробная информация о развертывании новой системы приводится ниже.
Игрокам, желающим узнать больше о технических деталях пересмотренного алгоритма оценки, предлагается ознакомиться с техническими спецификациями на https://webfiles.iccf.com/rules/Rating_formulae_for_ICCF_system.pdf. Онлайн-калькулятор, реализующий новые формулы рейтинга, доступен по адресу https://ratingscalculator.azurewebsites.net/, позволяя игрокам вычислять собственные изменения рейтинга.
|