18 декабря участникам конкурса было разослано письмо следующего содержания: "We would like to remind you that it is not allowed to be registered in more than one team. If some participant is registered in more than one team, both teams are not eligible for prizes and must be banned from participation." (перевод: "Напоминаем вам, что нельзя регистрироваться более, чем в одной команде. Если какой-то участник зарегистрирован более, чем в одной команде, обе команды не имеют права на получение призов и отстраняются от участия.")
Я обратил внимание на некоторые странные факты в рейтинге:
1) Ясно, что если в решении переставить документы для каждой пары запрос-регион в обратном порядке, то рейтинг изменится с X на 1-X. В последний день соревнования команды helltheclick и clickmodel стали отправлять решения, которые отправили их в самый конец рейтинга, хотя до этого они занимали неплохие места.
2) Итоговый результат keinorhasen и (1 - итоговый результат helltheclick) на валидационной выборке равны, соответственно, 0.667619 и 0.66748 (расхождение 0.000139); на контрольной выборке - 0.660982 и 0.661259 (расхождение 0.000277).
3) Аналогично, (1 - итоговый результат clickmodel) на валидационной и контрольной выборке равны, соответственно, 0.666749 и 0.660892, что тоже очень близко к результату keinorhasen.
4) Скорее всего, helltheclick мог бы занять первое место среди участников конкурса, просто переставив документы в своём решении в обратном порядке, но вместо этого занял предпоследнее место.
5) По моим наблюдениям, весь конкурс команды helltheclick, ailab, и Take it and go загружали решения практически синхронно. В рейтинге, доступном на сайте, у них равное число попыток, что также достаточно нетипично.
На основании этих фактов я считаю, что команда keinorhasen использовала команды helltheclick и clickmodel для "дополнительных отправок". Возможно, то же относится и к командам ailab и Take it and go.
Также мне кажется, что команды omg, OMG!!, OMG!!!, aaa и aaaaiiii могут принадлежать одним и тем же людям: у этих команд похожи названия, итоговые результаты, четыре команды из пяти были созданы в последний день и имеют одну отправку.
Я отправил письмо администрации с указанием этих фактов и получил ответ, что доказательства с использованием математической статистики не являются достаточными для исключения команд из конкурса, а также что обмен опытом и идеями между командами не запрещён.
На мой взгляд, такая позиция формально соответствует правилам, но противоречит им по духу. Аналогичная ситуация возникла также в одном из конкурсов kaggle, после чего в правила тех соревнований был включён пункт пункт 3.6: «No individual or entity may share solutions or code for any competition, or collaborate in any way, with any other individual or entity that is participating as a separate individual or entity for the same competition. The foregoing shall not apply to any public communications, such as forum participation or blog posts.», т.е. был запрещён обмен опытом и кодом между командами любым способом, кроме сообщений на общедоступных форумах и в блогах. Предлагаю добавить аналогичный пункт в правила будущих конкурсов «Интернет-математика».
Я считаю, что участники конкурса должны знать об этих фактах. Также мне очень хотелось бы услышать комментарии от команды keinorhasen как от победителей конкурса.