Чтобы комментировать записи и дружить с другими пользователями, нужна своя страница на Я.ру. Если у вас уже есть страница на Я.ру, введите логин и пароль. Если страницы ещё нет — создайте! |
| В клубе действуют правила. Правила клубаВ клубе запрещено:
В случае нарушения правил ваши записи могут быть удалены, а вы сами – исключены из клуба.
Хотелось бы получить уточнение по следующему вопросу. В обучающем материале результаты измерений даны с существенными пропусками. Можно предположить, что то же справедливо и для результатов в последний день, который участникам требуется предсказать. Т.е. значительную часть предсказаний не с чем сравнивать. Верно ли, что при подсчете результата будут использованы не все предсказания, а только те, для которых результат измерения известен организаторам? Или используются все предсказания участника - тогда с чем они сравниваются?
Пользуйтесь природой бережно. Любопытно. Какие программы используют претенденты. Один из файлов неудобен, - крупноват.
В графе (edges.txt) есть цикл, из которого не ведет никаких ребер. Т.к. есть надежда, что граф соответствует реальным улицам, то это явная ошибка описания. Вот этот цикл: 56738, 179208, 339692 (вершины); 442410, 726308, 637507 (дуги) Попасть в него можно из вершин 56739 или 339693, а выйти нельзя никак.
Добрый вечер! Возможно, повторяюсь или неправильно истолковал задание, так что извините. Требуется предсказать показания ПРИБОРОВ в последний день (подобно тому, как представлены данные за предыдущие дни -- с аномалиями и выбросами), либо же попытаться оценить РЕАЛЬНУЮ скорость движения автомобилей на улицах Москвы?
Хотелось бы понять, каким абсолютным погрешностям соответствует достигнутая лидерами гонки оценка в районе 60. Если я не ошибаюсь, то сейчас результат нормируется не на 1, а на среднее Kl * Kt, Kl - весовой коэффициент длины - по определению в среднем равен 1, а Kt - изменяется от 1 до 7 и в среднем = 4. Так что можно предположить, что оценка 60 соответствует средней абсолютной погрешности в 15км/час (60/4). Результат довольно слабенький - если учесть что ср. скорость в Москве около 30, это соответствует отн. погрешности 50%. С другой стороны очевидно, что лидеры уперлись в некий потолок, дальнейший прогресс остановился и, судя по большому числу попыток, лидеры заняты фитом параметров своих моделей - причем без заметного успеха. Вряд ли организаторы конкурса станут комментировать сложившуюся ситуацию, но мне лично очень интересно, насколько достигнутый результат близок к наилучшему возможному (и вообще, известен ли он организаторам) Интересно, кто нибудь использует в своей модели информацию о перекрестках (взаимном расположении улиц) Вроде бы по смыслу ее надо использовать, но не совсем понятно как. Ясно, что например число въезжающих на перекресток машин равно числу выезжающих, но непонятно, как из этого сделать выводы о связи скоростей на улицах перекрестка. Смею предположить, что пока лидеры занимаются усовершенствоанием "вазелиновой" оценки, т.е. считают все улицы независимо друг от друга и совершенствуют методы усреднения данных, путем учета степени корреляции дней с выделенным днем 41 за счет данных с 16 до 18 часов
В правилах конкурса указано: "Baseline — это «простая скептическая оценка»: средняя скорость для дуги по всем дням месяца для этого момента времени; если данных нет, то считаем, что скорость 0 км/ч (пробка)" Означает ли это, что любой участник, просуммировавший для каждой дуги скорости из jams.txt и поделивший полученные значения на 30+1/3 (одна треть за счет данных 41-го дня), должен получить результат в районе 76.65? Или при подсчете "простой скептической оценки" использовались более продвинутые алгоритмы/не доступная участникам дополнительная информация?
Я проанализировал данные JAMS.txt - день 11, там присутствует много одинаковых записей (с одинаковыми значениями группы, дня и времени) - по 2, а где -то и по 3, 4 и 5(по моим подсчетам 101686 лишних записей для 11 дня). Зачем так много лишних данных, ведь файл и так большой... Вот интересные две строчик, например: 317746 11 21:02 50
317746 11 21:06 50
Если, я правильно понял, то в одно время и день две разные скорости на одной группе.
Подскажите пожалуйста как затолкать архив на сервер,постоянно ошибка — При распаковке файла произошла ошибка - возможно, он не является архивом сжимал файл в ZIP со стандартными настройками
ИМХО оценка результата не совсем корректна с точки зрения полезности информации.
Например возмем всего 2 дороги с протяженностью 120 метров и для каждой одно предсказание на 18:00. На дороге А предсказанная скорость 40, а реальная 10 итого ошибка в 30/2 = 15 На дороге Б предсказанная скорость 60, а реальная 90 итого 30/2 = 15, та же ошибка.
Но вот для меня, как для водителя, разница между 40 и 10 гораздо важнее чем между 60 и 90. ИМХО формула должна учитывать отношение большей скорости к меньшей, возможно не в прямом виде, а в виде некого не пропорционального коэффициента.
Можно узнать принцип работы измерителей скорости? Так как от этого зависит, как будут интерпретироваться полученные данные. Например, какая скорость потока будет показана на пустой дороге, или если по ней проехал только один каток, со скоростью 10 км/ч? И чем объяснить показания скорости >180, либо это 100% датчик сломался, либо возможно гонщик проехал по пустой дороге? Влияют ли одиночные более медленные (более быстрые) машины, на усредненную величину скорости, или пограничные данные отбрасываются?... Вопросов набирается много. И если кто-нибудь объяснит алгоритм получения и первичной обработки данных о скорости, то это очень поможет. Спасибо. Ещё темы → |
| Подписаться на комментарии к записи | ||
|---|---|---|
Получать уведомления о всех ответах в этом обсуждении. Форма не заполнена | ||
| Отписаться от комментарев к записи | ||
|---|---|---|
Получать уведомления только о тех ответах в этом обсуждении, которые адресованы лично вам. Форма не заполнена |
