«Яндекс» поделился крупнейшим в мире «беспилотным» датасетом

"Яндекс" поделился крупнейшим в мире "беспилотным" датасетом

Часть данных, накопленных "Яндексом" за время тестирования своих беспилотных автомобилей в России, Израиле и США, выложена в свободный доступ. В компании говорят, что это крупнейший в мире открытый набор данных такого типа — 600 000 размеченных фрагментов поездок складываются суммарно в 1600 часов движения.

Опубликованы данные для участников конкурса Shifts Challenge, проводимого поисковиком в этом году в рамках конференции NeurIPS 2021 совместно с учеными из Оксфордского и Кембриджского университетов. Перед участниками состязания поставлена задача создать алгоритм для самоуправляемых автомобилей, наиболее эффективно работающий в условиях так называемого сдвига данных (data shift).

Сдвиг данных — значимое и неожиданное изменение в фиксируемой (в данным случае самоуправляемым автомобилем) обстановке. Например, когда плотность трафика, погодные условия или привычки других участников дорожного движения внезапно меняются на те, с которыми алгоритм раньше не сталкивался. Живой водитель корректирует свое вождение когда, например, приезжает из провинциального городка в столицу, или когда выпадает снег. То же самое должны уметь и алгоритмы, управляющие робомобилями.

Все данные, включенные в опубликованный "Яндексом" датасет, обезличены. Он не использует видео, где засветились номера машин или лица прохожих. Участники Shifts Challenge смогут также попытать силы в создании устойчивых к сдвигу данных алгоритмов для предсказания погоды и машинного перевода. Победители конкурса получат денежные призы.

Источник