Category: лингвистика

Category was added automatically. Read all entries about "лингвистика".

ptica_osobashayasa
  • mitr

Конкурс по математической лингвистике

"Интернет-математика" - это серия конкурсов, организованных Яндексом. В 2009 году конкурс проводится в третий раз, до этого проводился в 2004-05 и 2006-07 годах (http://company.yandex.ru/grant/). Конкурс этого года в основном ориентирован на молодежь - студентов, аспирантов, программистов и молодых ученых. Цель конкурса - привлечение внимания к актуальным адачам информационного поиска, стимулирование исследований в области методов анализа интернет-данных.

В рамках "Интернет-математики 2009" все участники решают одну задачу - получение функции ранжирования документов на основе обучающего множества. В рамках конкурса мы распространяем реальные данные, которые используются для подбора формулы ранжирования Яндекса. Данные содержат уже посчитанные и нормализованные признаки пар "запрос-документ", а также оценки релевантности, сделанные асессорами (оценщиками качества поиска) Яндекса. Распространяемые файлы не содержат оригинальных запросов и ссылок на оригинальные документы, не описана семантика признаков. Весь набор данных соответствует примерно 20 000 запросам и 200 000 документам и разделен на обучающее и тестовое множества.

Участники могут подавать решения в течение всего времени проведения конкурса. На основании части поданных результатов проводится предварительная публичная оценка. После окончания приема решений проводится финальная оценка и объявляются лучшие результаты. Победители награждаются денежными призами.

По всем вопросам, касающимся конкурса, можно обращаться по адресу
grant@yandex-team.ru.