Kaggle

Перейти к навигацииПерейти к поиску
Kaggle
Изображение логотипа
URLkaggle.com (англ.)
Тип сайтабизнес и Конкурсная платформа по исследованию данных[вд]
ВладелецAlphabet Inc.
СоздательЭнтони Голдблум
Начало работыапрель 2010
СлоганThe Home of Data Science
Страна
Логотип Викисклада Медиафайлы на Викискладе

Kaggle — система организации конкурсов по исследованию данных, а также социальная сеть специалистов по обработке данных и машинному обучению. Принадлежит корпорации Google (с марта 2017 года)[1][2][3].

Среда организована как публичная веб-платформа, на которой пользователи и организации могут публиковать наборы данных, исследовать и создавать модели, взаимодействовать с другими специалистами по данным и инженерами по машинному обучению, организовывать конкурсы по исследованию данных и участвовать в них. В системе размещены наборы открытых данных, предоставляются облачные инструменты для обработки данных и машинного обучения. Также реализованы обучающие ресурсы, имеется раздел для размещения вакансий работодателями, где тоже возможна организация конкурсов для отбора наилучших кандидатов.

В июне 2017 года заявлено о миллионном зарегистрированном пользователе (пользователей в системе называют «кэгглерами» — kagglers), среди участников как начинающие специалисты, так и крупные исследователи данных[4].

Конкурсы

Типичная схема организации конкурса Kaggle:

  • ведущий конкурса (как правило, крупная коммерческая организация) готовит данные и описание проблемы;
  • участники экспериментируют с различными методами и соревнуются друг с другом, чтобы создать лучшие модели; работа распределяется публично через Kaggle Kernels, результаты автоматически оцениваются (на основе точности относительно контрольного набора или известного решения), что влияет на рейтинг участника;
  • по истечении установленного срока организатор конкурса выплачивает призовой фонд в обмен на «всемирную, бессрочную, безотзывную и бесплатную лицензию на использование выигравшей заявки», то есть разработанный алгоритм, программное обеспечение и соответствующую интеллектуальную собственность.

Кроме публичных конкурсов также организуются закрытые соревнования, в которых участвуют только специалисты с определённым рейтингом Kaggle. Кроме того, предлагается бесплатный инструмент для учителей информатики для проведения академических соревнований по машинному обучению (Kaggle In Class).

Всего проведено более сотни публичных конкурсов по машинному обучению, среди них соревнования по улучшению распознавания жестов для Microsoft Kinect[5], конкурс по совершенствованию системы поиска бозона Хиггса в ЦЕРНе[6].

Результаты некоторых конкурсов вылились в крупные проекты, среди них — технологии исследований ВИЧ[7], шахматные рейтинги[8], прогнозирование загруженности магистралей[9]. Среди участников конкурсов — Джеффри Хинтон и Джордж Даль, выигравшие с использованием глубоких нейронных сетей соревнование корпорации Merck; их результат, наряду с победой ученика Хинтона Влада Мних на конкурсе Adzuna, послужил признанию глубокого обучения как универсальной техники, в дальнейшем широко распространившейся среди других участников соревнований. На основе результатов, полученных на соревнованиях Kaggle, было опубликовано несколько научных работ[10][11]

Примечания

  1. Lardinois, Frederic. Google is acquiring data science community Kaggle. Techcrunch (8 марта 2017). — «Sources tell us that Google is acquiring Kaggle [...] the official announcement could come as early as tomorrow.» Дата обращения: 9 марта 2017. Архивировано 9 марта 2017 года.
  2. "Google buys Kaggle and its gaggle of AI geeks". CNET (англ.). 2017-03-08. Архивировано 27 сентября 2021. Дата обращения: 1 июня 2018.
  3. "Welcome Kaggle to Google Cloud". Google Cloud Platform Blog (англ.). Архивировано 15 сентября 2018. Дата обращения: 19 августа 2018.
  4. Markoff, John. "Scientists See Advances in Deep Learning, a Part of Artificial Intelligence" (англ.). Архивировано 21 мая 2021. Дата обращения: 19 августа 2018.
  5. Byrne, Ciara (2011-12-12). "Kaggle launches competition to help Microsoft Kinect learn new gestures". VentureBeat. Архивировано 28 сентября 2020. Дата обращения: 13 декабря 2011.
  6. "The machine learning community takes on the Higgs". Symmetry Magazine. 2014-07-15. Архивировано 16 апреля 2021. Дата обращения: 14 января 2015.
  7. Carpenter, Jennifer (2011-02). "May the Best Analyst Win". Science Magazine. Архивировано 24 сентября 2015. Дата обращения: 1 апреля 2011.
  8. Sonas, Jeff (2011-02-20). "The Deloitte/FIDE Chess Rating Challenge". Chessbase. Архивировано 9 ноября 2012. Дата обращения: 3 мая 2011.
  9. Foo, Fran (2011-04-06). "Smartphones to predict NSW travel times?". The Australian. Архивировано 8 октября 2019. Дата обращения: 3 мая 2011.
  10. NIPS 2014 Workshop on High-energy Physics and Machine Learning. Архивировано из оригинала 14 мая 2016. Дата обращения: 8 октября 2019.
  11. Athanasopoulos, George. "The Value of Feedback in Forecasting Competitions" (PDF). International Journal of Forecasting. pp. 845—849. Архивировано (PDF) 16 февраля 2019. Дата обращения: 14 марта 2022.

Литература