OpenTalks.AI — ведущая независимая открытая конференция по искусственному интеллекту в России, собирающая лучших российских докладчиков со всех топовых международных конференций по ML/DL на одной площадке. Она принимает спикеров как на коммерческих условиях, так и бесплатно, если доклад достаточно интересен для аудитории мероприятия. Компания MITLabs, учредителями которой являются выпускники Школы Елена Меньшикова (2017-2018 просветительский год) и Александр Мазалов (2015-2016 просветительский год), стала исключением: от нее организаторы конференции приняли сразу два доклада, и оба — на некоммерческой основе.
История проекта началась на одном из семинаров Школы, состоявшемся в январе 2020 года. Тогда учредители MITLabs провели придуманную ими же лингвистическо-экономическую игру «Угадай или убеди», в рамках которой слушатели и выпускники «Репного» попробовали создать собственный языковой корпус и поупражняться в принятии решений в заранее выбранных условиях. Собравшиеся поработали над созданием датасета «Горячий звонок», чтобы выяснить, как люди заключают сделки, какие слова они используют, как они объясняют себе и друг другу свои решения.
Однако на игре MITLabs не остановился, и вскоре Александр Мазалов создал в компании целый отдел, посвященный машинному обучению в области обработки естественного языка. Отдел занялся созданием моделей на основе искусственного интеллекта, которые извлекали факты из разного рода письменной речи, в том числе неструктурированной и содержащей ошибки.
«Например, мы исследовали «язык объявлений». Конечно, языком в привычном смысле его назвать нельзя, но это некоторый общепризнанный набор часто используемых языковых конструкций. И внезапно это оказалось интересно. Нейросеть, наученная на больших объемах данных, может извлечь из объявления дополнительную информацию: например, можно понять степень срочности объявления, даже если в тексте об этом не сказано впрямую», — рассказал Александр Мазалов.
Исследования начались из любви к знаниям и изначально не имели прямого коммерческого результата. Однако вскоре пришло понимание, что текстовой информации не достаточно — надо комбинировать данные, извлекаемые из текста, с данными из спутниковых снимков и количественными данными из других источников. Так появился проект «GrainMonitor», к которому подключились Александр Хайдаров (2017-2018 просветительский год) и Андрей Плетнев (2015-2016 просветительский год). В результате была установлена слабая зависимость между ценами на зерно и тем, о чем люди говорят на специализированных форумах, в статьях и в пабликах «Вконтакте», посвященных сельскому хозяйству.
Кроме того, исследования дали и первые коммерческие плоды: разработками MITLabs заинтересовались сразу две крупные компании. Пожелаем проекту дальнейших успехов, а его участникам — удачных выступлений на конференции и выгодных контрактов.