- Ссылка на блог: https://code.facebook.com/posts/1686672014972296/deal-or-no-deal-training-ai-bots-to-negotiate/
- Код: https://github.com/facebookresearch/end-to-end-negotiator
- Статья: https://arxiv.org/abs/1706.05125
-
Учат ботов вести переговоры.
-
Есть набор предметов (шляпы, фрукты и т.п.). Каждый бот уникален в своих предпочтениях (кто-то любит шляпы, кто-то фрукты ...). Кроме этого, каждый бот уже имеет какой-то набор предметов. Цель бота состоит в выгодном обмене предметами между друг другом.
-
Dialog rollouts - моделируем будущий диалог при выборе определенной фразы.
-
Датасет собирали краудсорсингом.
-
Применяли RL для оптимизации целевой метрики.