Машина научит вежливости: ученые задумались о решении извечной проблемы интернета

Автор
947
Машина научит вежливости: ученые задумались о решении извечной проблемы интернета

Исследователи из Университета Карнеги-Меллона разработали автоматизированный метод, позволяющий сделать коммуникации более вежливыми. В напряженное время, когда бушует пандемия, политики борются за голоса, а протестующие требуют расовой справедливости, то, как люди общаются друг с другом становится все важнее. Ученые уверены — немного вежливости не помешает. Сейчас исследователи из Университета Карнеги-Меллона разработали автоматизированный метод, позволяющий сделать коммуникации более вежливыми.

Метод принимает неполитические директивы или запросы — те, которые используют невежливый или нейтральный язык — и реструктурирует их или добавляет слова, чтобы сделать их более воспитанными. "Пришлите мне данные", например, может превратиться в "Не могли бы вы выслать мне данные?"

Исследователи представят свое исследование о компьютерной вежливости на ежегодном собрании Ассоциации компьютерной лингвистики, которое состоится практически с 5 июля.

Идея о передаче стиля или настроения из одного сообщения в другое — например, превращение негативных утверждений в позитивные — это то, что языковые технологи уже давно делают. Шримай Прабхумойе, доктор философии студент в Институте языковых технологий (LTI), заявил, что выполнение задачи по передачи вежливого тона уже давно является целью технологий.

"Это чрезвычайно важно для некоторых приложений, например, если вы хотите, чтобы ваши электронные письма или чат-боты звучали более вежливо, или если вы пишете блог. Но мы никогда не могли найти правильные данные для выполнения этой задачи", - говорит Прабхумойе.

Группа ученых решили эту проблему, сгенерировав набор данных в 1,39 млн предложений, помеченных как "для вежливости", его они и использовали в своих экспериментах.

Источник этих предложений может показаться удивительным. Они были получены из электронных писем, которыми обменивались сотрудники Enron, расположенной в Техасе энергетической компании, которая до закрытия в 2001 году была известна корпоративным мошенничеством и коррупцией. Но полмиллиона корпоративных электронных писем стали общедоступными в результате судебных процессов, связанных с мошенническим скандалом Enron, и впоследствии были использованы в качестве набора данных для различных исследовательских проектов.

Но даже с набором данных, исследователи должны были просто определить вежливость. Речь идет не только об использовании таких слов, как "пожалуйста" и "спасибо". Иногда это означает, что необходимо сделать язык немного менее прямым. Поэтому, вместо того, чтобы сказать "вы должны сделать X", предложение становится чем-то вроде "давайте сделаем X".

Украина попала в мировые лидеры по дешевизне мобильного интернета

Набор данных вежливости был проанализирован, чтобы определить частоту и распределение слов в вежливых предложениях. Затем команда разработала конвейер для передачи вежливости. Сначала помечаются невежливые слова или фразы, а затем текстовый генератор заменяет каждый помеченный элемент. Система заботится о том, чтобы не изменить смысл предложения.