Немецкие исследователи создают первый в истории языковой корпус, содержащий образцы речи пьяных людей. На данный момент в Alcohol Language Corpus включено 162 записи. Собранные данные будут использованы для создания алгоритма, распознающего опьянение по речи человека. В будущем, полагают ученые, такие программы могут быть встроены в автомобили, что предотвратит вождение в пьяном виде.
Данные для корпуса пьяной речи собирались в ходе исследования в 2007 – 2009 годах. Его проводили мюнхенские ученые из Университета Людвига-Максимилиана и Института судебной медицины. Участникам-добровольцам давали выпить алкоголя до стадии опьянения, а затем записывали беседу с ними в автомобиле. Пьяный человек при этом находился на пассажирском сиденье. Корпус содержит записи речи как мужчин, так и женщин.
Над программой, определяющей опьянение по характеристикам речи, работают специалисты из Квинс-колледжа и Колумбийского университета. Они надеются, что в будущем эта программа будет использована в устройствах, которые не позволят пьяному человеку сесть за руль. Программа будет задавать человеку какой-либо вопрос и анализировать его устный ответ. В случае обнаружения признаков опьянения она заблокирует зажигание. Однако пока, как признает профессор Эндрю Розенберг из Квинс-колледжа, программа в трети случаев дает ложное положительное срабатывание, диагностируя опьянение у трезвого человека.
В дальнейшем создатели Alcohol Language Corpus планируют расширять свое собрание, включив в него в частности образцы пьяной речи на разных языках.