Инженеры из Дюкского университета разработали и напечатали на 3D-принтере устройство, которое позволит компьютеру «различать голоса» в шуме из звуков человеческой речи. Задача «коктейльной вечеринки», которую легко решает человеческий мозг, до этих пор искусственному интеллекту была неподвластна.
На коктейльных вечеринках несколько людей говорят одновременно, примерно с одинаковой громкостью. При этом слушатель легко выделяет нужный ему голос собеседника из прочих. Этот голос ничем принципиально не отличается от других, кроме того, что слушатель обращает на него внимание.
Электронное устройство не может «обратить внимание» на один набор звуков, а другой набор звуков с очень схожими параметрами проигнорировать. Зато последнее изобретение, описанное в онлайн-версии журнала Proceedings of the National Academy of Sciences, способно разделять звуки по направлению, откуда они исходят. Для такого распознавания речи достаточно одного датчика звука. Этот датчик расположен в центре диска с 36 каналами, каждый из которых выложен шестиугольными ячейками из акустического метаматериала. По мере приближения к центру диска звук модифицируется каждым каналом немного по-разному. Получается примерно так же, как если говорить над горлышками бутылок разной степени наполненности.
Устройство верно отделяет один «голос» от двух других в 96,67% случаев. Его работа не требует сложной электроники, и его можно изготовить на 3D-принтере. Главный недостаток прибора — его размер: диаметр диска — 40 сантиметров. Устройство хорошо различает направление, откуда приходят звуки высокой частоты (3000-5000 Гц). С понижением частоты звуков точность прибора падает. Впрочем, изобретатели утверждают, что прототип можно доработать и избавить от указанных недостатков.