Архив:

Может ли компьютер соперничать с сурдопереводчиком?

Сурдопереводчиков сейчас катастрофически не хватает. А могут ли помочь в общении с глухими и слабослышащими людьми машины? Новые исследования специалистов Университета Восточной Англии показывают, что компьютеры в настоящее время способны лучше читать по губам, чем это делают люди.

Группа ученых из Школы информатики Университета Восточной Англии сравнили работу машины, читающей по губам, с работой 19 человек. Они обнаружили, что автоматизированная система значительно превзошла людей, которые читали по губам: распознавание было на уровне 80 процентов, по сравнению с лишь 32 процентами для человека.

Кроме того, они обнаружили, что машины могут использовать упрощённые особенности в идентификации речи, которые представляют собой только форму лица, тогда как людям, которые читают по губам, требуется полное изображение человеческого лица и его частей.

Рецензируемые результаты были впервые представлены на восьмой международной конференции по вопросам аудиовизуальных процессов проходившей в Университета Восточной Англии.

Исследование также показало, что новый метод наблюдения динамики и полного изображения речевых жестов очень важен и более эффективен, чем традиционный подход в обучении чтению по губам, при котором зрителей учат определять ключевые формы из статических (неподвижных) изображений губ.

При использовании новой тренировочной системы, основанной на видео, зрители с очень слабым уровнем подготовки значительно улучшили свою способность читать по губам односложные слова, что само по себе является очень трудной задачей. Следует надеяться, что дальнейшие исследование может привести к разработке новых методов чтения по губам для глухих и слабослышащих.

«Это исследование впервые показало, что автоматизированная система чтения по губам оказалась более эффективной, чем человеческая, и результаты оказались удивительными», - сказал ведущий автор исследования Сара Хилдер.

«С помощью всего лишь четырех часов обучения они смогли заметно улучшить свои навыки чтения по губам. Мы надеемся, что это исследование будет представлять собой реальный технологический прогресс для глухих», - добавила она.

Агнес Хоктор, менеджер компании RNID, сказала: «Это исследование подтверждает, как трудный жизненный навык чтения по губам должен изучаться и почему RNID проводит кампанию для людей с плохим слухом по расширению для них доступа к обучению. Мы приветствуем развитие и появление видео и онлайн учебных ресурсов в дополнение к преподаванию чтения по губам. Потеря слуха затрагивает 55 процентов людей старше 60 лет, так что со старением населения, потребность в изучении чтения по губам будет только увеличиваться».

Конференция AVSP проводилась в Великобритании впервые с момента создания этой организации в 1998 году. Университет Восточной Англии собрал представителей разных областей современной науки, в том числе психологов, инженеров, ученых и лингвистов из таких стран, как Великобритания, США, Австралия, Канада и Япония.

В рамках конференции делегаты приняли участие в практических семинарах по аудиовизуальным технологиям, в котором многие визуальные речевые синтезаторы, или «говорящие головы», сражались с целью определения наиболее понятной и визуально привлекательной системы.

AVSP работала как спутниковая конференция Interspeech 2009, которая состоялась в Брайтоне. Обсуждались следующие темы:

  • машинное распознавание аудиовизуальной речи;
  • роль сопровождающих речь жестов;
  • моделирование, синтез и распознавание лицевых жестов;
  • речевой синтез.

Основными докладчиками были д-р Питер Булл из Университета Йорка, который исследовал «миф языка тела» и профессор Луис Гольдштейн из Университета Южной Калифорнии, презентация которого называется «Артикуляционная фонология и аудиовизуальная речь».

Исследование было представлено на международной конференции Auditory-Visual Speech Processing (AVSP) 2009 года в Университете Восточной Англии.

Адаптировано из материалов ScienceDaily, предоставленных Университетом Восточной Англии

ПОСЛЕДНИЕ НОВОСТИ