Компьютер научили читать по губам

Иорданский учёный Ахмад Хассанат (Ahmad Hassanat) разработал технологию, позволяющую компьютеру читать по губам пользователя.

Компьютерная система действительно читает по губам пользователя, переводя движения на лице человека в слова. На текущий момент эффективность программы достигла уже 76%.

Исследователь отмечает, что оставшиеся 24% преодолеть будет сложнее всего, поскольку компьютер следует научить индивидуальной мимике каждого конкретного человека, что совсем непросто.

В звуковой речи, распознавание которой для современных компьютеров уже не является проблемой, человек использует в среднем 50 звуков, которые формируют слоги и слова. Однако, для воспроизведения этих звуков губы и язык принимают только 14 различных форм.

На данный момент алгоритм, лежащий в основе программы, по словам его создателя, является скорее упражнением на догадливость для ПК, нежели методикой однозначного распознавания форм. Впрочем, разработкой уже заинтересовалось несколько крупных лабораторий.

Ранее инженеры Microsoft представили программную платформу, которая с высокой точностью считывает язык жестов, переводя язык глухонемых в обычную речь. Система способна считывать звук, даже если руки человека двигаются с высокой скоростью, как это бывает при обычном разговоре.

Читайте также:

Сумчасті перешкоди — як Volvo готується до випуску безпілотника

Как смарт-студия StyleShoots поможет создавать модные фотосессии

Quill — технология для виртуального рисования от Oculus

Голосовое достижение Microsoft, платный Tinder, «зелёный» Airbnb и кое-что ещё