В открытой базе данных Voice Dataset от Mozilla появилось 1400 часов голосовых записей, созданных пользователями со всего мира. По мнению журналистов, это позволит таким компаниям как Apple и Google улучшить работу своих умных помощников, повышая их навыки распознавания речи.
Всего в открытую базу были добавлены 1400 часов голосовых записей. 900 из них — на английском, оставшиеся 500 — на менее распространенных языках, среди которых татарский, чешский, датский и эсперанто. Русского языка среди них нет. Записи были переданы компании 42 тысячами пользователей со всего мира.
Прослушать голосовые записи из открытой базы можно на сайте или в приложении Common Voice, разработанными компанией Mozilla. Все эти данные впоследствии будут использованы IT-компаниями, в том числе Apple и Google. По мнению журналистов, аудиозаписи позволят инженерам улучшить качество распознавания речи в системах голосовых помощников.
Напомним, что в феврале 2019 года Apple сообщила о скором появлении Siri Shortcuts в приложениях American Airlines, Caviar и многих других.