20 способов перевести аудио в текст: программы для перевода звука голоса в текст онлайн и офлайн
Работа с текстами всегда рождает мысли о том, как упростить процесс набора. Хочется произносить мысль и видеть, как буквы сами бегут по листу. К сожалению, сегодня не одно программное обеспечение не может стать полноценным аналогом ручного набора текста.
Однако можно подобрать приложения и сервисы, которые помогут перевести голосовой набор в текст, что значительно упростит трудоемкий процесс. Про некоторые способы перевода, мы рассказывали в статье, как перевести видео в текст. В этой инструкции речь пойдет про перевод в текст аудио.
СОДЕРЖАНИЕ
Процесс перевода аудиозаписи в текст называется «Транскрибация»
Транскрибацией называют перевод речи из голосового формата текстовый вид. Процесс этот может быть, как автоматическим, так и осуществляться в ручном режиме.
В интернете даже появился несложный вид подработки, когда исполнителю дают звуковую дорожку, где голосом записан текст, который он должен прослушать и набрать на клавиатуре вручную.
В автоматическом режиме перевести речь в текст тоже возможно. Уже существуют программы, способные понимать голосовую запись и набирать услышанное сразу печатным текстом.
Насколько может быть точен перевод звука в текст?
Основной проблемой в вопросе перевода голоса в текст можно назвать шумы, которые забивают фон. Шумом может стать что угодно – музыка, разговоры других людей, звуки улицы, особенно вблизи оживленной трассы. При чистом фоне может проявиться другая проблема – дикция говорящего.
Человеческая речь индивидуальна и имеет свои отличительные черты у каждого:
- информация, записанная на родном языке, звучит понятнее, чем когда ее подает иностранец с акцентом;
- скорость речи имеет большое значение: одни не успевают проговаривать окончания и проглатывают слова, а другие тянут слоги, из-за чего некоторые фразы программой разбиваются на части;
- дикция играет важную роль в вопросах транскрибации – не все люди произносят звуки четко, у многих в речи присутствует фонетическое замещение.
Для того, чтобы повысить качество транскрибации, нужно чтобы записанная речь была произнесена как можно четче. Чем меньше постороннего шума на записи, тем легче программе будет распознать слова. Лучше, если произношение будет не быстрым, но и не замедленным, в нормальном темпе.
Отсутствие акцента у говорящего также повышает шансы на высокое качество распознавания речи. Правильно и без необходимости проводить ручную коррекцию, будет распознана запись диктора в полной тишине. А голосовые сообщения человека с нечеткой дикцией скорее всего потребуется корректировать при помощи клавиатуры.
Кроме того, качество транскрибации зависит и от самой программы. Одни в высоком качестве распознают речь, другие в низком. Многое зависит от квалификации создателей программного обеспечения. Одним удается подавлять шумы и повышать способность распознавать акцент, а другим нет.
Если необходимо перевести большой объем текста из нечеткой голосовой записи в печатный формат, можно воспользоваться услугами фрилансеров и поручить кому-то вручную обработать аудиодорожку. Однако подбирать исполнителя придется, обращая внимание на его рейтинг или отзывы других заказчиков, поскольку не каждый будет добросовестно слушать запись и набирать ее с клавиатуры. Может попасться такой исполнитель, который прогонит звук через одну из программ автоматической транскрибации и не будет тратить время на прослушивание и внесение правок.
Мы собрали здесь несколько вариантов программного обеспечения, способного помочь в вопросе перевода голоса в текст. Одни из них работают только на компьютерах, другие можно устанавливать на мобильные устройства, третьи работают в режиме веб-сервисов.
Глава #1: Приложения для телефона Андроид или Айфона
Приложение #1: Google Keep
Google Keep – приложение, созданное для хранения и упорядочивания заметок на смартфоне. Но его широкий функционал позволяет решить проблему перевода информации из аудиоформата в печатный текст. На главном экране приложения есть символ микрофона, предназначенный для того, чтобы при помощи голоса делать записи. Именно эту возможность Google Keep и нужно использовать для перевода аудио в текст.
Однако если у вас звуковая дорожка записана в память смартфона, загрузить ее в Google Keep не удастся. С длинными диалогами тоже может возникнуть проблема – запись прерывается, если нет звуковых колебаний в течение 2-3 секунд подряд. Но если поделить запись на фрагменты, разделенные длинными паузами, вполне возможно получить текст хорошего качества.
Мы опробовали приложение двумя способами: в первом случае информация была произнесена голосом, во втором – включили тот же фрагмент, но в записи через динамик. Результат получился одинаковым. Единственное, что пришлось подправить – это знаки препинания и пробелы между цифрами, где это требовалось.
Скачать Google Keep с Play Market
Скачать Google Keep с App Store
Приложение #2: Прямая расшифровка
Попробуйте это приложение, если еще не определились, как перевести звуковой файл в текст. Программа для перевода аудио в текст была создана специально для людей с ограниченными возможностями, чтобы при помощи одного только аппарата на базе Android облегчить им процесс коммуникации.
- Обратить речь в текст можно в режиме реального времени. Все, что произнесено, будет отображаться на экране в виде текста.
- Смысл сказанного будет максимально достоверным, потому как у программы есть функция подбора слов в соответствии с контекстом.
- Можно выбрать язык из 80 доступных, удобно переключаться между двумя языками.
- Расшифровки можно хранить на устройстве до трех суток. Этого времени достаточно, чтобы при необходимости перенести информацию на другой носитель.
- Среди хранящихся записей удобно осуществлять поиск.
- Чтобы скопировать текст, достаточно длительным касанием вызвать контекстное меню.
Скачать «Прямая расшифровка» с Play Market
Приложение #3: Голос в текст
Voice to text – несложное приложение, которое делает перевод речи в текст. Оно распознает речь непрерывно, даже длинные записи. Благодаря этому можно работать с длинными диктовками, записывать объемные отчеты, формулировать посты и многое другое. Интересная особенность приложения заключается в том, что оно учитывает пользовательский словарный запас, что важно при распознавании речи, когда нужна замена слов.
Возможности программы:
- Доступна смена языка.
- Можно создавать заметки в текстовом виде и письма для передачи по электронной почте.
- Отсутствует максимальное допустимое значение для числа символов или длины записи заметки.
- Использование пользовательского типа клавиатуры.
- Легкое написание текстов любой длины.
- Автоматическая постановка интервалов.
- Автоматическое сохранение записи.
- Функция «Поделиться».
- Можно вносить правки в текст прямо во время диктовки.
- Функция экспорта в текстовый формат.
Скачать «Голос в текст» с Play Market
Приложение #4: Голосовой блокнот
Приложение «Голосовой блокнот» умеет распознавать речь, а значит в него можно делать записи голосом. Результат можно записывать в облачное хранилище или оставлять в памяти устройства. Длина голосового сообщения не имеет значения. Здесь можно настраивать список слов для замены и пунктуацию для ввода данных голосом. Отдельно вы сможете указать, когда нужна заглавная буква, а когда можно продолжить со строчной. Кроме того, вам доступен откат последнего введенного фрагмента через кнопку или специальную команду.
Работа приложения доступна как при наличии подключения к сети, так и без нее. Однако следует отметить, что работа в офлайне возможна не на всех устройствах. Блокнот позволяет контролировать количество символов, число слов, поддерживает ввод данных на двух языках сразу. Результат можно перенести в раздел «Загрузить» или в «Документы», а также отправить его в любое приложение, работающее с текстами. Также успешно в него можно импортировать файлы из любого файлового менеджера или Google Диска.
Для удобного и быстрого доступа к функционалу создатели сделали виджет, удобно размещаемый на рабочем столе. А при наличии TTS Андроид вы сможете озвучивать заметки.
Скачать Голосовой блокнот с Play Market
Скачать Голосовой блокнот с App Store
Приложение #5: Диктант речи в текст
Приложение «Диктант речи в текст» позволяет получать текст в результате восприятия голосового произношения информации, а полученный фрагмент не просто читать и записывать, но еще и переводить. Программа работает на базе одной их самых новых технологий, благодаря чему легко может перевести голос в текст и передавать его в сообщениях.
С этой программой вы забудете, что значит присматриваться к клавиатуре в солнечную погоду и набирать текст вручную. Просто начните диктовать, и вы получите текстовое сообщение. Настроив связь между своими мессенджерами и приложением «Диктовка», вы легко будете создавать сообщения и отправлять их.
Скачать Диктант речи в текст с App Store
Приложение #6: Transcribe – Речь в Текст
Transcribe – еще одна современная программа для перевода аудиозаписи в текст. Она работает благодаря внедренной технологии Искусственного Интеллекта и представляет тексты легкие для восприятия и не требующие ручной проработки.
Функции приложения:
- Транскрибация любых аудиозаписей.
- Перевод более чем на 120 языков, включая диалекты.
- Возможность загрузки файлов из DropBox.
- Простое экспортирование файлов в любые текстовые редакторы.
- Отсутствие рекламы.
Скачать Transcribe с App Store
Глава #2: Онлайн сервисы для перевода аудио в текст
Для перевода звука голоса аудиодорожки, необходимо включить стерео-микшер в Windows
Онлайн сервисы удобны тем, что для их использования не нужно знать версию своего программного обеспечения и вычитывать совместимость софта с устройством. Не придется скачивать никакие утилиты, а затем их устанавливать. Все работает онлайн.
Такими сервисами легко управлять, и они всегда под рукой. Но только прежде чем получить текст из звуковой записи, потребуется воспользоваться стерео-микшером.
Такой микшер – программное решение, встроенное в операционную систему, которое может смешивать различные звуки. Источник не имеет значения – это могут быть как внутренние, так и поступающие с внешних устройств звуки.
На разных операционных системах и устройствах некоторые детали настроек могут отличаться, но общий порядок действий все равно остается неизменным:
- Внизу, на панели необходимо найти символ динамика и кликнуть по нему правой клавишей мыши.
- Откроется список, в котором вам нужно будет выбрать пункт «Записывающие устройства».
- В окне, которое откроется на экране, переходите на вкладку «Запись», где вы увидите символ микшера. Включите его, а на время работы с голосовой записью все остальные устройства сделайте неактивными.
- Может случиться так, что на предыдущем шаге вы не найдете значка стерео-микшера. В этом случае нужно кликнуть правой клавишей по свободной области в окне и в появившемся контекстном меню проставить галочки для двух пунктов: первый – «Показать отключенные устройства», а второй – «Показать отсоединенные устройства».
В случае, когда после этих манипуляций символ микшера все равно отсутствует, придется установить драйвер звуковой карты, с которым она шла изначально. Только после этого можно будет вернуться к выполнению пунктов алгоритма.
Если программное обеспечение вообще не предусматривает наличие стерео-микшера, можно попробовать установить виртуальную аудиокарту.
Сервис #1: Google Документы
Онлайн сервис «Google Документы» знаком многим и давно является популярным инструментом в вопросе обработки текстов. Но о том, что он может перевести звук в текст онлайн, успели узнать не все.
- Для использования функции заходите на страницу сервиса и нажимайте сначала кнопку «Инструменты», а затем – «Голосовой ввод».
- Если вам нужно преобразовывать аудио в текст не на русском языке, вы можете здесь указать, например, английский.
- Теперь можно открыть аудиодорожку с записью голоса и нажать значок микрофона, чтобы началась запись.
Для успешного завершения процесса важно знать об одной очень важной хитрости: сначала нужно запустить проигрывание голоса, и только потом нажимать на микрофон, активируя процесс записи. Все дело в том, что программа очень чувствительна к любым посторонним шумам. И когда вы, включив микрофон, кликните для начала воспроизведения, щелчок остановит запись. По этой же причине вы не сможете пролистать новостную ленту или пройтись по страницам интернета во время процесса транскрибации.
Плюсом данного сервиса является доступ к сиюминутному редактированию полученного текста, без необходимости сохранять его где-то на внешних или внутренних носителях. Кроме того, за свои услуги Google Документы не требует никакой платы.
Минусами пользователи называют неспособность микрофона концентрироваться на одном голосе, и при появлении посторонних шумов, музыки или второго собеседника теряет способность точно распознавать фразы. Кроме того, записи диалогов со скорой речью качественно перевести вряд ли удастся. Следует отметить, что «Google Документы» корректно работает через браузер «Google Chrome».
Сервис #2: Speechpad
Голосовой блокнот Speechpad – сервис-программа, которая переводит аудио в текст. Чтобы получить доступ к функциям сервиса необходимо пройти процедуру регистрации на сайте.
Этот блокнот умеет получать текст не только с аудио дорожки в записи, но и с потока речи, поступающей через микрофон. Функционал сервиса позволяет корректировать полученные данные прямо в окне браузера.
- Чтобы начать работу, перейдите на сайт и нажмите вверху справа по пункту «Голосовой блокнот». Перед вами откроется дополнительное поле, где вы сможете сменить язык, если запись будет производиться не на русском. После чего нужно запустить воспроизведение и нажать «Включить запись». Останется только дождаться результатов преобразования. Транскрибация не запрещает переходить на другие вкладки и просматривать сторонние сайты.
- Полученный результат можно загрузить себе на диск нажатием на кнопку «Скачать».
Качество печатного текста зависит от того, насколько четкая запись звука и дикция говорящего, есть ли какие-то особенности произношения, присутствует ли шум, а также от того, каким браузером вы пользуетесь. Для «Speechpad» наиболее удачным считается «Google Chrome».
Сервис #3: Dictation.io
Dictation.io осуществляет перевод аудио в текст онлайн бесплатно. Работает сервис только на «Google Chrome». Кроме того, сервис чувствителен к операционной системе – им не получится воспользоваться на компьютерах с установленной домашней версией Windows 10.
В качестве плюса можно отметить автоматическое сохранение результата на диск. Благодаря этому не стоит бояться случайного закрытия вкладки или окна браузера, что нередко случается не только по неосторожности самих пользователей, но и в результате программного сбоя или зависания системы. Однако с готовыми файлами сервис работать не может. Он переводит в текст все, что говорится в микрофон. Для расстановки знаков препинания во время диктовки, каждый символ нужно произнести там, где он должен стоять.
Уровень транскрибации достаточно высокий, практически полностью отсутствуют орфографические ошибки. Если нет желания проговаривать знаки препинания, есть возможность проставлять их при помощи клавиатуры. Готовый текст легко сохранить на ПК.
- Перед началом обработки звука выберите язык источника данных. После этого можно нажать кнопку «Start» – она находится внизу слева. Если ее не нашли, жмите на значок микрофона. Он расположен справа, ниже строки с выбором языка и несет ту же функцию начала записи.
- В поле с текстом можно производить его редактирование, без необходимости переносить фрагмент в отдельное окно блокнота. А готовый результат вы всегда можете сохранить в нужном вам формате, записать на внешний носитель или опубликовать в интернете.
Сервис может похвастаться богатым словарным запасом, благодаря чему через него можно пропускать профессиональные тексты, насыщенные специфической терминологией. Во время преобразования текста можно пользоваться другими вкладками браузера. Корректная работа Voice Notepad и высокий уровень транскрибации возможен только в «Google Chrome».
Сервис #4: Speechlogger
Speechlogger – сервис, в котором доступен перевод аудиозаписи в текст онлайн. Для начала использования необходимо зайти на страницу официального сайта. Регистрироваться сервис не потребует. Для новичков предусмотрены обучающие видео, помогающие разобраться в функционале. Однако вам, скорее всего, не потребуется изучать эти ролики, поскольку интерфейс сервиса достаточно простой и понятный даже для тех, кто впервые решил заняться транскрибацией.
- Первый шаг – выбираем язык, на котором будет произнесен текст.
- Полученный результат вы можете сохранить на «Google Диск», скачать в формате srt, doc или txt, а также направить в сообщении по электронной почте.
Технологию распознавания сервис использует от Google, поэтому следует помнить о том, что качество набранного текста может пострадать из-за быстрой речи, посторонних шумов, нечеткой дикции и присутствия дополнительных голосов. В качестве неоспоримых плюсов необходимо выделить отсутствие платы за широкий функционал, позволяющий минимизировать ручной труд.
Сервис #5: Vocalmatic
Vocalmatic – еще один неплохой онлайн переводчик аудио в текст. Чтобы начать здесь работу, понадобится пройти регистрацию через действующий электронный ящик, или воспользоваться готовым аккаунтом в Google или LinkedIn. Бесплатно вы сможете обработать не более 30 минут голосовой записи, при этом дорожка должна быть сохранена в формате mp3. Сервис имеет англоязычное меню, но несмотря на это с использованием его функционала вряд ли возникнут трудности.
- Для начала работы кликайте по «New Transcription» и вам станет доступно окно для загрузки дорожки.
- Шаг первый – укажите формат мультимедиа. Шаг второй – загрузите файл, требующий обработки.
- Шаг третий – выбор языка, на котором записан голос.
- Шаг четвертый – здесь вы выбираете формат, который получится на выходе. В вашем распоряжении два варианта: оставить как есть, по умолчанию, или сменить значение на формат субтитров «srt». После того, как все подготовительные шаги проделаны верно, кнопка «Submit» станет активной.
- Через всплывающее окно сервис будет предупреждать о количестве оставшегося бесплатного количества времени для транскрибации.
- После завершения обработки аудиотекста на ваш электронный ящик придет ссылка на результат. Эту же ссылку вы легко найдете на вкладке «Transcriptions» в своем личном кабинете на сервисе.
- Страница с результатом позволяет вносить правки в текст. А при помощи кнопок вы сможете дать некоторые полезные команды по отношению к полученному тексту: выгрузить в предложенных текстовых форматах или прослушать загруженный файл.
Сервис #6: oTranscribe
Сервис oTranscribe знает, как перевести аудиозапись в текст онлайн бесплатно. Перевод аудиозаписи в текст осуществляется с нескольких форматов, включая возможность записывать текст и с видео: mp3, webm, wav, mpeg и некоторые другие.
Для упрощения процессов управления воспроизведением дорожек можно самостоятельно назначить горячие клавиши. Есть возможность использования простого текстового редактора, проставления интерактивных меток и автосохранение.
Глава #3: Программы для преобразования аудио в текст на компьютере
Для компьютеров создано несколько программных комплексов, которые осуществляют перевод звукового файла в текст. Работают они по такому же принципу, что и веб-сервисы, функционирующие в рамках интернет-обозревателя. Но главное отличие их заключается в том, что работе любого онлайн сервиса требуется подключение к интернету. А программа, установленная на компьютер, может превращать голос в текст без выхода в сеть.
Программа #1: Voco
Программа Voco была создана силами специалистов РФ и адаптирована под Windows. Она предназначена для того, чтобы конвертировать речь в текст. Для этого не обязательно говорить в микрофон непосредственно в момент преобразования текста. Можно использовать уже записанную речь или взять озвучку из какого-то видео. Программа удобна тем, что без проблем читает все популярные форматы аудиофайлов. При этом качество результата большинство пользователей оценивают, как высокое. Минус у программы всего один – она платная.
Программа #2: Express Scribe
Это программное обеспечение позволяет преобразовывать звуковой формат в текстовый при помощи ручного управления. Ее интерфейс предлагает панель с кнопка «Воспроизведение», «Стоп», «Пауза», а также кнопки для изменения скорости проигрывания. Когда вам нужно набрать большой объем текста, попробуйте эту программу. Просто включите запись, настройте скорость проигрывания и громкость воспроизведения. Параллельно откройте любой удобный сервис, куда будет записан текст в печатном виде.
Единственное, что может вам не понравится здесь – отсутствие русскоязычного меню. Весь интерфейс представлен на английском языке. Но по пиктограммам легко догадаться, какая кнопка за что отвечает, поэтому отсутствие знаний языка не станет препятствием во время использования программы.
Программа #3: Lossplay
LossPlay – программа переводчик аудио в текст. Она была создана российскими разработчиками, что является неоспоримым плюсом для тех, кто не любит иноязычное меню.
Ее можно посоветовать всем, кто только начинает осваивать процесс перевода речи в текст. Для удобства использования создатели предусмотрели несколько горячих клавиш. Кроме понятного меню, в качестве плюса можно выделить удобную интеграцию с текстовым редактором MS Word. Программа может читать множество аудиоформатов, позволяет менять скорость воспроизведения и вставлять тайм-коды.
Глава #4: Расширения для браузеров
Помимо уже описанных нами приложений, онлайн сервисов и программ для ПК существует еще одно решение, осуществляющее перевод голоса в текст – плагин для браузера. Большинство их них платные, но если не жалко времени и сил, можно найти и бесплатное дополнение для обозревателя. Если вы готовы поэкспериментировать с этим видом преобразователей и не боитесь за качество платить, посмотрите нашу подборку.
Расширение #1: VoiceIn Voice Typing
Этот плагин удобно использовать тем, кто набирает большие объемы текстов на сайтах. Например, отзывы или комментарии. Если к микрофону поднести любую аудиозапись, расширение тут же начнет текстовый набор услышанного.
Это расширение для браузера может работать с 120 языками, что удобно при переводе из аудио в печатный вид иностранных записей. Для тестирования функционала разработчики позволяют первое время пользоваться им бесплатно. Если расширение вам понравится, вы сможете его купить.
Расширение #2: Voice to Text
Перевод аудио текста в печатный вид возможен через дополнение для Chrome. Среди доступных для распознавания языков русский и еще 59 иностранных.
Принцип работы не отличается от аналогов – включается запись или начинается диктовка, а алгоритмы переводят звук в печатный текст.
Расширение #3: Speech Recognition Anywhere
Speech Recognition Anywhere удобно использовать для заполнения форм на сайтах или составления электронных писем. Кроме того, расширение позволяет давать команды браузеру во время просмотра веб-страниц, среди который прокрутка, заменяющая поворот колесика мышки, запуск или остановка воспроизведения песен или видеороликов онлайн. Но главное – дополнение можно использовать как переводчик аудио файлов в печатный формат.
Глава #5: Транскрибация речи в текст в Windows
Если вы приобрели подписку Office 365, можете воспользоваться возможностями диктовки, чтобы преобразовать речь в набранный текст. Для начала использования вам потребуется авторизоваться под своей учетной записью и задействовать микрофон. После этого можно активировать функцию записи речи. Все, что вы скажете в микрофон, будет преобразовано в текст на экране.
Если же у вас на ПК установлена Windows 11, 10 или 8, вы можете преобразовывать аудиофайлы в текст силами штатных возможностей операционной системы, не привлекая никакого дополнительного программного обеспечения. Для это существует специальная функция «Распознавание речи», включив которую можно реализовать задуманное.
Чтобы все работало правильно, проверьте, подключен ли микрофон:
- Зайдите в «Пуск», перейдите в «Параметры», далее откройте пункт «Время и язык», чтобы попасть к разделу «Речь».
- В блоке «Микрофон» используйте кнопку «Начать».
Если вы хотите научить Windows 10 распознавать ваш голос, проведите следующую настройку:
- Чтобы долго не искать, в каком разделе меню находятся необходимые параметры, в строке поиска на панели задач впишите запрос «Распознавание речи Windows». В списке предложенных результатов кликните по одноименному пункту.
- Если перед вами не открылось окно средства обучения распознавания речи с приветствием, пройдите в «Панель управления». Далее откройте раздел «Специальных возможностей», там вы найдете подраздел «Распознавания речи», где и будет искомый пункт «Обучить компьютер для улучшения распознавания вашего голоса».
- Далее вам поможет электронный подсказчик, который опишет пошагово, как нужно действовать.
Глава #6: Способ перевода аудиофайла в текст через виртуальный аудиодрайвер компьютера
Суть метода
Метод полезен и для вычленения звука из видеоролика. Но в нашем случае, нужно решить, как аудиозапись перевести в текст на компьютере. Программа перевода голоса в текст с подобным методом есть у Google и Яндекса, а также некоторых других компаний.
Особенностью этих программ является неспособность захватывать звук, поступающий из динамиков ПК. При помощи установленного виртуального драйвера вы сможете перенаправлять потоки из динамиков сразу в микрофон. После чего можно применять любой из доступных сервисов по переводу речи в текст – программы будут воспринимать поступающую из динамиков на канал микрофона информацию как аудиопоток, что позволит им транскрибировать данные.
Помните, что во время преобразования звук из динамиков идти не должен, так как он перенаправляется на канал микрофона. Поэтому после завершения транскрибации не забудьте отключить виртуальный аудиодрайвер, чтобы восстановить работу динамиков.
Установка виртуального аудио драйвера
- Загрузить установочный пакет можно с официального сайта.
- Загруженный архив нужно распаковать. В папке с файлами вы найдете «VBCABLE_Setup.exe». Двойным кликом по нему вы запустите процесс установки. Для 64-битных систем файл называется немного иначе: «VBCABLE_Setup_x64.exe».
- Когда установка будет завершена, вы увидите два новых устройства в настройках звука. Одно предназначено для воспроизведения «Cable Input» и записи «Cable Output».
- Попасть в настройки звука можно через команду «Выполнить». Ее вызвать проще всего сочетанием клавиш «Win» + «R». В строку команды нужно вписать «mmsys.cpl». От правильности набора команды зависит, можно ли аудиозапись перевести в текст. Поэтому если горячие клавиши – не ваш вариант, напишите в строке поиска «Настройка звука», чтобы из предложенного списка выбрать нужный вариант.
Включение виртуальных аудио устройств записи и воспроизведения
Перед тем, как переводить аудио в текст, включите виртуальные устройства.
- Открыв «Настройки звука», переключитесь на вкладку «Воспроизведение». Перед тем, как что-то менять, запомните устройство, активное в данный момент. Его вы вернете в активное положение после того, как закончите переводить звук в текст. Теперь можно выбрать «CABLE Input» в качестве устройства по умолчанию.
- После того, как воспроизведение настроено, переходите на вкладку «Запись». Здесь тоже обратите внимание, как называется микрофон, задействованный на данный момент. После этого укажите в качестве устройства по умолчанию «CABLE Output». Когда настройка завершена, нажимайте «OK» внизу окна.
Теперь приступайте к транскрибации. Посылайте любые аудиопотоки через настроенную связку динамик-микрофон и получайте на выходе текст. Когда преобразование текста будет завершено, нужно будет вернуть настройки в исходное положение.
Какие сервисы перевода речи можно использовать в этом методе
Для конвертирования звука в речь осталось только выбрать, какая это будет делать программа. Перевести аудио в текст онлайн бесплатно можно через сервис Яндекса. Это переводчик, которые не боится иностранных языков и легко транскрибирует не только русскую речь. Текстовое поле вмещает до 10000 символов. Аналогично работает сервис Google. Он тоже знает не только русский язык, у Google обширный набор языковых пакетов. Поле для ввода текста рассчитано на 5000 символов. Если вам нужно поле для более объемного текста, воспользуйтесь онлайн сервисом Dictation. Но он только конвертирует из аудио в текст, без функции перевода.
Если вам требуется переводить записи, выберите любой из доступных онлайн-сервисов, где останется указать исходный язык и язык конечного текста. Если вы выбираете функционал Яндекса или Google, конвертация начинается с первых звуков воспроизведения. Кнопки «Старт» и «Стоп» здесь не нужны. В случае, когда текстовое поле будет переполнено, вы можете вырезать оттуда надписи и перенести их в обычный блокнот, после чего продолжить транскрибацию.
В отличие от двух популярных сервисов, на Dictation есть кнопка «Стоп»/«Старт», которая управляет процессом. После того, как весь текст будет обработан и переведен в печатный вид, вы сможете его перенести в любой онлайн словарь для представления на другом языке.
Для настройки сервисов воспользуйтесь подсказками:
В Яндексе воспользуйтесь символом микрофона для голосового ввода и выберите языки:
В Google микрофон расположен в нижней части окна, также есть возможность выбрать языки:
Dictation выглядит как линейная третрать и имеет кнопку «Start».
Не забудьте, что после завершения работы с конвертацией текста вам нужно вернуть настройки звука в исходное положение, иначе динамики продолжат молчать.
Как вернуть микрофон и динамики в Windows
Когда онлайн перевод звука в текст завершен, нужно настройки звука вернуть в исходное состояние:
- Перейдите в «Настройки звука» через строку «Выполнить» или поиск в меню «Пуск». На вкладке «Воспроизведение» выберите то устройство, которое было указано у вас «По умолчанию», и верните ему этот статус. То же потребуется сделать на вкладке «Звук».
- Окно «Воспроизведения» выглядит так:
- Восстановление записи происходит на одноименной вкладке:
После этого можно слушать музыку через динамики, как до изменения настроек.
Заключительные советы
Мы рассказали вам, как быстро перевести аудио в текст. Приложение для перевода подходит тем, кто работает на смартфонах. Для транскрибации через ПК можно использовать программы, расширения для браузера или виртуальную аудиокарту. Выбор зависит от ваших технических возможностей. Помните о том, что зачастую высокий результат, как правило, можно получить при помощи платных решений особенно, когда качество записанной аудиодорожки невысокое.
Если же у вас есть записанная речь, которую перебивают посторонние шумы, скорее всего, вам потребуется помощь фрилансеров, потому как с таким материалом лучше всего разберется живой человек.