На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Закон и Порядок

135 750 подписчиков

Свежие комментарии

  • Геннадий Хрипунов
    Директора надо немножко покалечить это хулиганство будет ребята не разобрали они думали, что он их товарищ (собутыльн..."Будут ездить на ...
  • Марина Свобода
    работала в школе с 1999 по 2009 гг  И уже в начале 2000х  в школах просто заставляли  учителей вести платные кружки. ...«Овощебаза» у рул...
  • Миша Граник
    Да, без этого штурмовика в СВО не победить.«Я бы походил в ш...

Аудиокниги в исполнении ИИ (пока что на троечку)



Читаю в новостях, что Яндекс.Книги улучшили своего робота-рассказчика, и теперь робот читает аудиокниги с выражением, как живой человек. Ну, думаю, надо попробовать: ведь для многих книг, которые я хотел бы прослушать в машине, аудиоверсий нет.

Для других книг аудиоверсии найти можно, но такие, что слушать их невозможно.
У меня есть в Обсидиане длинный перечень чтецов, я им там ставлю оценки от 1 до 5, чтобы знать, какую версию начитки выбрать при скачивании. К сожалению, хотя бы четвёрку заслуживают далеко не все.

Один актёр, к примеру, считает меня аудиофилом: думает, будто я забрался в безэховую камеру, включил книгу на профессиональном оборудовании за миллион рублей и напряжённо вслушиваюсь в каждый звук. Поэтому он не стесняется периодически переходить на шёпот для лучшего драматического эффекта. К сожалению, из-за автомобильного мотора, шуршащих по асфальту шин и шума улицы шёпот не разобрать, поэтому такая озвучка сразу отправляется в корзину: я хочу слушать всю книгу целиком, а не книгу, из которой вымараны 5% слов.

Ещё есть чтецы-любители: с ними обычно всё настолько плохо, что и безэховая камера не спасёт. Некоторые любители читают «с выражением», то есть сюсюкают, манерничают и озвучивают женские реплики писклявым голосом, вызывая у слушателя острое чувство испанского стыда. Другие пересаливают, включая дидактические интонации карикатурной учительницы начальных классов — этот типаж обычно озвучивает книги по бизнесу. Третьи путают ударения, причём не только в цитатах на латыни, но и в русских словах.
Четвёртые портят запись наложением звуков в стиле «акын» — читает слово «автомобиль», включает фоновый звук автомобильного гудка. Пятые дополнительно к этому раздражают слушателей музыкой.

Способов испортить начитку книги придумано множество. Один из самых эффективных — читать по знакам препинания. Например, чтецу надо прочесть реплику «Здравствуй, Жанна, солнце моё!». В обычной речи реплика читается на одном дыхании, без пауз, с эмоциональным подъёмом, конец одного слова плавно переходит в начало другого, как будто мы поём. Чтецы-любители часто делают так:

— Здравствуй. Пауза. Жанна. Пауза. Солнце моё. Пауза.

Где запятая или точка — там пауза. Так нельзя, правила устной и письменной речи отличаются. К примеру, мы пишем «Маргарита Николаевна», а говорим «Маргарита Николавна», без «е», и ещё тысяча подобных нюансов, надёжно выдающих иностранца, стоит ему только открыть рот. К сожалению, ни чтецы-любители, ни даже многие профессиональные актёры этих правил не знают. Поэтому, когда я прочёл про нового робота-рассказчика, я воодушевился, вознамерившись немедленно испытать нового киберчтеца.

На этом месте журналисты и пиарщики заготовили для меня дополнительный квест: образцов голоса робота в новостях не было (ссылка, ссылка, ссылка, ссылка). Я нашёл даже официальный пресс-релиз от Яндекс.Книг для СМИ, но и там тоже обошлись без примера аудио (ссылка). Должен признать, что пресс-служба Яндекса отлично знает отечественных журналистов: этой породе образцы озвучки не нужны, ей реальный продукт щупать некогда. Современным журналистам надо за 15 минут прогнать пресс-релиз через ЖПТ с командой «перескажи своими словами», слегка подшлифовать пересказ и приступать к «работе» над следующей такого же качества статьей.

Тогда я зашёл на сайт Яндекс.Книг уже в качестве клиента (ссылка). Безрезультатно: образцов озвучки не было и там. Там лежит подборка модных книг, и многие из них озвучены, однако озвучка пока что традиционная, в исполнении кожаных пузырей. Заслушать робота, причём именно новую августовскую модель, я не смог: такой опции на сайте не было.

В итоге я нашёл искомое на Хабре — в виде отчёта для программистов в блоге разработчиков Яндекса (ссылка). В самом конце длинной статьи есть нужное: фрагмент начитки на 48 секунд. Если вам лень включать звук — робот читает на троечку. От безысходности пойдёт, но для художественной литературы пока что непригодно. Интонации дикие, паузы — по синтаксису, прямая речь отделяется от основного текста. В общем, типичные ошибки чтеца-любителя, который поленился сходить хотя бы на одно занятие к преподавателю сценической речи.

Дальше меня могло ждать продолжение квеста. Я слушаю аудиокниги в удобном приложении Simple ABP: в бесплатной версии, так как платную сейчас из-за неверного Гугла скачать невозможно. У этого приложения есть свои недостатки, однако в целом оно меня устраивает, и ничего лучше я пока что для Андроида не нашёл. Предположу (поправьте, если я ошибаюсь), что перетащить книги из приложения Яндекса в формат обычных mp3 так просто нельзя.

К счастью, до закачки книг в бортовой компьютер автомобиля дело не дошло, с таким несовершенным чтецом это не имеет смысла. Я продолжу слушать аудиокниги в исполнении живых актёров: в августе 2025 года роботами их заменить ещё нельзя.

Ссылка на первоисточник
наверх