Dagdamor
В речи человека слишком много всего. Пометить интонации - это, извините, получится "чтение текста с выражением". В то время как в динамичном разговоре походу одной фразы мелькает несколько интонаций, меняется громкость голоса, тембр, и множество всего. Столько пометочек не расставишь.
На мой взгляд, по этой же причине невозможно преобразование голоса, на котором настаивал Драник - ведь это не обработка по одному, раз и навсегда определённому алгоритму. Это сотни (если не тысячи) алгоритмов для различных типов речи одного человека, которые надо определить, расставить "пометочки", после обработки сделать плавные переходы где надо... И потом ещё не факт что получится.
Что же насчёт того, что "да просто поменяют актёров на тех, у кого голоса похожи" - а знаете, слух такой же орган восприятия, как и зрение. Представьте, поменяется стиль рисовки? Скажем, Симпсоны у Трейси Ульман очень похожи на нынешних, но с моей точки зрения изменения такого масштаба выглядели бы крайне радикально.