Как мы разрабатывали синтез речи для Ил-2 Штурмовик
Нам посчастливилось принять участие в разработке синтеза речи для новой версии игры игры Ил-2 Штурмовик — Ил-2: Корея. Это был длинный путь, но в итоге у нас получилось:
Сделать синтез на 8 языках русском, английском, китайском, корейском, японском, немецком, французском и итальянском;
В итоге пришлось работать на основе записей "профессиональных программистов" (как в старые добрые, но в этот раз это были C++ программисты-разработчики игры);
Синтез работает только на CPU практически без задержек;
Голоса умеют не только говорить, но и "кричать".
В игре на данный момент озвучиваются только игровые боты (игра сейчас в раннем доступе), но возможно когда-нибудь синтез доедет и до мультиплеера.
Как это выглядит в игре
Демонстрацию ниже для нас сделали разработчики игры. Сразу нужно оговориться, что "крик" тут немного "особенный" и скорее соответствует очень возбуждённой речи в стрессовой ситуации.
То есть, грубо говоря, в идеале должна быть довольно пунктирная речь, или очень возбуждённая пунктирная речь. Естественно в игре на это накладывается шум радио и двигателя самолёта, что несколько сглаживает углы и понижает требования к качеству синтеза.
Легенда ИЛ-2 и текущее состояние игровой индустрии в России
Оригинальный Ил-2 Штурмовик входит в "пантеон" великих игр позапрошлой итерации нашей игровой индустрии, которая немного закончилась примерно к концу нулевых. Ну то есть было и мировое признание, и миллионные тиражи (если знаете точнее — напишите) и народная любовь. В те времена Ил-2 прямо называли лучшим авиасимулятором (ключевое слово тут симулятор) и он прямо конкурировал с Microsoft Flight Simulator по уровню популярности и фанатской любви.
Если перенестись в настоящий момент, у нас наблюдается системный кризис игровой индустрии. Все более менее успешные команды в лучшем случае "сменили прописку" (почитайте фамилии в титрах таких успешных игр как Space Marine 2 или Rogue Trader). По этой причине для нас представляет особенную радость и гордость "прикоснуться" к легенде и в идеале оставить в вечности маленький кусочек своей работы в таком легендарном продукте, который сделан в нашей стране.
Пара слов про AI-slop и не только
Многих разработчиков западных AAA-игр принципиально пытались "отменить" за присутствие низкокачественных нейросетевых ассетов в играх. Тут ситуация по сути обратная, т.к. мы не пытаемся подменять творчество нейрослопом (или агрессивно резать косты, выставляя нереалистичные задачи команде разработки на фоне общего навязывания "круток" и "подписок").
По сути мы создаём контент, который бы иначе не мог бы в принципе быть создан. А именно сам контент игры по факту создаётся людьми (синтез только озвучивает то, что ему дал разработчик).
Постановка задачи
В современном мире задача сделать "yet another" синтез же простая, правда? Берёшь самый модный публичный репозиторий с 100500 звёзд и самой большой LLM, берёшь, что записал диктор, и "GPUs Go Brrr", правда? Но, к сожалению, нет.
Какое-то время назад к нам обратились разработчики игры и рассказали, что хотят добавить синтез в свою игру. При этом на старте сразу обсуждался некий продуктовый список требований, при этом требования зачастую были очевидно продиктованными необходимостью:
Работа сильно быстрее реального времени без задержек (ну тут очевидно);
Работа внутри клиента игры (синтез не может зависеть от внешних серверов, да и задержка будет портить впечатление, плюс сложно масштабироваться при успехе игры);
Покрытие как минимум 8 популярных языков (тут по сути неизбежно, так как это список воюющих сторон);
Возможность гибкой озвучки имён собственных и топонимов (без этого теряется гибкость разработки нового контента);
Возможность генерировать как обычную пунктирную речь, так и "крик" (речь должна быть похожа на то, как говорят реальные лётчики).
Программа минимум — оживить общение с игровыми ботами, диспетчерами и игровым окружением. Сделать добавление нового контента не зависящим от дикторов и разработки синтеза (все же знают приколы про "билдоту" и кривые и лишние фразы озвучки в старых играх).
"Оживление" диспетчеров и ботов подразумевает, что нужно произносить всякие разные топонимы и числа в разных комбинациях, что раньше решалось конкатенацией слов, что несколько делало игру более "роботизированной" и шаблонной. То есть заранее предзаписать всё и поддерживать это потом на N языках просто технически невозможно с современными требованиями к качеству контента.
Шумность обстановки, радиопомехи, звучание речи на фоне — несколько упрощает задачу, но не решает основной проблемы. Речь должна быть чёткой и не должна нарушать погружение игрока в игру.
Поскольку подразумевается длительная поддержка и выпуск большого количества DLC, направленных на разные театры военных действий, ситуация, где нужно потом будет бегать за дикторами на всех языках тоже — совсем не очень.
В начале нашего общения у нас была гипотеза, что раз активное комьюнити игры большое, имя студии известное, какой-то бюджет есть, то мы сможем привлечь профессиональных актёров.
В итоге найти людей-носителей нужных языков в команду для проверки синтеза и собственно создания контента получилось, а вот с актёрами озвучки вышел конфуз:
Санкции плюс мало кто хочет работать с компанией из России;
Иррациональный страх актёров перед AI (небезосновательный, если послушать безумную риторику ряда заинтересованных корпораций, в части синтеза — пока преждевременный);
Ну и ... как бы помягче сказать. В списке языков для озвучки присутствует подозрительно много стран, которые в разные исторические эпохи пытались осуществить нехорошие планы, разнящиеся от простого военного поражения до полного уничтожения нашей цивилизации.
Также в какой-то момент при планировании ресурсов стало понятно, что нельзя использовать GPU. Ну вот совсем. То есть нужна кастомная, особенная, просодия ("спокойный крик"), дикторов нет, синтез должен работать на 1 потоке процессора на "калькуляторах". Отличное начало!
Озвучено профессиональными программистами
В сухом остатке, получается, на старте мы имеем следующее:
Отсутствует возможность привлечь профессиональных актёров в нужном количестве;
Довольно сильные требования к кастомизации, портативности, поддерживаемости;
Длинный список языков.
Отсюда получается, что неизбежно использование услуг озвучки "профессиональных программистов" как в старые добрые времена игр на CD-дисках. Но на этой базе нужно ещё и научить голоса русскоязычных программистов говорить на других языках. Бонус тут состоит в том, что целевой крик тут немного проще, чем настоящий крик у профессиональных актёров.
Для начала стоит взглянуть на список языков и их фонетику:
Если, для начала для простоты, сфокусироваться на первых четырёх языках, то видно, что все языки используют совсем разные системы письма, которые ну вообще никак не связаны (разве что исторически). Отсюда получается, что надо или пытаться приводить их к некой единой схеме "правописания" или использовать фонемы.
Но даже так, слоном в комнате является английский язык, где произношение (особенно топонимов) может вообще никак не быть связано с написанием. Отсюда нужно или придумывать свою общую схема романизации / кириллизации или просто использовать фонемы.
Всё, как обычно, упирается в наличие адекватных инструментов и простоту их поддержки на дистанции:
Для русского нет адекватных готовых общепринятых инструментов по фонемизации или латинизации, увы. Но тут всё "просто". У нас они есть. Берём наши обширные словари ударений и фонем, нейросетки для ударений и фонем (фонемы разрешаются с точностью 99% на русском, если знать ударение), передаём это всё разработчику игры, и переводим все корпуса в фонемы. Ах да, ещё у нас есть активная морфология, падежи, спряжения, согласование в роде числе и падеже — но думаю вы про это всё знаете. Дальше при появлении нового слова (допустим название населённого пункта) разработчик просто ставит ударение и прогоняет слово через фонемизатор, слушает, добавляет в игру. Все эти инструменты быстрые, но на данном моменте их наличие в клиенте пока не требуется;
Для английского ввиду отсутствия падежей в современном языке — всё по сути сводится к поиску правильного словаря. Но вот незадача, если мы идём в использование фонем, то нужно выбирать словари и фонемы так, чтобы один и тот же звук в разных языках обозначал реально один и тот же звук. По сути это, конечно, проблема, так как в английском существуют десятки диалектов и люди реально говорят по-разному. И, зачастую, словари фонем существуют все в разных форматах. Это всё, естественно приходится править руками и массово отслушивать. По сути сложность задачи тут состоит в том, чтобы найти точку, где дальше различие между звуками уже не является важным. Точность фонемных моделей тут составляет примерно 95%, то есть при добавлении нового слова часто приходится переписывать, но это лучше, чем писать фонемами руками с нуля. Ещё мозг часто взрывает то, что при внимательном отслеживании материала носители языка сами очень часто не говорят знаменитый звук θ и часто жуют все гласные и превращают их в "шва";
С китайским как ни странно всё просто. Есть по сути официальный государственный фонетический стандарт пиньинь. Есть готовые библиотеки, которые переводят китайские иероглифы (汉字) в него с расстановкой тонов. Дальше, по сути у китайцев всего около 1500 слогов (слог состоит из инициали и финали). Каждый слог можно однозначно записать фонемами, то есть существует прямой словарь соответствия (плюс символы для тонов) между слогами и фонемами (естественно не все слоги встречаются во всех тонах). Особняком стоит вопрос расстановки пробелов между словами (сами китайцы их зачастую не пишут). Пробелы помогают синтезу (как минимум в индо-европейских языках) с ритмикой и ударениями. Тут это нивелируется тонами, но мы ради интереса всё-таки решили расставить пробелы между словами (но разницы особо нет, чуть докидывает буквально). Есть незакрытый вопрос с "омографами" (иногда биграммы "знаков", 字, читаются по-разному в зависимости от смысла) и тем, что некоторые тоны не могут соседствовать друг с другом (попробуйте быстро прочитать два слога подряд третьим тоном, то есть nǐ hǎo) — но это мы уже отдали на откуп самой нейросети и носителям языка. По сути использование такого процесса упрощает поддержку, так как все носители языка априори знают тоны и пиньинь (пусть писать тоны циферками и чуть менее удобно);
С корейским языком всё одновременно и очень просто, но есть свои подводные камни. Для начала, все материалы в интернете ... это, естественно, южнокорейский язык. Но тут мы ничего не можем поделать. Письмо у корейцев фонетическое, но знаки "странные", потому что глядя на китайцев (видимо они бумагу так экономили), они решили объединять свои буквы в слоги и писать их тоже "квадратиками". То есть, по сути, надо разложить "квадратики" в обычные буквы и дальше перевести в фонемы. У корейцев есть строгие правила чтения, но там ряд звуков меняется в зависимости от контекста. По идее это можно записать в виде правил ... но мы решили этот вопрос тоже через нейросети на минимальном корпусе и сформировали словарь на все слова языка. Точность перевода получается очень высокой. Из плюсов тут нет тонов, почти нет ударения и почти нет пробелов между словами;
В сухом остатке — каждый язык мы преобразуем в набор фонем. При этом мы тщательно перебрали руками все эти фонемы, чтобы они друг другу не противоречили. Это невозможно сделать абсолютно идеально, но основные проблемы классических фонемных словарей мы победили (например палатализацию). Всегда есть тонкости и маленькие детали, от которых приходится отказываться.
Итак, со "знаками" мы разобрались. Теперь нужно что-то сделать с голосами и криком. С криком проще — нужный в игре крик можно просто записать. То есть можно записать "спокойную" и "кричащую" (возбуждённую) версию голосов. Из этого, в принципе, даже можно сделать синтез на русском языке. Но как сделать синтез на всех языках?
Тут, глобально мы перепробовали очень много всего, но можно глобально выделить три работающих подхода:
Изначально мы проделали большое количество экспериментов по генерации крика на основе формант. На чистых идеальных данных на одном языке (русском) — метод интересный и перспективный. Но когда мы стали пытаться накрутить наши данные на другие языки — метод перестал работать. Судя по проведённым экспериментам метод рабочий, если вы условно делаете Алису и не ограничены в записях, бюджете и количестве аудио.
Первую более-менее рабочую версию мы сделали на основе transfer learning, то есть когда мы обучали модели на публичных данных, и потом дообучали на наших голосах. Но тут проблема основная в том, что с учётом требования по крику, допустим два языка у нас получалось поселить в модели с нужным качеством. А дальше — уже модель начинала плыть, то есть данные шумноваты, их слишком мало. Оно говорит чётко, произносит все тоны и фонемы, но акцент слишком сильный. Носители языка совсем не одобряют, даже с учетом того, что ты управляешь самолётом.
В итоге мы остановились на том, что использовали нашу собственную систему синтеза и переозвучки, чтобы сгенерировать синтетический датасет для обучения итоговой модели. В итоге на основе уже синтетического датасета, сделанного из записей "профессиональных программистов", мы сгенерировали продуктовую модель на других языках.
Вместо вывода
Судьями нашей работы и работы разработчиков будут только игроки и время. В любом случае у нас на рынке есть не так много живых нетривиальных игровых проектов и поучаствовать в разработке продолжения легендарной игры — для нас большая удача и честь. Остаётся выразить надежду, что дальше будет только больше нетривиальных проектов и что кризис рано или поздно закончится.
Легендарные «Дальнобойщики 2» появились в Steam!1
Привет! Это Dessly!
🎯 Спустя больше двух десятков лет после первого появления культовая игра «Дальнобойщики 2» стала доступна в цифровом магазине Steam.
Теперь любой желающий может легко купить и установить эту легендарную отечественную игру на современном компьютере.
Напоминаем, что пополнить баланс Steam быстро и без лишних сложностей можно через Dessly.com
👉 Dessly делает процесс пополнения Steam кошелька максимально удобным, быстрым и безопасным!
Что это за игра и о чём она
🎯Дальнобойщики 2 — это симулятор водителя-дальнобойщика, в котором также присутствуют элементы экономической стратегии. Игру разработала новосибирская студия SoftLab-NSK, а выпустила компания «1С» в апреле 2001 года.
В игре вам предстоит взять на себя роль дальнобойщика и колесить по огромному открытому миру. Нужно брать заказы, доставлять грузы в разные города, зарабатывать деньги и постепенно развивать собственную транспортную компанию.
Главная цель — стать лидером на рынке грузоперевозок. При этом мир в игре полностью открыт, без загрузок между локациями — можно свободно ездить между городами, выбирать маршруты и находить скрытые дороги.






Для многих игроков «Дальнобойщики 2» стали одной из самых запоминающихся отечественных игр своего времени. Проект даже сравнивали с легендарной Elite — не из-за масштаба, а благодаря ощущению полной свободы. Только вместо космоса здесь бескрайние автомагистрали и долгие рейсы по дорогам вымышленной страны.
А особую атмосферу игре придавала знаменитая песня «Тореро» группы «Ария», которая стала одной из визитных карточек проекта.
Что изменилось в версии для Steam
🎯В Steam вышла именно оригинальная версия «Дальнобойщиков 2» с русским интерфейсом и субтитрами. Никаких масштабных изменений и переработок разработчики не делали.
Главное нововведение — в игру добавили 19 достижений. Это сделано для того, чтобы у игроков появился дополнительный стимул снова отправиться в рейс и выполнять контракты.
Также игру немного доработали, чтобы она стабильно работала на современных компьютерах. Но серьёзных правок ждать не стоит — исходный код игры, к сожалению, не сохранился, и возможности для доработок сильно ограничены.
🎯В российском сегменте Steam «Дальнобойщики 2» стоят 240 рублей. Но до 8 июля действует скидка 40% — игру можно купить всего за 144 рубля.
Возвращение «Дальнобойщиков 2» в Steam — отличная новость для всех, кто вырос на этой игре и хочет снова окунуться в ностальгию.
А для тех, кто не застал её в своё время, это шанс познакомиться с проектом, который стал настоящим символом целой эпохи отечественного игропрома
🔥 Не тяни кота за подписку — жми "Подписаться" прямо сейчас! → VK Dessly
Реклама. ИП Миронов А.А, ИНН: 910708038901
RollerCoaster Tycoon 3 Complete Edition [Повторная раздача] и Voidwrought — 100% скидка в Epic Games Store!
Любимый игроками и критиками симулятор парка аттракционов возвращается — настало время вновь познакомиться с игрой, ставшей бестселлером, и построить парк своей мечты. Насладитесь классической игрой, определившей стандарты своего жанра, в комплекте с двумя расширениями.
Страница игры и раздачи в Epic Games Store:
Раздача продлится до 2 Июля.
⛔ Недоступна в: Россия, Беларусь, Китай, Украина, Северная Корея.
Тайкун уже однажды раздавали:
Страница игры в STEAM, для получения большей информации:
Ваш парк. Ваши правила
Что бы вы ни хотели создать, RollerCoaster Tycoon 3 даёт вам все
необходимые средства и полную свободу действий — постройте парк развлечений своей мечты.
Станьте настоящей акулой бизнеса и пробейтесь на самую вершину.
Управляйте финансами, магазинами, услугами и работниками в своём парке
в десятках разнообразных сценариев. Начните путь успешного магната в режиме
карьеры или создайте свой идеальный парк, не думая о расходах,
в режиме песочницы. Удовлетворяйте потребности своих посетителей и следите за тем,
чтобы ваш парк работал, как хорошо отлаженный механизм.
Приготовьтесь к играм в воде и знакомству с дикой природой!
В состав данного полного издания входит также весь контент из расширений Soaked!
и Wild! Насладитесь дополнительными возможностями и испытайте свои силы, создавая весёлые аквапарки и эффектные вольеры с дикими животными.






Улучшенная версия для ПК
RollerCoaster Tycoon 3 совместим с современными компьютерами и впервые
поддерживает режим широкого экрана и высокое разрешение 1080p.
Катайтесь на горках
Оцените свои творения в RollerCoaster Tycoon 3 от первого лица с фирменной
камерой для аттракционов.
Море контента
В вашем распоряжении окажется более 300 различных
аттракционов, 500 декоративных элементов, 60 магазинов и услуг
и 20 животных, которым потребуется ваша любовь и забота.





Peep Designer
Создавайте собственных посетителей, чтобы взглянуть на свои творения их глазами.
MixMaster
Поразите своих посетителей эффектными лазерными шоу
и фейерверками.
2D экшн-платформер в отрисованном вручную мире космического хоррора. Исследуйте оттаивающие руины Первой Цивилизации и столкнитесь с богами, которые в них обитают. Наращивайте силы, ищите древние артефакты и расширяйте обитель среди развалин.
Страница игры и раздачи в Epic Games Store:
Раздача продлится до 2 Июля.
Страница игры в STEAM, для получения большей информации:
Восход Красной Звезды возвестил о наступлении новой эры. Симулякр выбрался из кокона и отправляется за ихором, кровью богов, которую хранят чудовища.
Voidwrought — это динамичный экшен-платформер с разветвленным деревом разнообразных способностей и битвами с грозными боссами. Находите и используйте мощные реликвии и Души, чтобы разнообразить свой стиль игры. Разберите руины Серого города и постройте обитель, наполненное верными последователями.
Погружайтесь вглубь
Низойдите под выжженную звездами поверхность и исследуйте многомерные глубины. Узрите порочное веселье Двора, затеряйтесь в обледеневших туннелях Старых Вод и познайте мрачную судьбу Заброшенной экспедиции.
Voidwrought предлагает точное управление, захватывающие открытия и детализированный лор, который интересно изучать. Это яркая новинка в современном жанре метроидвании.







Дайте волю древним артефактам
Мир полон сокровищ, которые открываются знающим, храбрым и безумным. Прочесывайте чертоги своей обители, терзайте трупы поверженных божеств и выходите на охоту в потаенные уголки космоса, чтобы найти предметы, которые даруют уникальные силы.
Вам предстоит отыскать и использовать более чем 50 реликвий и Душ — от спектрального оружия до пассивных усилений, сочетающихся с предпочитаемым стилем игры.
Отстраивайте свою обитель
Кто-то все еще держится за изначальную веру. Вы начнете с крошечного культа и будете наращивать свое влияние, вкапываясь все глубже в руины. По мере расширения обители и числа последователей на свет будут выходить все новые секреты, награды и ужасы.







Особенности
Приятная плавность движения и точность управления.
Атмосферные, отрисованные вручную биомы — от выжженой звездами Поверхности до биомеханической Заброшенной экспедиции.
Сразитесь более чем с 70 врагами и 11 устрашающими боссами.
Кастомизируйте свой стиль игры с помощью более чем 50 активных и пассивных артефактов.
Расширяйте свою обитель, открывая новые сокровища, возможности и секреты.
Погрузитесь в мрачную атмосферу с музыкой от композитора Йоуни Вальякка, написавшего саундтрек к Anima: Song of the Abyss and Vigil: The Longest Night.
Дальнобойщики 2 вышли в Steam
Такие офигенные новости прилетели от моих причастных к этому друзей!
ИГРА ДОСТУПНА В STEAM ЗДЕСЬ
И сейчас продается со скидкой 40% - за 144р
Дальше цитирую:
Продолжаем возвращать старые игры.
И едва ли замечательный симулятор водителя-дальнобойщика с элементами экономической стратегии, разработанный SoftLab-NSK и изданный 1С аж 17 апреля 2001 года, нуждается в представлении.
Я хорошо помню рецензию в Game.EXE, где Дальнобойщиков 2 неожиданно сравнивали с космическим симулятором Elite. Не из-за масштаба, конечно, а из-за чувства свободы. Эдакий компактный открытый мир, где вместо звёзд были трассы, вместо космопортов стоянки и базы, а вместо далёких галактик бесконечная дорога за лобовым стеклом. Ну и, конечно, Тореро от Арии на заставке, благодаря которой игра сразу получала нужный градус крутости.
К релизу в Steam мы добавили в Дальнобойщики 2 достижения. Хотелось, чтобы появление игры в Steam было не просто формальным возвращением старой классики, а ещё и дало игрокам небольшой дополнительный повод снова выйти на трассу, повозиться с контрактами, заработать свои первые большие деньги и возможно пережить те теплые воспоминания, которые игра когда-то подарила.
Помимо ачивок, мы не вносили в игру никаких глобальных изменений. В Steam выйдет та самая оригинальная версия, с небольшими исправлениями совместимости. Мы протестировали игру и, насколько это возможно, убедились, что она работает на современных машинах. Очень надеюсь, что серьёзных проблем не будет. Но если что-то таки появится, мы постараемся исправить всё, что сможем физически. К сожалению, исходников у нас нет, и возможности для правок очень сильно ограничены.
Но главное, что теперь любой, кто захочет прикоснуться к истории или поставить на свою цифровую полку игру своей юности, дополнив таким образом коллекцию, сможет это сделать.



Для Two Point Museum вышел апдейт-кроссовер с Dave the Diver — теперь в игре можно открыть суши-бар
В симуляторе также начались бесплатные выходные.
Two Point Studios выпустила апдейт 1.10.0 для симулятора управления музеем Two Point Museum. Патч посвятили кроссоверу с адвенчурой Dave the Diver. Ключевой особенностью обновления стал дополнительный вид бизнеса, который можно открыть в стенах музея — суши-бар Банчо. Прежде авторы Dave the Diver анонсировали отдельную игру про персонажа.
В Two Point Museum также появилось множество декоративных предметов для аквариумов: игроки могут построить целые подводные поселения для рыб. В игру добавили и новую локацию для экспедиций — Синюю бездну из Dave the Diver. Для того, чтобы собирать рыб и реликвии, игрокам понадобятся специальные баллоны с кислородом, которые можно получить в мастерской. Разработчики заявили, что также исправили множество багов и улучшили оптимизацию игры.




























