Прими за аксиому, что озвучка субтитров нужна. Почему? Чтение субтитров в играх не просто неудобно — это настоящее испытание для глаз, особенно для тех, кто проводит перед монитором большую часть дня, например, программистов. После 9 часов чтения кода дополнительная нагрузка на глаза в виде чтения субтитров в играх кажется избыточной.

Зачем нужна эта программа? Представьте, что после утомительного рабочего дня вы решаете отдохнуть и погрузиться в мир любимой игры, но субтитры на экране мешают вам насладиться игровым процессом. EyeEaseAI создана для того, чтобы избавить вас от необходимости самостоятельно читать субтитры и нагружать глаза. Она позволяет углубиться в игру, не отвлекаясь на чтение текста.

Что с озвучкой на разных языках? Озвучка людьми занимает долгое время, до 1-2 лет, а иногда и больше. Проекты от компаний вроде Rockstar, такие как GTA 5, могут оставаться неозвученными на определенных языках спустя даже 10 лет.

Альтернативные решения? Существует программа Dictor Dialog, но её главный недостаток в использовании стороннего сервиса для озвучки — Яндекс, из-за чего она не может быть полностью бесплатной и автономной. Наша программа EyeEaseAI не сталкивается с этой проблемой.

Состояние проекта. EyeEaseAI ещё на стадии разработки, и нам нужно время, а также советы и поддержка сообщества, чтобы создать наилучший продукт.

Open Source и участие сообщества. Ни одна корпорация в мире до сих пор не решилась на AI озвучку субтитров в играх, поэтому такая программа может быть создана только в формате open source. EyeEaseAI — это open source проект, и каждый может принять участие в его улучшении.

Поддержка разных языков. EyeEaseAI будет работать не только с русскими субтитрами, но и с другими языками, такими как казахский, польский, турецкий, монгольский и многие другие.

Помощь сообщества программистов неоценима в таком сложном и масштабном проекте. Присоединяйтесь к нам и давайте вместе сделаем игровой процесс более комфортным и погружающим!

План реализации

  • Зеленое - сделано

  • Желтое - не сделано

Тружусь в этом проекте https://github.com/denisxab/speakerpy/tree/main/eyeeaseai

Комментарии (17)


  1. SergiiDia
    19.08.2023 12:54
    +6

    Я конечно не уверен, но разве:
    1. выполнение скриншотов, не создаст лаги невероятного масштаба.
    2. Не проще ли раскапывать сабы в ресурсах?

    Зачем такой велосипед со скриншотами? 0_0


    1. Sarjin
      19.08.2023 12:54
      +1

      раскапывать под каждую игру? звучит сложновато.

      можно сделать прогу на телефон.

      вон гугл и майкрософт по картинкам переводят, да и озвучка есть. страшненькая правда. главная проблема крепление.


  1. K0styan
    19.08.2023 12:54
    +1

    В любой игре с диалогами есть реплики NPC и есть реплики протагониста.

    Первые - озвучить технически можно, но как по мне - интонации задают половину настроения, и механическая озвучка на родном языке будет хуже, чем субтитры на нём же + оригинальная, пусть даже непонятная озвучка.

    Реплики же протагониста - это вообще меню, иногда с пометками (типа [PERCEPTION] или [Street Kid]). Тоже, озвучить-то можно, но чтобы выбрать нужный вариант, всё равно глазами смотреть придётся... Это я не говорю даже о случаях, когда на реплику даётся ограниченное количество времени.

    В общем, пока решение выглядит проблемнее, чем решаемая задача...


  1. lair
    19.08.2023 12:54
    -1

    Прими за аксиому, что озвучка субтитров нужна. Почему? Чтение субтитров в играх не просто неудобно — это настоящее испытание для глаз, особенно для тех, кто проводит перед монитором большую часть дня, например, программистов.

    А, что? Я обычно в играх субтитры выключаю и слушаю голос, зачем мне какая-то озвучка?

    Или вы про диалоги, которые изначально текстовые и не озвучены? Так их столько, что я задолбаюсь их слушать, я читаю намного быстрее, чем слушаю.

    Так что нет, никакой аксиомы в вашем утверждении нет.


    1. ClayRing
      19.08.2023 12:54
      +2

       никакой аксиомы в вашем утверждении нет.

      Как это нет? Вот же она:

      звучка субтитров нужна

      Ваши рассуждения здесь не релевантны потому что аксиому невозможно опровергнуть. На то она и аксиома.


      1. lair
        19.08.2023 12:54
        -2

        Это не аксиома. Это что-то, что автор предлагает считать аксиомой - а я не согласен, потому что см. выше.


  1. Mingun
    19.08.2023 12:54
    +1

    Идея конечно витает в воздухе уже давно, вот только реализовывать ее надо не так. Зачем делать озвучку онлайн во время игры? Тем более, как вы определите скорость, с которой реплики нужно читать — на скриншоте этой информации нет.


    Все реплики уже заранее известны, их нужно только найти в ресурсах, найти оригинальные дорожки и перенести интонацию с оригинала на переведенный текст. Затем все проверить в игре. Да, немного скучно, но по другому никак, как мне кажется.


  1. Permanentik
    19.08.2023 12:54

    Копни из ресов,все сабы,озвучь их, и зашей в игру


    1. denisxab Автор
      19.08.2023 12:54

      Интересный вариант, даже если я найду текст, и озвучу его через AI, то как его внедрить в игру, чтобы он использовал мою озвучку ?


      1. Hardcoin
        19.08.2023 12:54
        +3

        Заменить оригинальную своей.


  1. Tasta_Blud
    19.08.2023 12:54
    +2

    всмысле озвучка по скриншотам? а взять из ресов? ладно, если это сложно, то однажды распознать по скринам

    и однажды озвучить. но неужто ai дешевле живых людей?

    озвучивать ГГ по семплам голоса игрока - свежо. но не надо. серьезно, хоть мне и нравится мой голос, но он ведь будет меня пародировать. не надо, пожалуйста


    1. javalin
      19.08.2023 12:54
      +1

      но не надо. серьезно, хоть мне и нравится мой голос, но он ведь будет меня пародировать. не надо, пожалуйста

      Технический прогресс не остановить, смиритесь.. // злобный смех


    1. DirectoriX
      19.08.2023 12:54

      неужто ai дешевле живых людей?

      AI точно дешевле профессиональной озвучки (со всеми этими студиями-оборудованием-актёрами), но и качеством не дотянет очень сильно. Но даже совсем уж энтузиасты, начитывающие текст дома на микрофон вебкамеры, наверняка перезапишут фразы, если, например, произнесут неверно или сосед хлопнет дверью, а AI надо будет перепроверять (что в предложенной схеме отсутствует).

      Впрочем, AI в данном схеме - это всего лишь экранный диктор, работающий внутри игры, а не замена озвучки людьми, так что сравнивать их по качеству будет несколько неверно.

      P.S. впрочем, порой любители так здорово озвучивают, что хоть медаль давай и на доску почёта вешай - например, озвучка Bioshock Infinite от CGInfo.


  1. connected201
    19.08.2023 12:54

    в помощь к переводу из текста в речь (жаль что пока нету руского):

    https://coqui.ai/

    позволяет генерировать текст с интонациями, позволяет клонировать текст персонажа ,API и прочее...

    кстати аналогичная идея со скриншотами с экрана будет универсальна вместо того что бы ковырять ресурсы, появилась когда играл в RDR2

    хотелось бы иметь возможность иметь перевод голоса или субтитров накладыванием субтитры другим языком...


  1. tagabenz
    19.08.2023 12:54
    +1

    Реально дядь игра и так все ресурсы компа съедает и тут еще и такой трудоемкий процесс со скриншотами, идея но хорошая но реализацию мне кажется надо другую придумать


  1. TimurDmt
    19.08.2023 12:54

    озвучка видева от янедекс очень хороша: от интонаций не вянут уши и ведь уже есть реализация, которую можно взять за основу


    1. denisxab Автор
      19.08.2023 12:54

      • Она платная.

      • Если Яндекс захочет, то сможет забанить нас.

      • Нужен постоянно высокоскоростной интернет чтобы в релтайме отправлять фотки на сервер.

      • У Selero качество сравнимое с Яндекс

      • Все идет к тому что Яндекс уходит из мирового интернета, и например в недалеком будущем, например пользователи из Польши не смогут пользоваться Яндекс.