Максимальная звуковая задержка до того, как игрок заметит?

Учитывая какое-либо событие в игре, какова максимальная задержка для создания звука, которую игрок будет правильно связывать с этим событием (и не воспринимать отставание)?

38 голосов | спросил edA-qa mort-ora-y 13 Maypm14 2014, 22:18:49

6 ответов


47

Вычисляется следующий результат для синхронизации губ, который считается «наиболее заметной ошибкой a /v sync» .


Wikipedia говорит

  

Для телевизионных приложений звук должен вести видео не более чем на 15 миллисекунд, а аудио должно задерживать видео не более чем на 45 миллисекунд. Для пленки приемлемая синхронизация губ считается не более 22 миллисекунд в любом направлении.


Лаборатория восприятия медиа и акустики сообщает

  

Результаты эксперимента определили, что средний начальный порог аудиосигнала для обнаружения /v синхронизации синхронизации составил 185,19 мс со стандартным отклонением 42,32 мс


ATSC говорит

  

На первый взгляд это кажется рыхлым: от +90 мс до -185 мс в качестве «окна   Приемлемость -

и

  
  • Невозможно определить от -100 мс до +25 мс
  •   
  • Обнаруживается при -125 мс & +45 мс
  •   
  • Становится неприемлемым при -185 мс & +90 мс
  •   

(«Задержка звука», «+ Звук»)


Чтобы заключить

Результаты не так далеки друг от друга. Похоже, что максимально допустимая задержка составляет около 150 мс, что составляет 9 кадров при 60 кадрах в секунду.

ответил Heckel 13 Maypm14 2014, 23:00:27
9

Это зависит от события

Чувство, что, скажем, взрыв, который вы видите и слышите, - это одно событие, которое будет иметь допуски, описанные в других ответах - не более ~ 50 мс; некоторые люди могут быть более чувствительными (например, музыканты), поэтому я предлагаю прицелиться в 30 мс или не более 2 кадров со скоростью 60 кадров в секунду.

Я считаю, что воспринимаемое расстояние должно влиять на эти допуски. Люди ожидают, что отдаленные звуки будут слегка задерживаться, так как в реальной жизни звук проглядывает примерно на 1 мс на каждую ногу расстояния. Таким образом, взрыв на увеличенной карте карт RTS может иметь больший допуск к звуковому отставанию, чем игрок, стреляющий своим оружием в FPS.

Специализированные случаи, такие как наличие надлежащего восприятия музыки /ритм-игры, могут потребовать гораздо более жесткие допуски, 15-20 мс или даже ниже - например, если игрок слышит как «действие ввода», такое как пение в микрофон или ударяя пластиковый инструмент, а также звук, создаваемый вашей системой для одного и того же события, тогда отставание в 50 мс приведет к смешению странных звуков «оригинала» и «воспроизведения».

Кроме того, имейте в виду отставание между началом аудиофайла и «событием» внутри этого аудиофайла - во многих аудиоклипах «событие» будет не так на краю, возможно, у вас есть звук удар молнии, где «забастовка» происходит 200 мс после начала, что было бы очевидно для всех, и почти все звуковые файлы, даже ударные ударные, будут иметь некоторые задержки. р>

Не измеряйте средние значения - посмотрите на наихудший случай

Зрение и слух глубоко связаны с восприятием человека, и если один из них заикается относительно другого, тогда это будет ощутимо. Это не нормально, если в большинстве случаев это очень быстро, но иногда есть 0,2-секундная задержка, в то время как что-то загружается - люди заметят такие ситуации. Вот почему звук часто работает в отдельном потоке, изолированном от других действий и просто получая быстрые уведомления о том, какие предварительно загруженные клипы должны воспроизводиться.

ответил Peteris 14 Mayam14 2014, 00:55:16
5

Любая ситуация, в которой игрок вызывает звук (музыкальные игры, оружие в FPS), будет нуждаться в очень низкой задержке, так как игрок послал импульс, чтобы он произошел в тот момент, так как с прослушиванием музыканта с задержкой инструмента особенно знать о очень небольших задержках. Звуковые инженеры беспокоятся о задержках записи ниже 5 мсек, разрушая «канавку»

Журнал Американской академии аудиологии заявляет, что люди (а не только музыканты) при прослушивании своего собственного голоса задерживаются, знают о задержках как 3 мсек, а задержка более 10 мсек была нежелательной в 90% случаев.

Люди используют задержку времени между ушами для направленной информации и, следовательно, должны иметь возможность обрабатывать и извлекать информацию из задержек ниже 1 мсек

Прозвучавший выше 185.19 мс не имеет значения, поскольку он относится к ведущей звуковой ошибке, и во всяком случае к тому, что люди считают приемлемым при пассивном просмотре фильма, не активно участвуя в игре.

ответил SamB 16 MaramWed, 16 Mar 2016 02:50:36 +03002016-03-16T02:50:36+03:0002 2016, 02:50:36
3

В принятом ответе здесь в основном обсуждается восприятие аудиосинхронизации при пассивном просмотре видео. В этих случаях аудитория не может легко точно определить, когда воспроизводится звук, кроме как присутствуя на контрольных знаках в видео. Это означает, что у них ограниченное ожидание звука.

Есть два важных случая в играх, где это предположение с низким ожиданием не выполняется:

  1. Когда сам игрок вызвал звук (как указывает SamB), поэтому с момента, когда они образуют намерение нажать кнопку, они точно знают, когда они ожидают услышать звук.

  2. Когда звук должен появляться на периодическом ритме , как в музыкальных играх или что-либо с тикающим таймером /счетчиком, этот ритм позволяет игроку предвидеть следующий звук и обратите внимание, если время проигрывается.

В этом разговоре от GDC 2013 Матье Павагеу утверждает, что игроки могут воспринимать различия в точности синхронизации выше примерно 5 мс , что гораздо менее прощает, чем примеры из синхронизации губ. Ознакомьтесь с разделами «Примеры восприятия времени» и «Пример игр Ubisoft», чтобы услышать это для себя. Вы можете услышать, что меню Rayman Origins не звучит «лагги» как таковое, когда синхронизировано в течение 16 мс (видеокадр), но при синхронизации в течение 5 мс это звучит заметно лучше и amp; туже.

Pavageau защищает использование низкоуровневого звукового обратного вызова, чтобы получить такую ​​точность подкадра, если вам нужен жесткий ритмический геймплей этого сорта.

ответил DMGregory 11 J000000Monday16 2016, 03:47:47
2

Для игр, в которых человек должен реагировать на звуковые сигналы, каждая миллисекунда, по которой задерживается звук, заставит реакцию человека также задерживаться. Кто-то, кто просто смотрит фильм или вырезать сцену, может не заметить слишком много, если звук и видео не совсем синхронизированы, но часто важно, а иногда и критично, что звук синхронизируется с , что ожидается от игрока делать .

ответил supercat 14 Mayam14 2014, 02:42:18
-1

В теории, все, что выше 50 мс, может быть заметно, когда оно связано с его ассоциацией с картинками, при 25 мс вы можете начать слышать звук и его задержку в виде двух разделенных звуков, поэтому я бы сказал, что я очень рекомендую вам оставаться под 50 мс и если вы даже можете остановиться на чем-то от 5 мс до 15 мс, было бы очень приятно.

Надеюсь, это поможет!

https://en.wikipedia.org/wiki/Delayed_Auditory_Feedback

ответил X-Raysounds 13 FebruaryEurope/MoscowbMon, 13 Feb 2017 07:46:13 +0300000000amMon, 13 Feb 2017 07:46:13 +030017 2017, 07:46:13

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132