26.05.2016

Акустична Локалізація Накопиченої Кореляції

Original: http://www.ces.clemson.edu/~stb/research/acousticloc/
Стен Бірчфілд і Даніель Гіллмор

Два традиційні методи акустичної локалізації є оцінка діаграммообразуючої і час затримки. Історично один довелося вибирати між варіаціями цих двох методів, створюючи таким чином компроміс між точність формування діаграми спрямованості підходів або швидкості алгоритмів оцінювання за часом затримки. У нашому дослідженні ми виявили, що цей компроміс не є фундаментальної проблеми сама, але тільки тим, як ми дивилися на нього. Насправді, не треба жертвувати точністю по швидкості, по крайней мере, в сценаріях, в яких відстань між мікрофонами не надто велика, наприклад, коли мікрофони до кількох метрів один від одного в приміщенні кімнати.

Ми розробили методику, яка називається накопичено кореляція, яка поєднує в собі швидкість оцінки часу затримки з точністю діаграммообразованія. Як видно на малюнку нижче, ідея дуже проста. Сигнали від пар мікрофонів корелюється, а весь крос-кореляції вектор зіставляється із загальною координатної системи для вимірювання ймовірність того, що джерело звуку знаходиться в будь-якому з кількох місцях кандидатів. І попередня фільтрація тимчасового згладжування є необов’язковими кроки, які можуть бути додані до будь-якого алгоритму.

algorithm
Принцип в основі більшості алгоритмів акустичної локалізації, в тому числі накопиченої кореляції, є те, що звук, що випромінюється джерелом звуку зазвичай займає різну кількість часу, щоб дійти до кожного мікрофона на ігровому полі. Шляхом вимірювання часу приходу сигналу (або, що еквівалентно, затримка за часом) сигналу для кожного мікрофона, розташування джерела звуку може бути визначено. Розглянемо випадок, коли тільки пара мікрофонів доступні, як показано на малюнку нижче. Джерело звуку досягне одного мікрофона в момент часу t1, а інший в момент часу t2. Відносний час затримки T = t1 – t2 можна оцінити шляхом вибору піку крос-кореляції вектора між двома мікрофонних сигналів. Якщо т правильно оцінюється, то джерело звуку повинен знаходитися в точці в просторі таким чином, що t1 – t2 = т, яка визначає одну половину гиперболоида.

one_pair

Крос-кореляція, звичайно ж, не є ідеальною технікою, і немає ніякої гарантії, що пік взаємної кореляції vecotr буде правильна оцінка часу затримки. З реальними сигналами, крос-кореляції вектор, як правило, містять безліч піків, і справжня затримка за часом часто не дає найвищий пік. Накопичена кореляції обробляє цю проблему шуму, зберігаючи весь взаємної кореляції вектор кожної пари мікрофонів, а не вибору піку. Як буде показано нижче, кожен елемент крос-кореляції вектора відповідає різним половинній гиперболоида в просторі, а значення цього елемента вказує на ймовірність того, що джерело звуку, розташований на цій половинній гиперболоида. Для будь-якого даного кандидата місці, його ймовірність — засновані тільки на інформації, отриманої від однієї пари мікрофонів — задається інтерполяцією значень сусідніх половин гиперболоида. Значення з декількох пар мікрофонів підсумовуються, щоб отримати загальну ймовірність для цього місця. Після того, як вся інформація була взята до уваги, то місце з найбільшою ймовірністю буде обраний в якості оцінки для визначення місця розташування джерела звуку. Як і раніше, попередня обробка та / або тимчасового згладжування може бути застосований на додаток до основного алгоритму тільки що описаного.

multiple_pairs

Розглядаючи рівняння для різних методів показує тісний зв’язок між ними. Накопичена кореляція є наближенням до формування діаграми спрямованості, якщо припустити, що час, на якому мікрофони отримати звук постійний зсув від часу, в якому випромінюється звук, приблизно вірно в містяться середовищах, таких як кімнатне помешкання. У той же час, накопичений кореляція є узагальненням формулювання оцінки тимчасової затримки, оскільки обидва вони містять істотний обчислення, а саме до крос-кореляції кожної пари сигналів мікрофона; різниця в тому, що накопичено кореляція зберігає весь взаємної кореляції вектор, а не тільки пік. В результаті накопичилося кореляція бере на себе всю наявну інформацію до уваги, перш ніж він приймає рішення, що забезпечує стійкість до помилок. Це затягування прийняття рішень є сутність принципу найменшої зобов’язань, добре відомої філософії для розробки алгоритмів. Накопичена кореляція також відомий як прямий метод, оскільки він безпосередньо обчислює результат без будь-яких проміжних рішень, які мають потенціал, щоб втратити інформацію.

Подібність алгоритмів природним чином призводить до об’єднавчої структури, як показано в таблиці нижче. Нижче перераховані алгоритми діаграммообразованія, накопиченої кореляції і лінійної перетину (популярне час затримки методики оцінки), поряд з кількома іншими варіантами. Всі методи можуть бути виражені як обчислювальний ймовірність розташування Q, використовуючи рівняння, наведене. Існують три відмінності між алгоритмами: (1), як вони поєднують в собі інформацію з кількох пар мікрофонів, виражених за допомогою функції G; (2) межі інтегрування, використовувані для порівняння сигналів в одній парі, захоплений функцією Т; і (3), як вони ваги термін енергії, що задається значенням. З таблиці видно, що формування променя є точним, оцінка часу затримки є ефективною, і накопиченої кореляції є одночасно точної і ефективною.

unifying

Накопичена кореляція проста в реалізації, на кілька порядків швидше, ніж діаграммообразованія, і було показано, для отримання результатів по суті з тією ж точністю, що і діаграммообразованія. Нижче наведені функції правдоподібності, обчислену на кадру звуку з накопиченої кореляції і з формуванням діаграми, що ілюструють, що різниця між результатами часто невиразні. Більш великі експерименти, поряд з більш детальним поясненням, можна знайти в публікаціях на цю тему.

results_accresults_beam

Накопичена кореляція                                                            Beamforming

About The Author

admin

Comments are closed.