Ответственно заявляю, отделить голоса от музыки и других звуков в фильме можно, если дорожка записана в шестиканальном звуке. Обычно, если это родная шестиканальная 5.1 дорога, все голоса лежат в центральном канале, а музыка в боковых фронтальных. Ставьте прогу Belight и дерите свою шестиканальную дорожку на шесть отдельных wav дорог и будет вам счастье.
Но есть подводные камни, в центральном канале лежат ВСЕ голоса, даже те которые поют. То есть в результате вы получите музыку без слов
