多重音声放送をどう扱うか?

今回は多重音声放送について。
メインにエンコしているうちの一つ、サイクルロードレースはほぼ間違いなく多重音声なわけです。
何が問題か?というと、編集する際非常に扱いにくいものなのです。
tsファイルに含まれるAACデータにどうやって格納されているかというと、L(主音声)R(副音声)といったぐあいになってます。
そのまま主音声だけ抜けばいいんじゃね?とも考えましたが、OP部分の波形を見るとそこだけステレオになってました。
BonTsDemuxを使って主音声だけtsファイルから分離した場合、そのOP部分は見事に片方だけしか入っていませんでした。
やむなくとった手段が、主+副のwavファイルを編集ソフト(SoundEngine、Wavy)を使ってOP以外の部分を主+主に編集。
俺の頭ではこれが限界でした。
もっとスマートにできる方法あったら教えてください。