Creo que lo que puede hacer este trabajo es un circuito que se conoce como "vox control".
Activa un relé cuando se produce sonido.
En este caso el sonido no provendría de un micrófono sino de la salida de audio de VHF.
El relé debería tener un circuito doble para desactivar los dos altavoces si el equipo de música es estéreo como es habitual.
También debe tener un cierto retardo para que no se desconecte en las pausas de sonido del VHF (entre palabras o frases)
Existen algunos modelos comerciales en kit (
por ejemplo) que habría que adaptar, o mejor montar uno ad hoc.
Es una idea...