É palavra que nunca ouvi. E soa, até, algo estranha, pois que conferência, na sua acepção mais comum («reunião oficial; conversação entre duas ou mais pessoas sobre assuntos de interesse comum; congresso; discurso ou palestra sobre temas literários, artísticos, científicos, políticos ou religiosos», cf. Dicionário da Porto Editora), só costuma resultar se “se der ouvidos” ao que lá se disser.
É mais conhecida a forma videoconferência («tecnologia de comunicação que, por intermédio do videotelefone, permite que as pessoas em reunião se vejam e se ouçam, embora estando em locais diferentes»). Será audioconferência uma videoconferência em que a transmissão da imagem falhou, prosseguindo apenas em registo sonoro?
Bom, deixando de parte os considerandos sobre a palavra, e respondendo concretamente à sua pergunta, nenhuma palavra portuguesa admite dois acentos gráficos (tirando aquelas em que o hífen une elementos com autonomia fonológica), pelo que audioconferência seria a grafia correcta da palavra em questão, seguindo a regra que diz que o «primeiro elemento, proveniente do grego ou do latim e terminado em o [como audio-], se combina com um ou mais elementos substantivos [como conferência] ou adjectivos».