Vamos às definições, para nos entendermos melhor:
Ditongo: Reunião de vogal e semivogal que se pronunciam numa só emissão de voz.
Os ditongos que têm a semivogal depois da vogal chamam-se decrescentes (ex.: au ¦áu¦); são todos estáveis; a norma não permite que sejam divididos na translineação.
Ua ¦u⦠tem a semivogal antes da vogal e designa-se por ditongo oral crescente.
No caso de água, por exemplo, com o ditongo ua, a palavra tem duas sílabas (fonte: Gramática de Celso Cunha e Lindley Cintra). Dizemos então que água (por força de a norma obrigar a que sejam acentuadas na tónica as palavras terminadas nas sequências postónicas como ua) é uma proparoxítona aparente (mas em rigor uma paroxítona).
O mesmo raciocínio se pode aplicar a averigua, terminada no mesmo ditongo, mas agora com a tónica no próprio ditongo (a mesma fonte dá como exemplo de trissílabo enxaguou: en-xa-guou). Acresce que ua, em averigua, tem estabilidade equivalente à de um ditongo decrescente ¦úâ¦.
Concluindo, averigua é uma palavra oxítona no critério da gramática citada.
Também é esta a minha opinião, confirmando o parecer de J.C.B.
Ao seu dispor,