A questão que coloca tem toda a pertinência e razão de ser. O mesmo se passa com muitas outras palavras, também com ditongos crescentes ou falsos ditongos, como petróleo, canário, ardósia, língua, etc.
Bom, a verdade é que a questão é polémica.
Estas são as chamadas «falsas esdrúxulas» e provocam dúvida quanto à acentuação, quanto à contagem das sílabas e, consequentemente, quanto à translineação. Tal é devido ao tal ditongo crescente que, ao invés do que acontece com os ditongos decrescentes (ou ditongos verdadeiros), pode ou não ser separado. Assim, podemos ter 'á-gu-a' (onde o acento se justifica pelo facto de ser uma palavra esdrúxula) ou simplesmente 'á-gua'. As gramáticas tradicionais têm-se mantido fiéis à divisão silábica máxima (considerando que os ditongos crescentes não se podem separar), mas a verdade é que cada vez mais, e para a maior parte dos falantes do português, essa divisão não faz muito sentido.
Alguns estudos, feitos com base na intuição das crianças, mostram que elas não fazem essa distinção muito claramente e que sobretudo quando as palavras são constituídas pelas consoantes q ou g, seguidas de ditongo crescente (quarto ou água, por exemplo), a divisão silábica mais intuitiva é 'qua-rto' e 'á-gua', e não 'qu-ar-to' ou 'á-gu-a'.
A questão que nos podemos e devemos colocar é, portanto, esta: até que ponto a norma da gramática tradicional corresponde ao que realmente se passa na língua?