Numa análise abstrata dos sons da língua, diz-se que um ditongo crescente – são exemplos o ea de cear, o ia de miar, o oa de entoar ou o ua de suar , em que a primeira letra é frequentemente descrita como semivogal – é um «falso ditongo». Contudo, este termo requer alguma reflexão, porque é também verdade que os ditongos crescentes se realizam efetivamente na fala coloquial. Trata-se de uma questão de âmbito mais especializado, de cursos de linguística, que, pela sua complexidade, não é abordada no ensino não-universitário.
Numa análise fonológica, isto é, do ponto de vista da organização dos sons da língua como sistema de unidades sujeitas a certas regras ou restrições, não constituem ditongos sequências como ea (arear), ia (piar) ou eo (geografia), tendo em conta que se relacionam morfologicamente com outras palavras em que a primeira letra de tais sequências são pronunciadas como vogais (pio1), como sequências com um i epentético (trata-se da inserção de um i para desfazer um hiato, caso de areia, que provém do arcaico area) ou de sequência em hiato (caso de outros usos do radical geo, como em geoestratégico, que geralmente soa "gè-ò-estratégico"). Contudo, na fala normal e rápida, a concretização (a realização fonética) destas sequências produz ditongos crescentes (o j representa aqui uma semivogal): ar[ja]r, p[ia]r, g[ju]grafia.
No caso de quota, a pronúncia mais corrente não tem ditongo – soa como [k]ota –, mas aceitando que a palavra também se profere com ditongo – [kw]ota –, tal como quadro – [kw]adro –, considera-se que ocorrem ditongos efetivamente crescentes1, porque não é possível encontrar o mesmo tipo de correspondências que se estabelecem entre piar-pio, arear-areia, ou geografia-geoestratégico.
Quanto ao i de gaiato, pode ser este associado ao i epentético de areia. As sequências não formam tritongos (como nos casos de ceei ou suei), mas, sim, sequências de vogais que pertencem a sílabas diferentes. O i, marcando a transição (glide) de uma vogal para a outra, tem sido analisado de formas diferentes por diversos autores. Por exemplo, António Emiliano (Fonética do Português Europeu, 2009, p. 267) considera que sequências gráficas como aia em saia ou eio em meio correspondem à realização de ditongo decrescente (ai, ei) seguida de nova sílaba que começa com a realização de uma «réplica semivocálica da vogal subjuntiva do ditongo». Convém acrescentar que Emiliano considera que em português só há ditongos decrescentes e defende que a chamada semivogal do ditongo deve ser denominada «vogal subjuntiva», reservando o termo semivogal para as realizações de i, e, o e u seguidas de vogal (piada, cear, voar, suar).
1 O vocábulo pio soa "piu" , com o mesmo ditongo decrescente que partiu, na pronúncia de falantes de Lisboa e de outras regiões de Portugal , tal como acontece com tio e rio, que se pronunciam "tiu" e "riu". Note-se, porém, que muitos falantes conservam a pronúncia dissilábica destas palavras: "pi-u", "ti-u", "ri-u".
2 No entanto, também este caso levanta muitas questões quanto à efetiva presença de ditongos crescentes em português numa análise mais abstrata. Com efeito, pode considerar-se que as sequências qu de quando ou qual e gu de guarda e água são consoantes que incluem a semivogal [w], isto é, considera-se que além de serem consoantes oclusivas velares têm associada uma articulação secundária labial, o que leva alguns investigadores a classificá-las como consoantes labiovelares.