Para se falar de ditongo ou hiato, as vogais têm de ser sempre consecutivas: pais (ditongo ai) vs. país (hiato a-í).
Sem entrar em pormenores teóricos ou terminológicos, pode dizer-se que um ditongo é uma sequência de duas vogais, ou melhor, de uma vogal e uma semivogal – o ai de pai – ou de uma semivogal e uma vogal – ua de quatro – em que uma das vogais fica mais breve ou menos tensa do que a outra (caso do i do ai em pai, ou do u de ua em quando). Trata-se, portanto, de uma sequência vocálica que ocorre na mesma sílaba. Assim, a sequência oi é um ditongo quando ocorre em depois, em boina ou goivo. Note que, em certas palavras, quando o ditongo faz parte de sílaba tónica, é a vogal o que recebe o acento, e não a semivogal: corrói.
Duas vogais consecutivas que não formam ditongo constituem um hiato – a sequência a-i de rainha ou ainda – e, como tal, pertencem a sílabas diferentes – "ra.i.nha", "a.in.da" –; ou seja, as vogais pronunciam-se separadamente, não ficando uma delas mais breve ou menos tensa do que a outra . A sequência oi é um hiato, por exemplo, em moinho (mo.i.nho), em heroína (he.ro.í.na) e em ventoinha (ven.to.i.nha). Quando a sequência oi se lê como hiato e a segunda vogal faz parte de sílaba tónica, pode ocorrer em certas palavras um acento gráfico que recai sobre esse i, como é o caso, já apontado de heroína (mas não de herói, que indica ditongo).