Sobre palavras que apresentem um encontro de vogais depois de sílaba tónica, como família, notário, ânsia ou pátio, encontra a consulente várias respostas no Ciberdúvidas. Há de facto alguma ambivalência na análise do acento deste tipo de palavras, porque, já na época em que se começou a aplicar o Acordo Ortográfico de 1945 em Portugal, Rebelo Gonçalves, no Tratado de Ortografia da Língua Portuguesa (Coimbra, Atlântida, 1947, págs. 152/153), não classificava claramente estas palavras como esdrúxulas, porque os encontros vocálicos representados pela grafia podiam formar ditongos crescentes:
«OBS. — Levam acento agudo, tal como os proparoxítonos integrados na norma anterior, as palavras que, tendo na sílaba tónica a, e ou o abertos, i ou u, ou então ditongo oral iniciado por vogal aberta, apresentam encontros vocálicos postónicos que pràticamente se consideram como ditongos crescentes (ea, eo, ia, io, ie, io, oa, oe, ua, ue, uo, etc.), embora em muitos casos possam formar teòricamente duas sílabas [...]»
Como exemplos destas palavras, Rebelo Gonçalves menciona etéreo, níveo, enciclopédia, glória, lírio, língua.
Nos anos 80 do século passado, Celso Cunha e Lindley Cintra, na Nova Gramática do Português Contemporâneo (pág. 70), também não são claros quanto à classificação destas palavras. Mais recentemente, por exemplo, na Nota Explicativa do Acordo Ortográfica de 1990, são chamadas «falsas esdrúxulas». Mesmo assim, recomendo a classificação tradicional, a qual pressupõe a análise dessas palavras como esdrúxulas, ou seja, como paroxítonas.
Quanto a rio e frio, a análise da estrutura silábica depende da variação dialetal: uma pronunciação, talvez mais conservadora e ainda existente nos dialetos portugueses setentrionais (recorro à classificação de Lindley Cintra), apresenta hiato, com articulação de duas vogais em sílabas separadas — ri.o, fri.o; nos dialetos centro-meridionais, que incluem o padrão do português europeu, verifica-se a tendência para pronunciar tal sequência de vogais como um ditongo, pelo que as palavras são classificadas como monossílabos. Note-se, contudo, que, na segunda variante, o ditongo produzido não é crescente, mas, sim, decrescente: para ser crescente, a letra i teria de corresponder à semivogal [j], e a palavra soar como "friú" [transcrição fonética [fɾju]). Não é o caso, uma vez que a pronúncia meridional soa como "friu" (transcrição fonética: [fɾiw]), a rimar com riu, 3.ª pessoa do pretérito perfeito do indicativo do verbo rir.
De qualquer modo, é de notar que o dicionário da Academia das Ciências de Lisboa apresenta em transcrição fonética a pronunciação mais conservadora, aquela em que a palavra é um dissílabo. Sendo assim, e mais uma vez atendendo à tradição escolar, que também classifica tais palavras como dissílabos, parece-me de manter por enquanto a análise em duas sílabas em contexto pedagógico, apesar de as variantes centro-meridionais apontadas também se verificarem no falar lisboeta que é hoje tido por padrão do português europeu.