Em português, a vogal i ocorre frequentemente como glide – representada pelo símbolo fonético [j] –, para desfazer hiatos, isto é, encontros vocálicos que não se resolvem como ditongos.
O caso de saem é o mesmo de caem (cair) e traem (trair) e verbos relacionados: atrair, distrair, ou seja, a terminação -aem da 3.ª pessoa do plural do presente do indicativo soa como [aiɐ̃j̃]. Esta pronúncia faz parte da norma-padrão, e sobre ela não existe juízo normativo desfavorável. É, portanto, pronúncia correta. É possível que o i anti-hiático se relacione com o seu correspondente nasal em têm, vêm e põem, mas não foi aqui possível identificar estudos que proponham ou confirmem essa relação.
Dialetalmente, este [j̃] nasal anti-hiático chega a evoluir como nasal palatal, fazendo as referidas forma verbais soarem como "tenhem", "venhem" e "ponhem"1.
Note-se também que, dialetalmente – não na pronúncia padrão –, o i anti-hiático é frequente não só em sequências como «é ela»/«é ele», mas também e muito especialmente no encontro de dois aa em palavras diferentes:
«a água» > "a iágua"; «a Ana» > "a iAna".
São pronúncias sociolinguisticamente marcadas, que não fazem parte do padrão europeu, mas que se registam no centro e no norte de Portugal.
1 Em transcrição fonética, respetivamente: [teɲẽij̃] ou [tɐɲɐ̃j̃"]; [veɲẽij̃] ou [vɐɲɐ̃j̃]; e ['põɲɐ̃j̃].