A regra de acentuação gráfica para se conseguir a diérese nos
ditongos só se aplica quando se pretende que as semivogais u ou i
passem a vogais tónicas, o que não é o caso.
Em Caiena estamos em presença duma palavra paroxítona (grave), terminada em a e, portanto, não precisando de acento.
Com estes dois parágrafos respondi à sua pergunta.
Como nota à parte, pode defender-se que a sílaba tónica tem a vogal
semifechada ê, antecedida do ditongo decrescente ¦âi¦~[ɐj]:
¦câi-ê-na¦~[kɐjenɐ] (como caiado).
No meu ponto de vista pessoal (com a reserva de não haver consenso), estamos em presença daquilo a que eu então chamo glide: casos em que a semivogal sofre um fenómeno de arrastamento entre vogais: ¦câi-iê-na¦~[kɐjje-nɐ], formando-se foneticamente dois ditongos.