O que o consulente propõe está quase certo. Evanildo Bechara, na Moderna Gramática Portuguesa (Rio de Janeiro, Editora Lucerna, 2002, págs. 233-235), dá indicações no sentido de interpretar a terminação -ram do pretérito mais-que-perfeito como a associação da desinência modo-temporal átona -ra- com a desinência número-pessoal -m. Por seu lado, -ram do pretérito perfeito resulta da junção da desinência -ra- do pretérito perfeito, exclusiva da 3.ª pessoa do plural (nas restantes pessoas não há desinência, ou melhor, diz-se que é zero — ø: cante-i, canta-ste, canto-u, etc.) e da desinência número-pessoal -m.
Noutra perspectiva, Alina Villalva, no capítulo que dedica à morfologia do português (M.ª Helena Mira Mateus et al., Gramática da Língua Portuguesa, p. 936) refere-se à homofonia dessas formas verbais:
[...] [A] ambiguidade que afecta as formas de terceira pessoa do plural do pretérito mais-que-perfeito e pretérito perfeito do indicativo (cf. falaram) é uma ambiguidade fonética mas não estrutural: o sufixo amálgama de tempo-modo-aspecto e pessoa-número (i.e. -ram) que está presente nas formas do pretérito perfeito é distinto da sequência constituída por um sufixo de tempo-modo-aspecto (i.e. -ra) e um sufixo de pessoa-número (i.e.. -m), que integra as formas do pretérito mais-que-perfeito.