Tem muita razão, o prezado consulente. Eu diria, no entanto, que afirmar que a pronúncia das capitais acaba por ser uma referência da pronúncia nacional é muito simplista, mas não é terrivelmente falso. A convenção do padrão é, de facto, feita por um todo muito mais complexo, contudo, o factor capital não é despiciendo.
Veja-se, por exemplo, o caso português, que é o que nos está mais próximo. Actualmente considera-se que em Portugal a norma-padrão é a variante falada pelos grupos mais escolarizados da região compreendida entre Coimbra e Lisboa. Podemos ver nesta simples e vasta definição que são contemplados factores geográficos (é a região central do país), histórico-sociais (Coimbra, cidade com a mais antiga universidade do país e consequente tradição de cultura e saber), socioculturais (os grupos mais escolarizados), sociopolíticos (Lisboa, capital do país).
Assim, se antes se dizia que era a variante de Coimbra aquela que se constituía como variante-padrão, agora alargou-se um pouco a área geográfica para incluir o falar da capital. (Aliás, tomando os seus exemplos, também, na Inglaterra, se fala hoje no eixo Oxford-Cambridge como zona da variante-padrão, o que é uma forma elegante de incluir a capital, Londres).
Claro que dentro desta vasta região convivem diferentes falares que vão necessariamente divergir daquilo que se considera o padrão. É, em parte, por essa razão que se introduz o factor escolarização na definição de norma ou variante-padrão. A escola funciona como um elemento padronizador da língua, uma vez que à partida a variante por ela privilegiada e difundida é a variante-padrão. Esta uniformização promovida pela escola é menos notada ao nível da pronúncia do que ao nível lexical ou sintáctico, mas é, ainda assim, um factor importante e também um dos elementos que contribuem para a consciência subtil interiorizada do padrão de que fala o consulente.