São palavras patrimoniais de origem latina vulgar, ou seja, são o resultado do latim vulgar MATRE e PATRE.
As sequências etimológicas mais aceites são como seguem:
(1) MATRE > *made > *mae >mai> mãe
(2) PATRE > *pade > *pae > pai
As formas hipotéticas *pade e *made teriam aparecido por sonorização de T latino intervocálico e queda da consoante vibrante configurando uma articulação característica da linguagem infantil (cf. Dicionário Houaiss, s. v. mãe e pai; ver também José Pedro Machado, Dicionário Etimológico da Língua Portuguesa). Teria depois ocorrido a síncope de [d] intervocálico e resolução do hiato "ae" no ditongo "ai". No caso de mãe, há a considerar ainda um fenómeno fonético adicional que é a nasalização do ditongo por efeito da consoante nasal bilabial [m].
Importa destacar que pai é forma comum ao português e ao galego, e que mãe é (ou era) também mai em certos dialetos portugueses e galegos (ainda que na Galiza se use preferencialmente nai, que tem origem em mai).
Sobre a origem latina não haverá dúvida – não se trata de provençalismos, nem de arabismos.
Apesar de no domínio occitânico, mais especificamente no gascão (sudoeste da frança), se registarem as formas pai e mai,1 é muito provável que estas formas tenham surgido de forma independente (cf. Vocabulari Bàsic Català-Occità, Generalitat de Catalunya). Importa salientar que a área dialetal do gascão tem vários aspetos convergentes com os dialetos galego-portugueses, sem que, acerca destes últimos, se possa dizer que são indícios de efeito de superestrato ou empréstimo – supondo que colonos da Gasconha teriam disseminado tais formas no ocidente peninsular, hipótese que é muito difícil de sustentar. Recorde-se que, à semelhança da área galego-portuguesa, em aranês, um dialeto gascão, o N latino intervocálico cai e, por isso, se diz e escreve-se lua (de LUNA); mas nem por isso se afirma que o lua galego-português é um empréstimo do domínio occitânico (mais popularmente conhecido como provençal) ao domínio galego-português.2
Uma origem árabe fica excluída pelo que já foi exposto. Em árabe, «mãe» é ʾumm, transliteração de أُمّ, cuja pronunciação se transcreve fonologicamente como /ʔumm/ (cf. Wiktionary); quanto a «pai», o vocábulo é ʾab (em carateres árabes أَب; transcrição fonológica: /ʔab/). Apesar de a denominação árabe para a progenitora apresentar uma consoante nasal bilabial como mãe, não existe parentesco; muito menos se levanta a hipótese de uma relação genética para o vocábulo que denota o progenitor. Nada disto invalida que na toponímia e na antroponímia medievais portuguesas apareçam nomes próprios com origem em ʾumm e ʾab.
Quanto a uma interferência árabe ou berbere na evolução das palavras romances, mais uma vez, é tudo muito improvável, dado registar-se pai e mai nos dialetos galegos, historicamente pouco ou nada expostos diretamente aos dialetos árabes e berberes de Al-Ândalus, ou seja, a metade sul peninsular, em que tais dialetos se nativizaram.
1 Cf. Maxime Lanusse, De l'Influence du Dialecte Gascon sur la Langue Française, Paris, Maisonneuve et C.ie, 1893, p. 93.
2 Refira-se que em aranês mãe é mair e pai, pair, o que sugere que a evolução dos étimos latinos para as atuais formas portuguesas e galegas poderá ter tido a seguinte configuração: MATRE > madre > *maire > *mair > mai > mãe; PATRE > padre > *paire > *pair > pai. Uma perspetiva semelhante é igualmente considerada por Machado, op. cit.