Sejam, então, as frases:
(a) Conforme o solicitado, junto se envia os ficheiros.
(b) Conforme o solicitado, junto se enviam os ficheiros.
De facto, há razão para dúvida.
No português antigo, encontravam-se frases do tipo da (a). Actualmente, porém, tem-se geralmente como correcta apenas a frase (b). Em «se enviam os ficheiros», temos a voz passiva formada com a palavra apassivadora ou apassivante se, também chamada partícula apassivante se. Chama-se apassivante, porque apassiva o verbo a que se liga. Isto é, «junto se enviam os ficheiros» é equivalente a «junto são enviados os ficheiros», em que os ficheiros é o sujeito da oração, isto é, de se enviam (= são enviados).
Mais ainda: a frase (b), por ter o verbo no plural, «cai-nos» melhor na compreensão por concordar com os ficheiros. É mais nítida a visualização.