CPU Register mit 64 Bits => bis zu 2 hoch *64* Bits im RAM addressierbar
(= doppelte Größe möglich)
In 64 passt 32 nach Adam und Riese bekanntlich zweimal rein, somit können bei entsprechender Optimierung des Programmcodes zwei 32-Bits-Worte auf einmal im Speicher mit nur einem CPU-Befehl abgelegt werden. Dies ist nur ein Beispiel, aber somit hat die Anzahl an verfügbaren Bits - wenn auch nur unsignifikant - sehr wohl auch eine Auswirkung auf die Geschwindigkeit.
Moderne CPUs nutzen intern sowieso *immer* einen Adressbus von 64 Bits. Daher ist die Beschränkung auf 32 Bits aktuell als eine Art Verkrüppelung der CPU Features zu sehen.
Jedem, der mal Assembler programmiert hat, dürfte sowas klar sein.

Ergänzung: Durch die Umstellung auf 64 Bits braucht man zwangsläufig mehr Speicher, da die Verwaltung nicht mehr auf 32 Bits optimiert ist. Das Image eines 64 Bits System ist zwangsläufig größer als bei 32 Bits, da ja in Schritten von 64 Bits geladen wird. Sollte die CPU aber immer noch auf Byte-Ebene arbeiten, so bringt 64 Bits genauso viel wie 32, also gar nix.