x86/lib/copy_page_64.S: Use generic ALTERNATIVE macro
authorBorislav Petkov <bp@suse.de>
Mon, 12 Jan 2015 17:19:40 +0000 (18:19 +0100)
committerBorislav Petkov <bp@suse.de>
Mon, 23 Feb 2015 12:44:12 +0000 (13:44 +0100)
commit090a3f615524c3f75d09fdb37f15ea1868d79f7e
treed349bcdaab0b39049169de5a0844ddd22f548056
parent4fd4b6e5537cec5b56db0b22546dd439ebb26830
x86/lib/copy_page_64.S: Use generic ALTERNATIVE macro

... instead of the semi-version with the spelled out sections.

What is more, make the REP_GOOD version be the default copy_page()
version as the majority of the relevant x86 CPUs do set
X86_FEATURE_REP_GOOD. Thus, copy_page gets compiled to:

  ffffffff8130af80 <copy_page>:
  ffffffff8130af80:       e9 0b 00 00 00          jmpq   ffffffff8130af90 <copy_page_regs>
  ffffffff8130af85:       b9 00 02 00 00          mov    $0x200,%ecx
  ffffffff8130af8a:       f3 48 a5                rep movsq %ds:(%rsi),%es:(%rdi)
  ffffffff8130af8d:       c3                      retq
  ffffffff8130af8e:       66 90                   xchg   %ax,%ax

  ffffffff8130af90 <copy_page_regs>:
  ...

and after the alternatives have run, the JMP to the old, unrolled
version gets NOPed out:

  ffffffff8130af80 <copy_page>:
  ffffffff8130af80:  66 66 90 xchg   %ax,%ax
  ffffffff8130af83:  66 90 xchg   %ax,%ax
  ffffffff8130af85:  b9 00 02 00 00 mov    $0x200,%ecx
  ffffffff8130af8a:  f3 48 a5 rep movsq %ds:(%rsi),%es:(%rdi)
  ffffffff8130af8d:  c3 retq

On modern uarches, those NOPs are cheaper than the unconditional JMP
previously.

Signed-off-by: Borislav Petkov <bp@suse.de>
arch/x86/lib/copy_page_64.S