another missed SSE optimization

[oota-llvm.git] / lib / Target / X86 / X86CallingConv.td
diff --git a/lib/Target/X86/X86CallingConv.td b/lib/Target/X86/X86CallingConv.td

index f96b040461a8ef66f9a49e2b24d3390df3bb5409..39811bd7409de03007be2bbc2a599f723bb72ebf 100644 (file)
--- a/lib/Target/X86/X86CallingConv.td
+++ b/lib/Target/X86/X86CallingConv.td
@@ -28,9 +28,14 @@ def RetCC_X86Common : CallingConv<[
    CCIfType<[i32], CCAssignToReg<[EAX, EDX]>>,
    CCIfType<[i64], CCAssignToReg<[RAX, RDX]>>,
    
-  // Vector types are always returned in XMM0.  If the target doesn't have XMM0,
-  // it won't have vector types.
-  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64], CCAssignToReg<[XMM0]>>
+  // Vector types are returned in XMM0 and XMM1, when they fit.  If the target
+  // doesn't have XMM registers, it won't have vector types.
+  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64],
+            CCAssignToReg<[XMM0,XMM1]>>,
+
+  // MMX vector types are always returned in MM0. If the target doesn't have
+  // MM0, it doesn't support these vector types.
+  CCIfType<[v8i8, v4i16, v2i32, v1i64], CCAssignToReg<[MM0]>>
  ]>;
  
  // X86-32 C return-value convention.
@@ -89,6 +94,8 @@ def CC_X86_64_C : CallingConv<[
    // Promote i8/i16 arguments to i32.
    CCIfType<[i8, i16], CCPromoteToType<i32>>,
    
+  CCIfStruct<CCStructAssign<[RDI, RSI, RDX, RCX, R8, R9 ]>>,
+
    // The first 6 integer arguments are passed in integer registers.
    CCIfType<[i32], CCAssignToReg<[EDI, ESI, EDX, ECX, R8D, R9D]>>,
    CCIfType<[i64], CCAssignToReg<[RDI, RSI, RDX, RCX, R8 , R9 ]>>,
@@ -97,13 +104,19 @@ def CC_X86_64_C : CallingConv<[
    CCIfType<[f32, f64, v16i8, v8i16, v4i32, v2i64, v4f32, v2f64],
                CCAssignToReg<[XMM0, XMM1, XMM2, XMM3, XMM4, XMM5, XMM6, XMM7]>>,
  
+  // The first 8 MMX vector arguments are passed in GPRs.
+  CCIfType<[v8i8, v4i16, v2i32, v1i64],
+              CCAssignToReg<[RDI, RSI, RDX, RCX, R8 , R9 ]>>,
+
    // Integer/FP values get stored in stack slots that are 8 bytes in size and
    // 8-byte aligned if there are no more registers to hold them.
    CCIfType<[i32, i64, f32, f64], CCAssignToStack<8, 8>>,
    
    // Vectors get 16-byte stack slots that are 16-byte aligned.
-  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64],
-              CCAssignToStack<16, 16>>
+  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64], CCAssignToStack<16, 16>>,
+
+  // __m64 vectors get 8-byte stack slots that are 8-byte aligned.
+  CCIfType<[v8i8, v4i16, v2i32, v1i64], CCAssignToStack<8, 8>>
  ]>;
  
  
@@ -127,16 +140,20 @@ def CC_X86_32_Common : CallingConv<[
                CCAssignToReg<[XMM0, XMM1, XMM2, XMM3]>>,
  
    // Other vectors get 16-byte stack slots that are 16-byte aligned.
-  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64], CCAssignToStack<16, 16>>
+  CCIfType<[v16i8, v8i16, v4i32, v2i64, v4f32, v2f64], CCAssignToStack<16, 16>>,
+
+  // __m64 vectors get 8-byte stack slots that are 8-byte aligned. They are
+  // passed in the parameter area.
+  CCIfType<[v8i8, v4i16, v2i32, v1i64], CCAssignToStack<8, 8>>
  ]>;
  
  def CC_X86_32_C : CallingConv<[
    // Promote i8/i16 arguments to i32.
    CCIfType<[i8, i16], CCPromoteToType<i32>>,
    
-  // The first 3 integer arguments, if marked 'inreg', are passed in integer
-  // registers.
-  CCIfInReg<CCIfType<[i32], CCAssignToReg<[EAX, EDX, ECX]>>>,
+  // The first 3 integer arguments, if marked 'inreg' and if the call is not
+  // a vararg call, are passed in integer registers.
+  CCIfNotVarArg<CCIfInReg<CCIfType<[i32], CCAssignToReg<[EAX, EDX, ECX]>>>>,
    
    // Otherwise, same as everything else.
    CCDelegateTo<CC_X86_32_Common>
@@ -148,10 +165,8 @@ def CC_X86_32_FastCall : CallingConv<[
    CCIfType<[i8, i16], CCPromoteToType<i32>>,
    
    // The first 2 integer arguments are passed in ECX/EDX
-  CCIfInReg<CCIfType<[i32], CCAssignToReg<[ECX, EDX]>>>,
+  CCIfType<[i32], CCAssignToReg<[ECX, EDX]>>,
    
    // Otherwise, same as everything else.
    CCDelegateTo<CC_X86_32_Common>
  ]>;
-
-