Fix some sub-reg coalescing bugs where the coalescer wasn't updating the resulting...
authorEvan Cheng <evan.cheng@apple.com>
Mon, 20 Jul 2009 19:47:55 +0000 (19:47 +0000)
committerEvan Cheng <evan.cheng@apple.com>
Mon, 20 Jul 2009 19:47:55 +0000 (19:47 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@76458 91177308-0d34-0410-b5e6-96231b3b80d8

lib/CodeGen/SimpleRegisterCoalescing.cpp
lib/Target/X86/X86RegisterInfo.cpp
test/CodeGen/Thumb/2009-07-19-SPDecBug.ll [new file with mode: 0644]
test/CodeGen/X86/2009-07-20-CoalescerBug.ll [new file with mode: 0644]

index 0ce603cc6a323f8e0e82ec54520717113bf4fc66..daf7d4d5824c79517bd24e4195c8290547c49a6a 100644 (file)
@@ -614,15 +614,17 @@ bool SimpleRegisterCoalescing::ReMaterializeTrivialDef(LiveInterval &SrcInt,
     return false;
   if (TID.getNumDefs() != 1)
     return false;
-  // Make sure the copy destination register class fits the instruction
-  // definition register class. The mismatch can happen as a result of earlier
-  // extract_subreg, insert_subreg, subreg_to_reg coalescing.
-  const TargetRegisterClass *RC = getInstrOperandRegClass(tri_, TID, 0);
-  if (TargetRegisterInfo::isVirtualRegister(DstReg)) {
-    if (mri_->getRegClass(DstReg) != RC)
+  if (DefMI->getOpcode() != TargetInstrInfo::IMPLICIT_DEF) {
+    // Make sure the copy destination register class fits the instruction
+    // definition register class. The mismatch can happen as a result of earlier
+    // extract_subreg, insert_subreg, subreg_to_reg coalescing.
+    const TargetRegisterClass *RC = getInstrOperandRegClass(tri_, TID, 0);
+    if (TargetRegisterInfo::isVirtualRegister(DstReg)) {
+      if (mri_->getRegClass(DstReg) != RC)
+        return false;
+    } else if (!RC->contains(DstReg))
       return false;
-  } else if (!RC->contains(DstReg))
-    return false;
+  }
 
   unsigned DefIdx = li_->getDefIndex(CopyIdx);
   const LiveRange *DLR= li_->getInterval(DstReg).getLiveRangeContaining(DefIdx);
@@ -1378,13 +1380,17 @@ bool SimpleRegisterCoalescing::JoinCopy(CopyRec &TheCopy, bool &Again) {
         }
       }
       if (SubIdx) {
-        if (isInsSubReg || isSubRegToReg) {
-          if (!DstIsPhys && !SrcIsPhys) {
+        if (!DstIsPhys && !SrcIsPhys) {
+          if (isInsSubReg || isSubRegToReg) {
             NewRC = tri_->getMatchingSuperRegClass(DstRC, SrcRC, SubIdx);
-            if (!NewRC)
-              return false;
+          } else // extract_subreg {
+            NewRC = tri_->getMatchingSuperRegClass(SrcRC, DstRC, SubIdx);
           }
+        if (!NewRC) {
+          DOUT << "\t Conflicting sub-register indices.\n";
+          return false;  // Not coalescable
         }
+
         unsigned LargeReg = isExtSubReg ? SrcReg : DstReg;
         unsigned SmallReg = isExtSubReg ? DstReg : SrcReg;
         unsigned Limit= allocatableRCRegs_[mri_->getRegClass(SmallReg)].count();
index 0dc63ef9a611a9c5eab6b8b0b739db7e9ebaf8d8..751b20598b2a0583a1cc3662ed800054fedeed74 100644 (file)
@@ -161,69 +161,84 @@ X86RegisterInfo::getMatchingSuperRegClass(const TargetRegisterClass *A,
   case 1:
     // 8-bit
     if (B == &X86::GR8RegClass) {
-      if (A == &X86::GR64RegClass)
-        return &X86::GR64RegClass;
-      else if (A == &X86::GR32RegClass)
-        return &X86::GR32RegClass;
-      else if (A == &X86::GR16RegClass)
-        return &X86::GR16RegClass;
+      if (A->getSize() == 2 || A->getSize() == 4 || A->getSize() == 8)
+        return A;
     } else if (B == &X86::GR8_ABCD_LRegClass || B == &X86::GR8_ABCD_HRegClass) {
-      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass)
+      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass ||
+          A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_ABCDRegClass;
-      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass)
+      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass ||
+               A == &X86::GR32_NOREXRegClass)
         return &X86::GR32_ABCDRegClass;
-      else if (A == &X86::GR16RegClass || A == &X86::GR16_ABCDRegClass)
+      else if (A == &X86::GR16RegClass || A == &X86::GR16_ABCDRegClass ||
+               A == &X86::GR16_NOREXRegClass)
         return &X86::GR16_ABCDRegClass;
     } else if (B == &X86::GR8_NOREXRegClass) {
       if (A == &X86::GR64RegClass || A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_NOREXRegClass;
+      else if (A == &X86::GR64_ABCDRegClass)
+        return &X86::GR64_ABCDRegClass;
       else if (A == &X86::GR32RegClass || A == &X86::GR32_NOREXRegClass)
         return &X86::GR32_NOREXRegClass;
+      else if (A == &X86::GR32_ABCDRegClass)
+        return &X86::GR32_ABCDRegClass;
       else if (A == &X86::GR16RegClass || A == &X86::GR16_NOREXRegClass)
         return &X86::GR16_NOREXRegClass;
+      else if (A == &X86::GR16_ABCDRegClass)
+        return &X86::GR16_ABCDRegClass;
     }
     break;
   case 2:
     // 8-bit hi
     if (B == &X86::GR8_ABCD_HRegClass) {
-      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass)
+      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass ||
+          A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_ABCDRegClass;
-      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass)
+      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass ||
+               A == &X86::GR32_NOREXRegClass)
         return &X86::GR32_ABCDRegClass;
-      else if (A == &X86::GR16RegClass || A == &X86::GR16_ABCDRegClass)
+      else if (A == &X86::GR16RegClass || A == &X86::GR16_ABCDRegClass ||
+               A == &X86::GR16_NOREXRegClass)
         return &X86::GR16_ABCDRegClass;
     }
     break;
   case 3:
     // 16-bit
     if (B == &X86::GR16RegClass) {
-      if (A == &X86::GR64RegClass)
-        return &X86::GR64RegClass;
-      else if (A == &X86::GR32RegClass)
-        return &X86::GR32RegClass;
+      if (A->getSize() == 4 || A->getSize() == 8)
+        return A;
     } else if (B == &X86::GR16_ABCDRegClass) {
-      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass)
+      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass ||
+          A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_ABCDRegClass;
-      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass)
+      else if (A == &X86::GR32RegClass || A == &X86::GR32_ABCDRegClass ||
+               A == &X86::GR32_NOREXRegClass)
         return &X86::GR32_ABCDRegClass;
     } else if (B == &X86::GR16_NOREXRegClass) {
       if (A == &X86::GR64RegClass || A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_NOREXRegClass;
-      else if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass)
+      else if (A == &X86::GR64_ABCDRegClass)
+        return &X86::GR64_ABCDRegClass;
+      else if (A == &X86::GR32RegClass || A == &X86::GR32_NOREXRegClass)
+        return &X86::GR32_NOREXRegClass;
+      else if (A == &X86::GR32_ABCDRegClass)
         return &X86::GR64_ABCDRegClass;
     }
     break;
   case 4:
     // 32-bit
     if (B == &X86::GR32RegClass) {
-      if (A == &X86::GR64RegClass)
-        return &X86::GR64RegClass;
+      if (A->getSize() == 8)
+        return A;
     } else if (B == &X86::GR32_ABCDRegClass) {
-      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass)
+      if (A == &X86::GR64RegClass || A == &X86::GR64_ABCDRegClass ||
+          A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_ABCDRegClass;
     } else if (B == &X86::GR32_NOREXRegClass) {
       if (A == &X86::GR64RegClass || A == &X86::GR64_NOREXRegClass)
         return &X86::GR64_NOREXRegClass;
+      else if (A == &X86::GR64_ABCDRegClass)
+        return &X86::GR64_ABCDRegClass;
     }
     break;
   }
diff --git a/test/CodeGen/Thumb/2009-07-19-SPDecBug.ll b/test/CodeGen/Thumb/2009-07-19-SPDecBug.ll
new file mode 100644 (file)
index 0000000..5fd2e73
--- /dev/null
@@ -0,0 +1,33 @@
+; RUN: llvm-as < %s | llc -mtriple=thumbv6-elf | not grep "subs sp"
+; PR4567
+
+define arm_apcscc i8* @__gets_chk(i8* %s, i32 %slen) nounwind {
+entry:
+       br i1 undef, label %bb, label %bb1
+
+bb:            ; preds = %entry
+       ret i8* undef
+
+bb1:           ; preds = %entry
+       br i1 undef, label %bb3, label %bb2
+
+bb2:           ; preds = %bb1
+       %0 = alloca i8, i32 undef, align 4              ; <i8*> [#uses=0]
+       br label %bb4
+
+bb3:           ; preds = %bb1
+       %1 = malloc i8, i32 undef               ; <i8*> [#uses=0]
+       br label %bb4
+
+bb4:           ; preds = %bb3, %bb2
+       br i1 undef, label %bb5, label %bb6
+
+bb5:           ; preds = %bb4
+       %2 = call arm_apcscc  i8* @gets(i8* %s) nounwind                ; <i8*> [#uses=1]
+       ret i8* %2
+
+bb6:           ; preds = %bb4
+       unreachable
+}
+
+declare arm_apcscc i8* @gets(i8*) nounwind
diff --git a/test/CodeGen/X86/2009-07-20-CoalescerBug.ll b/test/CodeGen/X86/2009-07-20-CoalescerBug.ll
new file mode 100644 (file)
index 0000000..8f12f0b
--- /dev/null
@@ -0,0 +1,165 @@
+; RUN: llvm-as < %s | llc -mtriple=x86_64-apple-darwin10
+; PR4587
+; rdar://7072590
+
+       %struct.re_pattern_buffer = type <{ i8*, i64, i64, i64, i8*, i64, i64, i8, i8, i8, i8, i8, i8, i8, i8 }>
+
+define fastcc i32 @regex_compile(i8* %pattern, i64 %size, i64 %syntax, %struct.re_pattern_buffer* nocapture %bufp) nounwind ssp {
+entry:
+       br i1 undef, label %return, label %if.end
+
+if.end:                ; preds = %entry
+       %tmp35 = getelementptr %struct.re_pattern_buffer* %bufp, i64 0, i32 3           ; <i64*> [#uses=1]
+       store i64 %syntax, i64* %tmp35
+       store i32 undef, i32* undef
+       br i1 undef, label %if.then66, label %if.end102
+
+if.then66:             ; preds = %if.end
+       br i1 false, label %if.else, label %if.then70
+
+if.then70:             ; preds = %if.then66
+       %call74 = call i8* @xrealloc(i8* undef, i64 32) nounwind ssp            ; <i8*> [#uses=0]
+       unreachable
+
+if.else:               ; preds = %if.then66
+       br i1 false, label %do.body86, label %if.end99
+
+do.body86:             ; preds = %if.else
+       br i1 false, label %do.end, label %if.then90
+
+if.then90:             ; preds = %do.body86
+       unreachable
+
+do.end:                ; preds = %do.body86
+       ret i32 12
+
+if.end99:              ; preds = %if.else
+       br label %if.end102
+
+if.end102:             ; preds = %if.end99, %if.end
+       br label %while.body
+
+while.body:            ; preds = %if.end1126, %sw.bb532, %while.body, %if.end102
+       %laststart.2 = phi i8* [ null, %if.end102 ], [ %laststart.7.ph, %if.end1126 ], [ %laststart.2, %sw.bb532 ], [ %laststart.2, %while.body ]               ; <i8*> [#uses=6]
+       %b.1 = phi i8* [ undef, %if.end102 ], [ %ctg29688, %if.end1126 ], [ %b.1, %sw.bb532 ], [ %b.1, %while.body ]            ; <i8*> [#uses=5]
+       br i1 undef, label %while.body, label %if.end127
+
+if.end127:             ; preds = %while.body
+       switch i32 undef, label %sw.bb532 [
+               i32 123, label %handle_interval
+               i32 92, label %do.body3527
+       ]
+
+sw.bb532:              ; preds = %if.end127
+       br i1 undef, label %while.body, label %if.end808
+
+if.end808:             ; preds = %sw.bb532
+       br i1 undef, label %while.cond1267.preheader, label %if.then811
+
+while.cond1267.preheader:              ; preds = %if.end808
+       br i1 false, label %return, label %if.end1294
+
+if.then811:            ; preds = %if.end808
+       %call817 = call fastcc i8* @skip_one_char(i8* %laststart.2) ssp         ; <i8*> [#uses=0]
+       br i1 undef, label %cond.end834, label %lor.lhs.false827
+
+lor.lhs.false827:              ; preds = %if.then811
+       br label %cond.end834
+
+cond.end834:           ; preds = %lor.lhs.false827, %if.then811
+       br i1 undef, label %land.lhs.true838, label %while.cond979.preheader
+
+land.lhs.true838:              ; preds = %cond.end834
+       br i1 undef, label %if.then842, label %while.cond979.preheader
+
+if.then842:            ; preds = %land.lhs.true838
+       %conv851 = trunc i64 undef to i32               ; <i32> [#uses=1]
+       br label %while.cond979.preheader
+
+while.cond979.preheader:               ; preds = %if.then842, %land.lhs.true838, %cond.end834
+       %startoffset.0.ph = phi i32 [ 0, %cond.end834 ], [ 0, %land.lhs.true838 ], [ %conv851, %if.then842 ]            ; <i32> [#uses=2]
+       %laststart.7.ph = phi i8* [ %laststart.2, %cond.end834 ], [ %laststart.2, %land.lhs.true838 ], [ %laststart.2, %if.then842 ]            ; <i8*> [#uses=3]
+       %b.4.ph = phi i8* [ %b.1, %cond.end834 ], [ %b.1, %land.lhs.true838 ], [ %b.1, %if.then842 ]            ; <i8*> [#uses=3]
+       %ctg29688 = getelementptr i8* %b.4.ph, i64 6            ; <i8*> [#uses=1]
+       br label %while.cond979
+
+while.cond979:         ; preds = %if.end1006, %while.cond979.preheader
+       %cmp991 = icmp ugt i64 undef, 0         ; <i1> [#uses=1]
+       br i1 %cmp991, label %do.body994, label %while.end1088
+
+do.body994:            ; preds = %while.cond979
+       br i1 undef, label %return, label %if.end1006
+
+if.end1006:            ; preds = %do.body994
+       %cmp1014 = icmp ugt i64 undef, 32768            ; <i1> [#uses=1]
+       %storemerge10953 = select i1 %cmp1014, i64 32768, i64 undef             ; <i64> [#uses=1]
+       store i64 %storemerge10953, i64* undef
+       br i1 false, label %return, label %while.cond979
+
+while.end1088:         ; preds = %while.cond979
+       br i1 undef, label %if.then1091, label %if.else1101
+
+if.then1091:           ; preds = %while.end1088
+       store i8 undef, i8* undef
+       %idx.ext1132.pre = zext i32 %startoffset.0.ph to i64            ; <i64> [#uses=1]
+       %add.ptr1133.pre = getelementptr i8* %laststart.7.ph, i64 %idx.ext1132.pre              ; <i8*> [#uses=1]
+       %sub.ptr.lhs.cast1135.pre = ptrtoint i8* %add.ptr1133.pre to i64                ; <i64> [#uses=1]
+       br label %if.end1126
+
+if.else1101:           ; preds = %while.end1088
+       %cond1109 = select i1 undef, i32 18, i32 14             ; <i32> [#uses=1]
+       %idx.ext1112 = zext i32 %startoffset.0.ph to i64                ; <i64> [#uses=1]
+       %add.ptr1113 = getelementptr i8* %laststart.7.ph, i64 %idx.ext1112              ; <i8*> [#uses=2]
+       %sub.ptr.rhs.cast1121 = ptrtoint i8* %add.ptr1113 to i64                ; <i64> [#uses=1]
+       call fastcc void @insert_op1(i32 %cond1109, i8* %add.ptr1113, i32 undef, i8* %b.4.ph) ssp
+       br label %if.end1126
+
+if.end1126:            ; preds = %if.else1101, %if.then1091
+       %sub.ptr.lhs.cast1135.pre-phi = phi i64 [ %sub.ptr.rhs.cast1121, %if.else1101 ], [ %sub.ptr.lhs.cast1135.pre, %if.then1091 ]            ; <i64> [#uses=1]
+       %add.ptr1128 = getelementptr i8* %b.4.ph, i64 3         ; <i8*> [#uses=1]
+       %sub.ptr.rhs.cast1136 = ptrtoint i8* %add.ptr1128 to i64                ; <i64> [#uses=1]
+       %sub.ptr.sub1137 = sub i64 %sub.ptr.lhs.cast1135.pre-phi, %sub.ptr.rhs.cast1136         ; <i64> [#uses=1]
+       %sub.ptr.sub11378527 = trunc i64 %sub.ptr.sub1137 to i32                ; <i32> [#uses=1]
+       %conv1139 = add i32 %sub.ptr.sub11378527, -3            ; <i32> [#uses=1]
+       store i8 undef, i8* undef
+       %shr10.i8599 = lshr i32 %conv1139, 8            ; <i32> [#uses=1]
+       %conv6.i8600 = trunc i32 %shr10.i8599 to i8             ; <i8> [#uses=1]
+       store i8 %conv6.i8600, i8* undef
+       br label %while.body
+
+if.end1294:            ; preds = %while.cond1267.preheader
+       ret i32 12
+
+do.body3527:           ; preds = %if.end127
+       br i1 undef, label %do.end3536, label %if.then3531
+
+if.then3531:           ; preds = %do.body3527
+       unreachable
+
+do.end3536:            ; preds = %do.body3527
+       ret i32 5
+
+handle_interval:               ; preds = %if.end127
+       br i1 undef, label %do.body4547, label %cond.false4583
+
+do.body4547:           ; preds = %handle_interval
+       br i1 undef, label %do.end4556, label %if.then4551
+
+if.then4551:           ; preds = %do.body4547
+       unreachable
+
+do.end4556:            ; preds = %do.body4547
+       ret i32 9
+
+cond.false4583:                ; preds = %handle_interval
+       unreachable
+
+return:                ; preds = %if.end1006, %do.body994, %while.cond1267.preheader, %entry
+       ret i32 undef
+}
+
+declare i8* @xrealloc(i8*, i64) ssp
+
+declare fastcc i8* @skip_one_char(i8*) nounwind readonly ssp
+
+declare fastcc void @insert_op1(i32, i8*, i32, i8*) nounwind ssp