test/Analysis/Delinearization/gcd_multiply_expr.ll

   1 ; RUN: opt < %s -basicaa -da -analyze -delinearize
   2 ;
   3 ; a, b, c, d, g, h;
   4 ; char *f;
   5 ; static fn1(p1) {
   6 ;   char *e = p1;
   7 ;   for (; d;) {
   8 ;     a = 0;
   9 ;     for (;; ++a)
  10 ;       for (; b; ++b)
  11 ;         c = e[b + a];
  12 ;   }
  13 ; }
  14 ;
  15 ; fn2() {
  16 ;   for (;;)
  17 ;     fn1(&f[g * h]);
  18 ; }
  19
  20 @g = common global i32 0, align 4
  21 @h = common global i32 0, align 4
  22 @f = common global i8* null, align 4
  23 @a = common global i32 0, align 4
  24 @b = common global i32 0, align 4
  25 @c = common global i32 0, align 4
  26 @d = common global i32 0, align 4
  27
  28 define i32 @fn2() {
  29 entry:
  30   %.pr = load i32, i32* @d, align 4
  31   %phitmp = icmp eq i32 %.pr, 0
  32   br label %for.cond
  33
  34 for.cond:
  35   %0 = phi i1 [ true, %for.cond ], [ %phitmp, %entry ]
  36   br i1 %0, label %for.cond, label %for.cond2thread-pre-split.preheader.i
  37
  38 for.cond2thread-pre-split.preheader.i:
  39   %1 = load i32, i32* @g, align 4
  40   %2 = load i32, i32* @h, align 4
  41   %mul = mul nsw i32 %2, %1
  42   %3 = load i8*, i8** @f, align 4
  43   %.pr.pre.i = load i32, i32* @b, align 4
  44   br label %for.cond2thread-pre-split.i
  45
  46 for.cond2thread-pre-split.i:
  47   %.pr.i = phi i32 [ 0, %for.inc5.i ], [ %.pr.pre.i, %for.cond2thread-pre-split.preheader.i ]
  48   %storemerge.i = phi i32 [ %inc6.i, %for.inc5.i ], [ 0, %for.cond2thread-pre-split.preheader.i ]
  49   store i32 %storemerge.i, i32* @a, align 4
  50   %tobool31.i = icmp eq i32 %.pr.i, 0
  51   br i1 %tobool31.i, label %for.inc5.i, label %for.body4.preheader.i
  52
  53 for.body4.preheader.i:
  54   %4 = icmp slt i32 %.pr.i, -7
  55   %add.i = add i32 %storemerge.i, %mul
  56   br i1 %4, label %for.body4.i.preheader, label %for.body4.ur.i.preheader
  57
  58 for.body4.i.preheader:
  59   %5 = sub i32 -8, %.pr.i
  60   %6 = lshr i32 %5, 3
  61   %7 = mul i32 %6, 8
  62   br label %for.body4.i
  63
  64 for.body4.i:
  65   %8 = phi i32 [ %inc.7.i, %for.body4.i ], [ %.pr.i, %for.body4.i.preheader ]
  66   %arrayidx.sum1 = add i32 %add.i, %8
  67   %arrayidx.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum1
  68   %9 = load i8, i8* %arrayidx.i, align 1
  69   %conv.i = sext i8 %9 to i32
  70   store i32 %conv.i, i32* @c, align 4
  71   %inc.i = add nsw i32 %8, 1
  72   store i32 %inc.i, i32* @b, align 4
  73   %arrayidx.sum2 = add i32 %add.i, %inc.i
  74   %arrayidx.1.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum2
  75   %10 = load i8, i8* %arrayidx.1.i, align 1
  76   %conv.1.i = sext i8 %10 to i32
  77   store i32 %conv.1.i, i32* @c, align 4
  78   %inc.1.i = add nsw i32 %8, 2
  79   store i32 %inc.1.i, i32* @b, align 4
  80   %arrayidx.sum3 = add i32 %add.i, %inc.1.i
  81   %arrayidx.2.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum3
  82   %11 = load i8, i8* %arrayidx.2.i, align 1
  83   %conv.2.i = sext i8 %11 to i32
  84   store i32 %conv.2.i, i32* @c, align 4
  85   %inc.2.i = add nsw i32 %8, 3
  86   store i32 %inc.2.i, i32* @b, align 4
  87   %arrayidx.sum4 = add i32 %add.i, %inc.2.i
  88   %arrayidx.3.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum4
  89   %12 = load i8, i8* %arrayidx.3.i, align 1
  90   %conv.3.i = sext i8 %12 to i32
  91   store i32 %conv.3.i, i32* @c, align 4
  92   %inc.3.i = add nsw i32 %8, 4
  93   store i32 %inc.3.i, i32* @b, align 4
  94   %arrayidx.sum5 = add i32 %add.i, %inc.3.i
  95   %arrayidx.4.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum5
  96   %13 = load i8, i8* %arrayidx.4.i, align 1
  97   %conv.4.i = sext i8 %13 to i32
  98   store i32 %conv.4.i, i32* @c, align 4
  99   %inc.4.i = add nsw i32 %8, 5
 100   store i32 %inc.4.i, i32* @b, align 4
 101   %arrayidx.sum6 = add i32 %add.i, %inc.4.i
 102   %arrayidx.5.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum6
 103   %14 = load i8, i8* %arrayidx.5.i, align 1
 104   %conv.5.i = sext i8 %14 to i32
 105   store i32 %conv.5.i, i32* @c, align 4
 106   %inc.5.i = add nsw i32 %8, 6
 107   store i32 %inc.5.i, i32* @b, align 4
 108   %arrayidx.sum7 = add i32 %add.i, %inc.5.i
 109   %arrayidx.6.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum7
 110   %15 = load i8, i8* %arrayidx.6.i, align 1
 111   %conv.6.i = sext i8 %15 to i32
 112   store i32 %conv.6.i, i32* @c, align 4
 113   %inc.6.i = add nsw i32 %8, 7
 114   store i32 %inc.6.i, i32* @b, align 4
 115   %arrayidx.sum8 = add i32 %add.i, %inc.6.i
 116   %arrayidx.7.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum8
 117   %16 = load i8, i8* %arrayidx.7.i, align 1
 118   %conv.7.i = sext i8 %16 to i32
 119   store i32 %conv.7.i, i32* @c, align 4
 120   %inc.7.i = add nsw i32 %8, 8
 121   store i32 %inc.7.i, i32* @b, align 4
 122   %tobool3.7.i = icmp sgt i32 %inc.7.i, -8
 123   br i1 %tobool3.7.i, label %for.inc5.loopexit.ur-lcssa.i, label %for.body4.i
 124
 125 for.inc5.loopexit.ur-lcssa.i:
 126   %17 = add i32 %.pr.i, 8
 127   %18 = add i32 %17, %7
 128   %19 = icmp eq i32 %18, 0
 129   br i1 %19, label %for.inc5.i, label %for.body4.ur.i.preheader
 130
 131 for.body4.ur.i.preheader:
 132   %.ph = phi i32 [ %18, %for.inc5.loopexit.ur-lcssa.i ], [ %.pr.i, %for.body4.preheader.i ]
 133   br label %for.body4.ur.i
 134
 135 for.body4.ur.i:
 136   %20 = phi i32 [ %inc.ur.i, %for.body4.ur.i ], [ %.ph, %for.body4.ur.i.preheader ]
 137   %arrayidx.sum = add i32 %add.i, %20
 138   %arrayidx.ur.i = getelementptr inbounds i8, i8* %3, i32 %arrayidx.sum
 139   %21 = load i8, i8* %arrayidx.ur.i, align 1
 140   %conv.ur.i = sext i8 %21 to i32
 141   store i32 %conv.ur.i, i32* @c, align 4
 142   %inc.ur.i = add nsw i32 %20, 1
 143   store i32 %inc.ur.i, i32* @b, align 4
 144   %tobool3.ur.i = icmp eq i32 %inc.ur.i, 0
 145   br i1 %tobool3.ur.i, label %for.inc5.i.loopexit, label %for.body4.ur.i
 146
 147 for.inc5.i.loopexit:
 148   br label %for.inc5.i
 149
 150 for.inc5.i:
 151   %inc6.i = add nsw i32 %storemerge.i, 1
 152   br label %for.cond2thread-pre-split.i
 153 }