Intel syntax: Robustify memory operand parsing.
authorDevang Patel <dpatel@apple.com>
Tue, 17 Jan 2012 18:00:18 +0000 (18:00 +0000)
committerDevang Patel <dpatel@apple.com>
Tue, 17 Jan 2012 18:00:18 +0000 (18:00 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@148312 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/X86/AsmParser/X86AsmParser.cpp
test/MC/X86/intel-syntax.s

index ce3831f2de85667e7f196a9e119fc6f742ad8c11..d974069b826462ae2254b490c9fe2e7627724e8b 100644 (file)
@@ -45,9 +45,16 @@ private:
     return Parser.Error(L, Msg, Ranges);
   }
 
+  X86Operand *ErrorOperand(SMLoc Loc, StringRef Msg) {
+    Error(Loc, Msg);
+    return 0;
+  }
+
   X86Operand *ParseOperand();
   X86Operand *ParseATTOperand();
   X86Operand *ParseIntelOperand();
+  X86Operand *ParseIntelMemOperand();
+  X86Operand *ParseIntelBracExpression(unsigned Size);
   X86Operand *ParseMemOperand(unsigned SegReg, SMLoc StartLoc);
 
   bool ParseDirectiveWord(unsigned Size, SMLoc L);
@@ -447,9 +454,11 @@ bool X86AsmParser::ParseRegister(unsigned &RegNo,
                                  SMLoc &StartLoc, SMLoc &EndLoc) {
   RegNo = 0;
   const AsmToken &TokPercent = Parser.getTok();
-  assert(TokPercent.is(AsmToken::Percent) && "Invalid token kind!");
-  StartLoc = TokPercent.getLoc();
-  Parser.Lex(); // Eat percent token.
+  if (!getParser().getAssemblerDialect()) {
+    assert(TokPercent.is(AsmToken::Percent) && "Invalid token kind!");
+    StartLoc = TokPercent.getLoc();
+    Parser.Lex(); // Eat percent token.
+  }
 
   const AsmToken &Tok = Parser.getTok();
   if (Tok.isNot(AsmToken::Identifier))
@@ -559,10 +568,9 @@ static unsigned getIntelRegisterOperand(StringRef Str) {
   return RegNo;
 }
 
-/// isIntelMemOperand - If this is an intel memory operand
-/// then return true.
-static bool isIntelMemOperand(StringRef OpStr, unsigned &Size) {
-  Size = 0;
+/// getIntelMemOperandSize - Return intel memory operand size.
+static unsigned getIntelMemOperandSize(StringRef OpStr) {
+  unsigned Size = 0;
   if (OpStr == "BYTE") Size = 8;
   if (OpStr == "WORD") Size = 16;
   if (OpStr == "DWORD") Size = 32;
@@ -570,70 +578,124 @@ static bool isIntelMemOperand(StringRef OpStr, unsigned &Size) {
   if (OpStr == "XWORD") Size = 80;
   if (OpStr == "XMMWORD") Size = 128;
   if (OpStr == "YMMWORD") Size = 256;
-  return Size != 0;
+  return Size;
 }
 
-X86Operand *X86AsmParser::ParseIntelOperand() {
-
+X86Operand *X86AsmParser::ParseIntelBracExpression(unsigned Size) {
+  unsigned SegReg = 0, BaseReg = 0, IndexReg = 0, Scale = 1;
   const AsmToken &Tok = Parser.getTok();
   SMLoc Start = Parser.getTok().getLoc(), End;
 
-  // register
-  if(unsigned RegNo = getIntelRegisterOperand(Tok.getString())) {
-    Parser.Lex();
-    End = Parser.getTok().getLoc();
-    return X86Operand::CreateReg(RegNo, Start, End);
-  }
+  const MCExpr *Disp = MCConstantExpr::Create(0, getParser().getContext());
+  // Parse [ BaseReg + Scale*IndexReg + Disp ] or [ symbol ]
 
-  // mem operand
-  unsigned SegReg = 0, BaseReg = 0, IndexReg = 0, Scale = 1;
-  StringRef OpStr = Tok.getString();
-  unsigned Size = 0;
-  if (isIntelMemOperand(OpStr, Size)) {
-    Parser.Lex();
-    if (Tok.getString() == "PTR")
+  // Eat '['
+  if (getLexer().isNot(AsmToken::LBrac))
+    return ErrorOperand(Start, "Expected '[' token!");
+  Parser.Lex();
+  
+  if (getLexer().is(AsmToken::Identifier)) {
+    // Parse BaseReg
+    BaseReg = getIntelRegisterOperand(Tok.getString());
+    if (BaseReg)
       Parser.Lex();
     else {
-      Error(Start, "unexpected token!");
-      return 0;
-    }
-
-    if (Tok.getString() == "[")
+      // Handle '[' 'symbol' ']'
+      const MCExpr *Disp = MCConstantExpr::Create(0, getParser().getContext());
+      if (getParser().ParseExpression(Disp, End)) return 0;
+      if (getLexer().isNot(AsmToken::RBrac))
+       return ErrorOperand(Start, "Expected ']' token!");
       Parser.Lex();
-    else {
-      Error(Start, "unexpected token!");
-      return 0;
+      return X86Operand::CreateMem(Disp, Start, End, Size);
     }
+  } else if (getLexer().is(AsmToken::Integer)) {
+      // Handle '[' number ']'
+      const MCExpr *Disp = MCConstantExpr::Create(0, getParser().getContext());
+      if (getParser().ParseExpression(Disp, End)) return 0;
+      if (getLexer().isNot(AsmToken::RBrac))
+       return ErrorOperand(Start, "Expected ']' token!");
+      Parser.Lex();
+      return X86Operand::CreateMem(Disp, Start, End, Size);
+  }
 
-    SMLoc LParenLoc = Parser.getTok().getLoc();
-    BaseReg = getIntelRegisterOperand(Tok.getString());
-    if (BaseReg == 0) {
-      Error(LParenLoc, "unexpected token!");
-      return 0;
-    }
+  if (getLexer().is(AsmToken::Plus) || getLexer().is(AsmToken::Minus)) {
+    bool isPlus = getLexer().is(AsmToken::Plus);
     Parser.Lex();
-    const MCExpr *Disp = MCConstantExpr::Create(0, getParser().getContext());
-    SMLoc ExprEnd;
-    if (getParser().ParseExpression(Disp, ExprEnd)) return 0;
-    End = Parser.getTok().getLoc();
-    if (Tok.getString() == "]")
+    SMLoc PlusLoc = Parser.getTok().getLoc();
+    if (getLexer().is(AsmToken::Integer)) {
+      int64_t Val = Parser.getTok().getIntVal();
       Parser.Lex();
-    if (BaseReg == 0) {
-      Error(End, "unexpected token!");
-      return 0;
+      if (getLexer().is(AsmToken::Star)) {
+       Parser.Lex();
+       SMLoc IdxRegLoc = Parser.getTok().getLoc();
+       IndexReg = getIntelRegisterOperand(Parser.getTok().getString());
+       if (!IndexReg) return ErrorOperand(IdxRegLoc, "Expected register");
+       Parser.Lex(); // Eat register
+       Scale = Val;
+      } else if (getLexer().is(AsmToken::RBrac)) {
+       const MCExpr *ValExpr = MCConstantExpr::Create(Val, getContext());
+       Disp = isPlus ? MCUnaryExpr::CreatePlus(ValExpr, getContext()) :
+         MCUnaryExpr::CreateMinus(ValExpr, getContext());
+      } else
+       return ErrorOperand(PlusLoc, "unexpected token after +");
     }
-    return X86Operand::CreateMem(SegReg, Disp, BaseReg, IndexReg, Scale,
-                                 Start, End, Size);
   }
 
+  if (getLexer().isNot(AsmToken::RBrac))
+    if (getParser().ParseExpression(Disp, End)) return 0;
+
+  End = Parser.getTok().getLoc();
+  if (getLexer().isNot(AsmToken::RBrac))
+    return ErrorOperand(End, "expected ']' token!");
+  Parser.Lex();
+  End = Parser.getTok().getLoc();
+  return X86Operand::CreateMem(SegReg, Disp, BaseReg, IndexReg, Scale,
+                              Start, End, Size);
+}
+
+/// ParseIntelMemOperand - Parse intel style memory operand.
+X86Operand *X86AsmParser::ParseIntelMemOperand() {
+  const AsmToken &Tok = Parser.getTok();
+  SMLoc Start = Parser.getTok().getLoc(), End;
+
+  unsigned Size = getIntelMemOperandSize(Tok.getString());
+  if (Size) {
+    Parser.Lex();
+    assert (Tok.getString() == "PTR" && "Unexpected token!");
+    Parser.Lex();
+  }
+
+  if (getLexer().is(AsmToken::LBrac))
+    return ParseIntelBracExpression(Size);
+
+  const MCExpr *Disp = MCConstantExpr::Create(0, getParser().getContext());
+  if (getParser().ParseExpression(Disp, End)) return 0;
+  return X86Operand::CreateMem(Disp, Start, End, Size);
+}
+
+X86Operand *X86AsmParser::ParseIntelOperand() {
+  StringRef TokenString = Parser.getTok().getString();
+  SMLoc Start = Parser.getTok().getLoc(), End;
+
   // immediate.
-  const MCExpr *Val;
-  if (!getParser().ParseExpression(Val, End)) {
+  if (getLexer().is(AsmToken::Integer) || getLexer().is(AsmToken::Real) ||
+      getLexer().is(AsmToken::Minus)) {
+    const MCExpr *Val;
+    if (!getParser().ParseExpression(Val, End)) {
+      End = Parser.getTok().getLoc();
+      return X86Operand::CreateImm(Val, Start, End);
+    }
+  }
+
+  // register
+  if(unsigned RegNo = getIntelRegisterOperand(TokenString)) {
+    Parser.Lex();
     End = Parser.getTok().getLoc();
-    return X86Operand::CreateImm(Val, Start, End);
+    return X86Operand::CreateReg(RegNo, Start, End);
   }
 
-  return 0;
+  // mem operand
+  return ParseIntelMemOperand();
 }
 
 X86Operand *X86AsmParser::ParseATTOperand() {
index dbd78a3aee18542a94b235a11d1e8373725a58be..ec236e0ef770610ed4d74c3aaf09098af0f555df 100644 (file)
@@ -8,3 +8,11 @@
        mov     BYTE PTR [RSP - 17], 97
 // CHECK:      movl    -4(%rsp), %eax
        mov     EAX, DWORD PTR [RSP - 4]
+// CHECK:      movq    (%rsp), %rax
+       mov     RAX, QWORD PTR [RSP]
+// CHECK:      movl    $-4, -4(%rsp)
+       mov     DWORD PTR [RSP - 4], -4
+// CHECK:      movq    0, %rcx
+       mov     RCX, QWORD PTR [0]
+// CHECK:      movl    -24(%rsp,%rax,4), %eax  
+       mov     EAX, DWORD PTR [RSP + 4*RAX - 24]