tcg: Promote tcg_out_{dup,dupi}_vec to backend interface

[mirror_qemu.git] / tcg / optimize.c
diff --git a/tcg/optimize.c b/tcg/optimize.c

index d4ea67e5418e4e74e6e9e4c31f861b95086b340b..24faa0626065bd7a68804bf1f90cad13a184f4c7 100644 (file)
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -353,6 +353,15 @@ static TCGArg do_constant_folding_2(TCGOpcode op, TCGArg x, TCGArg y)
      CASE_OP_32_64(ext16u):
          return (uint16_t)x;
  
+    CASE_OP_32_64(bswap16):
+        return bswap16(x);
+
+    CASE_OP_32_64(bswap32):
+        return bswap32(x);
+
+    case INDEX_op_bswap64_i64:
+        return bswap64(x);
+
      case INDEX_op_ext_i32_i64:
      case INDEX_op_ext32s_i64:
          return (int32_t)x;
@@ -725,9 +734,13 @@ void tcg_optimize(TCGContext *s)
                  } else if (opc == INDEX_op_sub_i64) {
                      neg_op = INDEX_op_neg_i64;
                      have_neg = TCG_TARGET_HAS_neg_i64;
-                } else {
+                } else if (TCG_TARGET_HAS_neg_vec) {
+                    TCGType type = TCGOP_VECL(op) + TCG_TYPE_V64;
+                    unsigned vece = TCGOP_VECE(op);
                      neg_op = INDEX_op_neg_vec;
-                    have_neg = TCG_TARGET_HAS_neg_vec;
+                    have_neg = tcg_can_emit_vec_op(neg_op, type, vece) > 0;
+                } else {
+                    break;
                  }
                  if (!have_neg) {
                      break;
@@ -1094,9 +1107,9 @@ void tcg_optimize(TCGContext *s)
                  tmp = arg_info(op->args[1])->val;
                  tmp = dup_const(TCGOP_VECE(op), tmp);
                  tcg_opt_gen_movi(s, op, op->args[0], tmp);
-                continue;
+                break;
              }
-            break;
+            goto do_default;
  
          CASE_OP_32_64(not):
          CASE_OP_32_64(neg):
@@ -1105,6 +1118,9 @@ void tcg_optimize(TCGContext *s)
          CASE_OP_32_64(ext16s):
          CASE_OP_32_64(ext16u):
          CASE_OP_32_64(ctpop):
+        CASE_OP_32_64(bswap16):
+        CASE_OP_32_64(bswap32):
+        case INDEX_op_bswap64_i64:
          case INDEX_op_ext32s_i64:
          case INDEX_op_ext32u_i64:
          case INDEX_op_ext_i32_i64:
@@ -1190,6 +1206,22 @@ void tcg_optimize(TCGContext *s)
              }
              goto do_default;
  
+        CASE_OP_32_64(extract2):
+            if (arg_is_const(op->args[1]) && arg_is_const(op->args[2])) {
+                TCGArg v1 = arg_info(op->args[1])->val;
+                TCGArg v2 = arg_info(op->args[2])->val;
+
+                if (opc == INDEX_op_extract2_i64) {
+                    tmp = (v1 >> op->args[3]) | (v2 << (64 - op->args[3]));
+                } else {
+                    tmp = (v1 >> op->args[3]) | (v2 << (32 - op->args[3]));
+                    tmp = (int32_t)tmp;
+                }
+                tcg_opt_gen_movi(s, op, op->args[0], tmp);
+                break;
+            }
+            goto do_default;
+
          CASE_OP_32_64(setcond):
              tmp = do_constant_folding_cond(opc, op->args[1],
                                             op->args[2], op->args[3]);
@@ -1249,7 +1281,7 @@ void tcg_optimize(TCGContext *s)
                  uint64_t a = ((uint64_t)ah << 32) | al;
                  uint64_t b = ((uint64_t)bh << 32) | bl;
                  TCGArg rl, rh;
-                TCGOp *op2 = tcg_op_insert_before(s, op, INDEX_op_movi_i32, 2);
+                TCGOp *op2 = tcg_op_insert_before(s, op, INDEX_op_movi_i32);
  
                  if (opc == INDEX_op_add2_i32) {
                      a += b;
@@ -1271,7 +1303,7 @@ void tcg_optimize(TCGContext *s)
                  uint32_t b = arg_info(op->args[3])->val;
                  uint64_t r = (uint64_t)a * b;
                  TCGArg rl, rh;
-                TCGOp *op2 = tcg_op_insert_before(s, op, INDEX_op_movi_i32, 2);
+                TCGOp *op2 = tcg_op_insert_before(s, op, INDEX_op_movi_i32);
  
                  rl = op->args[0];
                  rh = op->args[1];