first step to fix precise eflags update in case of exception

[qemu.git] / op-i386.c
diff --git a/op-i386.c b/op-i386.c

index fe1f7eb9db28243974b017eeb455fd19b46e0979..a7e057bddc03a46100140599ffacb35571b241e2 100644 (file)
--- a/op-i386.c
+++ b/op-i386.c
@@ -19,97 +19,6 @@
   */
  #include "exec-i386.h"
  
-/* NOTE: data are not static to force relocation generation by GCC */
-
-uint8_t parity_table[256] = {
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    CC_P, 0, 0, CC_P, 0, CC_P, CC_P, 0,
-    0, CC_P, CC_P, 0, CC_P, 0, 0, CC_P,
-};
-
-/* modulo 17 table */
-const uint8_t rclw_table[32] = {
-    0, 1, 2, 3, 4, 5, 6, 7, 
-    8, 9,10,11,12,13,14,15,
-   16, 0, 1, 2, 3, 4, 5, 6,
-    7, 8, 9,10,11,12,13,14,
-};
-
-/* modulo 9 table */
-const uint8_t rclb_table[32] = {
-    0, 1, 2, 3, 4, 5, 6, 7, 
-    8, 0, 1, 2, 3, 4, 5, 6,
-    7, 8, 0, 1, 2, 3, 4, 5, 
-    6, 7, 8, 0, 1, 2, 3, 4,
-};
-
-#ifdef USE_X86LDOUBLE
-/* an array of Intel 80-bit FP constants, to be loaded via integer ops */
-typedef unsigned short f15ld[5];
-const f15ld f15rk[] =
-{
-/*0*/  {0x0000,0x0000,0x0000,0x0000,0x0000},
-/*1*/  {0x0000,0x0000,0x0000,0x8000,0x3fff},
-/*pi*/ {0xc235,0x2168,0xdaa2,0xc90f,0x4000},
-/*lg2*/        {0xf799,0xfbcf,0x9a84,0x9a20,0x3ffd},
-/*ln2*/        {0x79ac,0xd1cf,0x17f7,0xb172,0x3ffe},
-/*l2e*/        {0xf0bc,0x5c17,0x3b29,0xb8aa,0x3fff},
-/*l2t*/        {0x8afe,0xcd1b,0x784b,0xd49a,0x4000}
-};
-#else
-/* the same, 64-bit version */
-typedef unsigned short f15ld[4];
-const f15ld f15rk[] =
-{
-#ifndef WORDS_BIGENDIAN
-/*0*/  {0x0000,0x0000,0x0000,0x0000},
-/*1*/  {0x0000,0x0000,0x0000,0x3ff0},
-/*pi*/ {0x2d18,0x5444,0x21fb,0x4009},
-/*lg2*/        {0x79ff,0x509f,0x4413,0x3fd3},
-/*ln2*/        {0x39ef,0xfefa,0x2e42,0x3fe6},
-/*l2e*/        {0x82fe,0x652b,0x1547,0x3ff7},
-/*l2t*/        {0xa371,0x0979,0x934f,0x400a}
-#else
-/*0*/   {0x0000,0x0000,0x0000,0x0000},
-/*1*/   {0x3ff0,0x0000,0x0000,0x0000},
-/*pi*/  {0x4009,0x21fb,0x5444,0x2d18},
-/*lg2*/        {0x3fd3,0x4413,0x509f,0x79ff},
-/*ln2*/        {0x3fe6,0x2e42,0xfefa,0x39ef},
-/*l2e*/        {0x3ff7,0x1547,0x652b,0x82fe},
-/*l2t*/        {0x400a,0x934f,0x0979,0xa371}
-#endif
-};
-#endif
-    
  /* n must be a constant to be efficient */
  static inline int lshift(int x, int n)
  {
@@ -171,62 +80,34 @@ static inline int lshift(int x, int n)
  
  /* operations with flags */
  
-void OPPROTO op_addl_T0_T1_cc(void)
+/* update flags with T0 and T1 (add/sub case) */
+void OPPROTO op_update2_cc(void)
  {
-    CC_SRC = T0;
-    T0 += T1;
+    CC_SRC = T1;
      CC_DST = T0;
  }
  
-void OPPROTO op_orl_T0_T1_cc(void)
+/* update flags with T0 (logic operation case) */
+void OPPROTO op_update1_cc(void)
  {
-    T0 |= T1;
      CC_DST = T0;
  }
  
-void OPPROTO op_andl_T0_T1_cc(void)
+void OPPROTO op_update_neg_cc(void)
  {
-    T0 &= T1;
-    CC_DST = T0;
-}
-
-void OPPROTO op_subl_T0_T1_cc(void)
-{
-    CC_SRC = T0;
-    T0 -= T1;
-    CC_DST = T0;
-}
-
-void OPPROTO op_xorl_T0_T1_cc(void)
-{
-    T0 ^= T1;
+    CC_SRC = -T0;
      CC_DST = T0;
  }
  
  void OPPROTO op_cmpl_T0_T1_cc(void)
  {
-    CC_SRC = T0;
+    CC_SRC = T1;
      CC_DST = T0 - T1;
  }
  
-void OPPROTO op_negl_T0_cc(void)
-{
-    CC_SRC = 0;
-    T0 = -T0;
-    CC_DST = T0;
-}
-
-void OPPROTO op_incl_T0_cc(void)
-{
-    CC_SRC = cc_table[CC_OP].compute_c();
-    T0++;
-    CC_DST = T0;
-}
-
-void OPPROTO op_decl_T0_cc(void)
+void OPPROTO op_update_inc_cc(void)
  {
      CC_SRC = cc_table[CC_OP].compute_c();
-    T0--;
      CC_DST = T0;
  }
  
@@ -358,14 +239,17 @@ void OPPROTO op_imull_T0_T1(void)
  
  /* division, flags are undefined */
  /* XXX: add exceptions for overflow */
+
  void OPPROTO op_divb_AL_T0(void)
  {
      unsigned int num, den, q, r;
  
      num = (EAX & 0xffff);
      den = (T0 & 0xff);
-    if (den == 0)
+    if (den == 0) {
+        EIP = PARAM1;
          raise_exception(EXCP00_DIVZ);
+    }
      q = (num / den) & 0xff;
      r = (num % den) & 0xff;
      EAX = (EAX & 0xffff0000) | (r << 8) | q;
@@ -377,8 +261,10 @@ void OPPROTO op_idivb_AL_T0(void)
  
      num = (int16_t)EAX;
      den = (int8_t)T0;
-    if (den == 0)
+    if (den == 0) {
+        EIP = PARAM1;
          raise_exception(EXCP00_DIVZ);
+    }
      q = (num / den) & 0xff;
      r = (num % den) & 0xff;
      EAX = (EAX & 0xffff0000) | (r << 8) | q;
@@ -390,8 +276,10 @@ void OPPROTO op_divw_AX_T0(void)
  
      num = (EAX & 0xffff) | ((EDX & 0xffff) << 16);
      den = (T0 & 0xffff);
-    if (den == 0)
+    if (den == 0) {
+        EIP = PARAM1;
          raise_exception(EXCP00_DIVZ);
+    }
      q = (num / den) & 0xffff;
      r = (num % den) & 0xffff;
      EAX = (EAX & 0xffff0000) | q;
@@ -404,66 +292,24 @@ void OPPROTO op_idivw_AX_T0(void)
  
      num = (EAX & 0xffff) | ((EDX & 0xffff) << 16);
      den = (int16_t)T0;
-    if (den == 0)
+    if (den == 0) {
+        EIP = PARAM1;
          raise_exception(EXCP00_DIVZ);
+    }
      q = (num / den) & 0xffff;
      r = (num % den) & 0xffff;
      EAX = (EAX & 0xffff0000) | q;
      EDX = (EDX & 0xffff0000) | r;
  }
  
-#ifdef BUGGY_GCC_DIV64
-/* gcc 2.95.4 on PowerPC does not seem to like using __udivdi3, so we
-   call it from another function */
-uint32_t div64(uint32_t *q_ptr, uint64_t num, uint32_t den)
-{
-    *q_ptr = num / den;
-    return num % den;
-}
-
-int32_t idiv64(int32_t *q_ptr, int64_t num, int32_t den)
-{
-    *q_ptr = num / den;
-    return num % den;
-}
-#endif
-
  void OPPROTO op_divl_EAX_T0(void)
  {
-    unsigned int den, q, r;
-    uint64_t num;
-    
-    num = EAX | ((uint64_t)EDX << 32);
-    den = T0;
-    if (den == 0)
-        raise_exception(EXCP00_DIVZ);
-#ifdef BUGGY_GCC_DIV64
-    r = div64(&q, num, den);
-#else
-    q = (num / den);
-    r = (num % den);
-#endif
-    EAX = q;
-    EDX = r;
+    helper_divl_EAX_T0(PARAM1);
  }
  
  void OPPROTO op_idivl_EAX_T0(void)
  {
-    int den, q, r;
-    int64_t num;
-    
-    num = EAX | ((uint64_t)EDX << 32);
-    den = T0;
-    if (den == 0)
-        raise_exception(EXCP00_DIVZ);
-#ifdef BUGGY_GCC_DIV64
-    r = idiv64(&q, num, den);
-#else
-    q = (num / den);
-    r = (num % den);
-#endif
-    EAX = q;
-    EDX = r;
+    helper_idivl_EAX_T0(PARAM1);
  }
  
  /* constant load & misc op */
@@ -483,6 +329,11 @@ void OPPROTO op_andl_T0_ffff(void)
      T0 = T0 & 0xffff;
  }
  
+void OPPROTO op_andl_T0_im(void)
+{
+    T0 = T0 & PARAM1;
+}
+
  void OPPROTO op_movl_T0_T1(void)
  {
      T0 = T1;
@@ -614,18 +465,26 @@ void OPPROTO op_jmp_im(void)
      EIP = PARAM1;
  }
  
-void OPPROTO op_int_im(void)
+void OPPROTO op_hlt(void)
+{
+    env->exception_index = EXCP_HLT;
+    cpu_loop_exit();
+}
+
+void OPPROTO op_raise_interrupt(void)
  {
      int intno;
+    unsigned int next_eip;
      intno = PARAM1;
-    EIP = PARAM2;
-    raise_exception_err(EXCP0D_GPF, intno * 8 + 2);
+    next_eip = PARAM2;
+    raise_interrupt(intno, 1, 0, next_eip);
  }
  
-void OPPROTO op_int3(void)
+void OPPROTO op_raise_exception(void)
  {
-    EIP = PARAM1;
-    raise_exception(EXCP03_INT3);
+    int exception_index;
+    exception_index = PARAM1;
+    raise_exception(exception_index);
  }
  
  void OPPROTO op_into(void)
@@ -633,17 +492,11 @@ void OPPROTO op_into(void)
      int eflags;
      eflags = cc_table[CC_OP].compute_all();
      if (eflags & CC_O) {
-        raise_exception(EXCP04_INTO);
+        raise_interrupt(EXCP04_INTO, 1, 0, PARAM1);
      }
      FORCE_RET();
  }
  
-void OPPROTO op_gpf(void)
-{
-    EIP = PARAM1;
-    raise_exception(EXCP0D_GPF);
-}
-
  void OPPROTO op_cli(void)
  {
      env->eflags &= ~IF_MASK;
@@ -678,8 +531,10 @@ void OPPROTO op_boundw(void)
      low = ldsw((uint8_t *)A0);
      high = ldsw((uint8_t *)A0 + 2);
      v = (int16_t)T0;
-    if (v < low || v > high)
+    if (v < low || v > high) {
+        EIP = PARAM1;
          raise_exception(EXCP05_BOUND);
+    }
      FORCE_RET();
  }
  
@@ -689,31 +544,29 @@ void OPPROTO op_boundl(void)
      low = ldl((uint8_t *)A0);
      high = ldl((uint8_t *)A0 + 4);
      v = T0;
-    if (v < low || v > high)
+    if (v < low || v > high) {
+        EIP = PARAM1;
          raise_exception(EXCP05_BOUND);
+    }
      FORCE_RET();
  }
  
  void OPPROTO op_cmpxchg8b(void)
  {
-    uint64_t d;
-    int eflags;
+    helper_cmpxchg8b();
+}
  
-    eflags = cc_table[CC_OP].compute_all();
-    d = ldq((uint8_t *)A0);
-    if (d == (((uint64_t)EDX << 32) | EAX)) {
-        stq((uint8_t *)A0, ((uint64_t)ECX << 32) | EBX);
-        eflags |= CC_Z;
-    } else {
-        EDX = d >> 32;
-        EAX = d;
-        eflags &= ~CC_Z;
-    }
-    CC_SRC = eflags;
-    FORCE_RET();
+void OPPROTO op_jmp_tb_next(void)
+{
+    JUMP_TB(PARAM1, 0, PARAM2);
  }
  
-/* string ops */
+void OPPROTO op_movl_T0_0(void)
+{
+    T0 = 0;
+}
+
+/* multiple size ops */
  
  #define ldul ldl
  
@@ -795,7 +648,7 @@ void op_pushl_ss32_T0(void)
  {
      uint32_t offset;
      offset = ESP - 4;
-    stl(env->seg_cache[R_SS].base + offset, T0);
+    stl(env->segs[R_SS].base + offset, T0);
      /* modify ESP after to handle exceptions correctly */
      ESP = offset;
  }
@@ -804,7 +657,7 @@ void op_pushw_ss32_T0(void)
  {
      uint32_t offset;
      offset = ESP - 2;
-    stw(env->seg_cache[R_SS].base + offset, T0);
+    stw(env->segs[R_SS].base + offset, T0);
      /* modify ESP after to handle exceptions correctly */
      ESP = offset;
  }
@@ -813,7 +666,7 @@ void op_pushl_ss16_T0(void)
  {
      uint32_t offset;
      offset = (ESP - 4) & 0xffff;
-    stl(env->seg_cache[R_SS].base + offset, T0);
+    stl(env->segs[R_SS].base + offset, T0);
      /* modify ESP after to handle exceptions correctly */
      ESP = (ESP & ~0xffff) | offset;
  }
@@ -822,7 +675,7 @@ void op_pushw_ss16_T0(void)
  {
      uint32_t offset;
      offset = (ESP - 2) & 0xffff;
-    stw(env->seg_cache[R_SS].base + offset, T0);
+    stw(env->segs[R_SS].base + offset, T0);
      /* modify ESP after to handle exceptions correctly */
      ESP = (ESP & ~0xffff) | offset;
  }
@@ -840,22 +693,22 @@ void op_popw_T0(void)
  
  void op_popl_ss32_T0(void)
  {
-    T0 = ldl(env->seg_cache[R_SS].base + ESP);
+    T0 = ldl(env->segs[R_SS].base + ESP);
  }
  
  void op_popw_ss32_T0(void)
  {
-    T0 = lduw(env->seg_cache[R_SS].base + ESP);
+    T0 = lduw(env->segs[R_SS].base + ESP);
  }
  
  void op_popl_ss16_T0(void)
  {
-    T0 = ldl(env->seg_cache[R_SS].base + (ESP & 0xffff));
+    T0 = ldl(env->segs[R_SS].base + (ESP & 0xffff));
  }
  
  void op_popw_ss16_T0(void)
  {
-    T0 = lduw(env->seg_cache[R_SS].base + (ESP & 0xffff));
+    T0 = lduw(env->segs[R_SS].base + (ESP & 0xffff));
  }
  
  void op_addl_ESP_4(void)
@@ -888,62 +741,9 @@ void op_addw_ESP_im(void)
      ESP = (ESP & ~0xffff) | ((ESP + PARAM1) & 0xffff);
  }
  
-/* rdtsc */
-#ifndef __i386__
-uint64_t emu_time;
-#endif
-
  void OPPROTO op_rdtsc(void)
  {
-    uint64_t val;
-#ifdef __i386__
-    asm("rdtsc" : "=A" (val));
-#else
-    /* better than nothing: the time increases */
-    val = emu_time++;
-#endif
-    EAX = val;
-    EDX = val >> 32;
-}
-
-/* We simulate a pre-MMX pentium as in valgrind */
-#define CPUID_FP87 (1 << 0)
-#define CPUID_VME  (1 << 1)
-#define CPUID_DE   (1 << 2)
-#define CPUID_PSE  (1 << 3)
-#define CPUID_TSC  (1 << 4)
-#define CPUID_MSR  (1 << 5)
-#define CPUID_PAE  (1 << 6)
-#define CPUID_MCE  (1 << 7)
-#define CPUID_CX8  (1 << 8)
-#define CPUID_APIC (1 << 9)
-#define CPUID_SEP  (1 << 11) /* sysenter/sysexit */
-#define CPUID_MTRR (1 << 12)
-#define CPUID_PGE  (1 << 13)
-#define CPUID_MCA  (1 << 14)
-#define CPUID_CMOV (1 << 15)
-/* ... */
-#define CPUID_MMX  (1 << 23)
-#define CPUID_FXSR (1 << 24)
-#define CPUID_SSE  (1 << 25)
-#define CPUID_SSE2 (1 << 26)
-
-void helper_cpuid(void)
-{
-    if (EAX == 0) {
-        EAX = 1; /* max EAX index supported */
-        EBX = 0x756e6547;
-        ECX = 0x6c65746e;
-        EDX = 0x49656e69;
-    } else {
-        /* EAX = 1 info */
-        EAX = 0x52b;
-        EBX = 0;
-        ECX = 0;
-        EDX = CPUID_FP87 | CPUID_DE | CPUID_PSE |
-            CPUID_TSC | CPUID_MSR | CPUID_MCE |
-            CPUID_CX8;
-    }
+    helper_rdtsc();
  }
  
  void OPPROTO op_cpuid(void)
@@ -1083,52 +883,27 @@ void OPPROTO op_das(void)
  
  /* segment handling */
  
-/* XXX: use static VM86 information */
-void load_seg(int seg_reg, int selector)
+void OPPROTO op_movl_seg_T0(void)
  {
-    SegmentCache *sc;
-    SegmentDescriptorTable *dt;
-    int index;
-    uint32_t e1, e2;
-    uint8_t *ptr;
-
-    sc = &env->seg_cache[seg_reg];
-    if (env->eflags & VM_MASK) {
-        sc->base = (void *)(selector << 4);
-        sc->limit = 0xffff;
-        sc->seg_32bit = 0;
-    } else {
-        if (selector & 0x4)
-            dt = &env->ldt;
-        else
-            dt = &env->gdt;
-        index = selector & ~7;
-        if ((index + 7) > dt->limit)
-            raise_exception_err(EXCP0D_GPF, selector);
-        ptr = dt->base + index;
-        e1 = ldl(ptr);
-        e2 = ldl(ptr + 4);
-        sc->base = (void *)((e1 >> 16) | ((e2 & 0xff) << 16) | (e2 & 0xff000000));
-        sc->limit = (e1 & 0xffff) | (e2 & 0x000f0000);
-        if (e2 & (1 << 23))
-            sc->limit = (sc->limit << 12) | 0xfff;
-        sc->seg_32bit = (e2 >> 22) & 1;
-#if 0
-        fprintf(logfile, "load_seg: sel=0x%04x base=0x%08lx limit=0x%08lx seg_32bit=%d\n", 
-                selector, (unsigned long)sc->base, sc->limit, sc->seg_32bit);
-#endif
-    }
-    env->segs[seg_reg] = selector;
+    load_seg(PARAM1, T0 & 0xffff, PARAM2);
  }
  
-void OPPROTO op_movl_seg_T0(void)
+/* faster VM86 version */
+void OPPROTO op_movl_seg_T0_vm(void)
  {
-    load_seg(PARAM1, T0 & 0xffff);
+    int selector;
+    SegmentCache *sc;
+    
+    selector = T0 & 0xffff;
+    /* env->segs[] access */
+    sc = (SegmentCache *)((char *)env + PARAM1);
+    sc->selector = selector;
+    sc->base = (void *)(selector << 4);
  }
  
  void OPPROTO op_movl_T0_seg(void)
  {
-    T0 = env->segs[PARAM1];
+    T0 = env->segs[PARAM1].selector;
  }
  
  void OPPROTO op_movl_A0_seg(void)
@@ -1141,92 +916,92 @@ void OPPROTO op_addl_A0_seg(void)
      A0 += *(unsigned long *)((char *)env + PARAM1);
  }
  
-/* flags handling */
+void OPPROTO op_lsl(void)
+{
+    helper_lsl();
+}
  
-/* slow jumps cases (compute x86 flags) */
-void OPPROTO op_jo_cc(void)
+void OPPROTO op_lar(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (eflags & CC_O)
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_lar();
  }
  
-void OPPROTO op_jb_cc(void)
+/* T0: segment, T1:eip */
+void OPPROTO op_ljmp_T0_T1(void)
  {
-    if (cc_table[CC_OP].compute_c())
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    jmp_seg(T0 & 0xffff, T1);
  }
  
-void OPPROTO op_jz_cc(void)
+void OPPROTO op_iret_protected(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (eflags & CC_Z)
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_iret_protected(PARAM1);
  }
  
-void OPPROTO op_jbe_cc(void)
+void OPPROTO op_lldt_T0(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (eflags & (CC_Z | CC_C))
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_lldt_T0();
  }
  
-void OPPROTO op_js_cc(void)
+void OPPROTO op_ltr_T0(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (eflags & CC_S)
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_ltr_T0();
  }
  
-void OPPROTO op_jp_cc(void)
+/* CR registers access */
+void OPPROTO op_movl_crN_T0(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (eflags & CC_P)
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_movl_crN_T0(PARAM1);
  }
  
-void OPPROTO op_jl_cc(void)
+/* DR registers access */
+void OPPROTO op_movl_drN_T0(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if ((eflags ^ (eflags >> 4)) & 0x80)
-        EIP = PARAM1;
-    else
-        EIP = PARAM2;
-    FORCE_RET();
+    helper_movl_drN_T0(PARAM1);
  }
  
-void OPPROTO op_jle_cc(void)
+void OPPROTO op_lmsw_T0(void)
  {
-    int eflags;
-    eflags = cc_table[CC_OP].compute_all();
-    if (((eflags ^ (eflags >> 4)) & 0x80) || (eflags & CC_Z))
-        EIP = PARAM1;
+    /* only 4 lower bits of CR0 are modified */
+    T0 = (env->cr[0] & ~0xf) | (T0 & 0xf);
+    helper_movl_crN_T0(0);
+}
+
+void OPPROTO op_invlpg_A0(void)
+{
+    helper_invlpg(A0);
+}
+
+void OPPROTO op_movl_T0_env(void)
+{
+    T0 = *(uint32_t *)((char *)env + PARAM1);
+}
+
+void OPPROTO op_movl_env_T0(void)
+{
+    *(uint32_t *)((char *)env + PARAM1) = T0;
+}
+
+void OPPROTO op_movl_env_T1(void)
+{
+    *(uint32_t *)((char *)env + PARAM1) = T1;
+}
+
+void OPPROTO op_clts(void)
+{
+    env->cr[0] &= ~CR0_TS_MASK;
+}
+
+/* flags handling */
+
+/* slow jumps cases : in order to avoid calling a function with a
+   pointer (which can generate a stack frame on PowerPC), we use
+   op_setcc to set T0 and then call op_jcc. */
+void OPPROTO op_jcc(void)
+{
+    if (T0)
+        JUMP_TB(PARAM1, 0, PARAM2);
      else
-        EIP = PARAM2;
+        JUMP_TB(PARAM1, 1, PARAM3);
      FORCE_RET();
  }
  
@@ -1295,8 +1070,7 @@ void OPPROTO op_set_cc_op(void)
      CC_OP = PARAM1;
  }
  
-#define FL_UPDATE_MASK32 (TF_MASK | AC_MASK | ID_MASK)
-#define FL_UPDATE_MASK16 (TF_MASK)
+#define FL_UPDATE_MASK16 (FL_UPDATE_MASK32 & 0xffff)
  
  void OPPROTO op_movl_eflags_T0(void)
  {
@@ -1305,7 +1079,8 @@ void OPPROTO op_movl_eflags_T0(void)
      CC_SRC = eflags & (CC_O | CC_S | CC_Z | CC_A | CC_P | CC_C);
      DF = 1 - (2 * ((eflags >> 10) & 1));
      /* we also update some system flags as in user mode */
-    env->eflags = (env->eflags & ~FL_UPDATE_MASK32) | (eflags & FL_UPDATE_MASK32);
+    env->eflags = (env->eflags & ~FL_UPDATE_MASK32) | 
+        (eflags & FL_UPDATE_MASK32);
  }
  
  void OPPROTO op_movw_eflags_T0(void)
@@ -1315,7 +1090,18 @@ void OPPROTO op_movw_eflags_T0(void)
      CC_SRC = eflags & (CC_O | CC_S | CC_Z | CC_A | CC_P | CC_C);
      DF = 1 - (2 * ((eflags >> 10) & 1));
      /* we also update some system flags as in user mode */
-    env->eflags = (env->eflags & ~FL_UPDATE_MASK16) | (eflags & FL_UPDATE_MASK16);
+    env->eflags = (env->eflags & ~FL_UPDATE_MASK16) | 
+        (eflags & FL_UPDATE_MASK16);
+}
+
+void OPPROTO op_movl_eflags_T0_cpl0(void)
+{
+    load_eflags(T0, FL_UPDATE_CPL0_MASK);
+}
+
+void OPPROTO op_movw_eflags_T0_cpl0(void)
+{
+    load_eflags(T0, FL_UPDATE_CPL0_MASK & 0xffff);
  }
  
  #if 0
@@ -1495,50 +1281,19 @@ CCTable cc_table[CC_OP_NB] = {
      [CC_OP_DECW] = { compute_all_decw, compute_c_incl },
      [CC_OP_DECL] = { compute_all_decl, compute_c_incl },
      
-    [CC_OP_SHLB] = { compute_all_shlb, compute_c_shll },
-    [CC_OP_SHLW] = { compute_all_shlw, compute_c_shll },
+    [CC_OP_SHLB] = { compute_all_shlb, compute_c_shlb },
+    [CC_OP_SHLW] = { compute_all_shlw, compute_c_shlw },
      [CC_OP_SHLL] = { compute_all_shll, compute_c_shll },
  
-    [CC_OP_SARB] = { compute_all_sarb, compute_c_shll },
-    [CC_OP_SARW] = { compute_all_sarw, compute_c_shll },
-    [CC_OP_SARL] = { compute_all_sarl, compute_c_shll },
+    [CC_OP_SARB] = { compute_all_sarb, compute_c_sarl },
+    [CC_OP_SARW] = { compute_all_sarw, compute_c_sarl },
+    [CC_OP_SARL] = { compute_all_sarl, compute_c_sarl },
  };
  
  /* floating point support. Some of the code for complicated x87
     functions comes from the LGPL'ed x86 emulator found in the Willows
     TWIN windows emulator. */
  
-#ifdef USE_X86LDOUBLE
-/* use long double functions */
-#define lrint lrintl
-#define llrint llrintl
-#define fabs fabsl
-#define sin sinl
-#define cos cosl
-#define sqrt sqrtl
-#define pow powl
-#define log logl
-#define tan tanl
-#define atan2 atan2l
-#define floor floorl
-#define ceil ceill
-#define rint rintl
-#endif
-
-extern int lrint(CPU86_LDouble x);
-extern int64_t llrint(CPU86_LDouble x);
-extern CPU86_LDouble fabs(CPU86_LDouble x);
-extern CPU86_LDouble sin(CPU86_LDouble x);
-extern CPU86_LDouble cos(CPU86_LDouble x);
-extern CPU86_LDouble sqrt(CPU86_LDouble x);
-extern CPU86_LDouble pow(CPU86_LDouble, CPU86_LDouble);
-extern CPU86_LDouble log(CPU86_LDouble x);
-extern CPU86_LDouble tan(CPU86_LDouble x);
-extern CPU86_LDouble atan2(CPU86_LDouble, CPU86_LDouble);
-extern CPU86_LDouble floor(CPU86_LDouble x);
-extern CPU86_LDouble ceil(CPU86_LDouble x);
-extern CPU86_LDouble rint(CPU86_LDouble x);
-
  #if defined(__powerpc__)
  extern CPU86_LDouble copysign(CPU86_LDouble, CPU86_LDouble);
  
@@ -1559,60 +1314,6 @@ double qemu_rint(double x)
  #define rint qemu_rint
  #endif
  
-#define RC_MASK         0xc00
-#define RC_NEAR                0x000
-#define RC_DOWN                0x400
-#define RC_UP          0x800
-#define RC_CHOP                0xc00
-
-#define MAXTAN 9223372036854775808.0
-
-#ifdef USE_X86LDOUBLE
-
-/* only for x86 */
-typedef union {
-    long double d;
-    struct {
-        unsigned long long lower;
-        unsigned short upper;
-    } l;
-} CPU86_LDoubleU;
-
-/* the following deal with x86 long double-precision numbers */
-#define MAXEXPD 0x7fff
-#define EXPBIAS 16383
-#define EXPD(fp)       (fp.l.upper & 0x7fff)
-#define SIGND(fp)      ((fp.l.upper) & 0x8000)
-#define MANTD(fp)       (fp.l.lower)
-#define BIASEXPONENT(fp) fp.l.upper = (fp.l.upper & ~(0x7fff)) | EXPBIAS
-
-#else
-
-typedef union {
-    double d;
-#ifndef WORDS_BIGENDIAN
-    struct {
-        unsigned long lower;
-        long upper;
-    } l;
-#else
-    struct {
-        long upper;
-        unsigned long lower;
-    } l;
-#endif
-    long long ll;
-} CPU86_LDoubleU;
-
-/* the following deal with IEEE double-precision numbers */
-#define MAXEXPD 0x7ff
-#define EXPBIAS 1023
-#define EXPD(fp)       (((fp.l.upper) >> 20) & 0x7FF)
-#define SIGND(fp)      ((fp.l.upper) & 0x80000000)
-#define MANTD(fp)      (fp.ll & ((1LL << 52) - 1))
-#define BIASEXPONENT(fp) fp.l.upper = (fp.l.upper & ~(0x7ff << 20)) | (EXPBIAS << 20)
-#endif
-
  /* fp load FT0 */
  
  void OPPROTO op_flds_FT0_A0(void)
@@ -1729,19 +1430,6 @@ void OPPROTO op_fldt_ST0_A0(void)
      ST0 = *(long double *)A0;
  }
  #else
-void helper_fldt_ST0_A0(void)
-{
-    CPU86_LDoubleU temp;
-    int upper, e;
-    /* mantissa */
-    upper = lduw((uint8_t *)A0 + 8);
-    /* XXX: handle overflow ? */
-    e = (upper & 0x7fff) - 16383 + EXPBIAS; /* exponent */
-    e |= (upper >> 4) & 0x800; /* sign */
-    temp.ll = ((ldq((void *)A0) >> 11) & ((1LL << 52) - 1)) | ((uint64_t)e << 52);
-    ST0 = temp.d;
-}
-
  void OPPROTO op_fldt_ST0_A0(void)
  {
      helper_fldt_ST0_A0();
@@ -1820,7 +1508,7 @@ void OPPROTO op_fildll_ST0_A0(void)
  void OPPROTO op_fsts_ST0_A0(void)
  {
  #ifdef USE_FP_CONVERT
-    FP_CONVERT.d = ST0;
+    FP_CONVERT.f = (float)ST0;
      stfl((void *)A0, FP_CONVERT.f);
  #else
      stfl((void *)A0, (float)ST0);
@@ -1838,19 +1526,6 @@ void OPPROTO op_fstt_ST0_A0(void)
      *(long double *)A0 = ST0;
  }
  #else
-void helper_fstt_ST0_A0(void)
-{
-    CPU86_LDoubleU temp;
-    int e;
-    temp.d = ST0;
-    /* mantissa */
-    stq((void *)A0, (MANTD(temp) << 11) | (1LL << 63));
-    /* exponent + sign */
-    e = EXPD(temp) - EXPBIAS + 16383;
-    e |= SIGND(temp) >> 16;
-    stw((uint8_t *)A0 + 8, e);
-}
-
  void OPPROTO op_fstt_ST0_A0(void)
  {
      helper_fstt_ST0_A0();
@@ -1868,6 +1543,8 @@ void OPPROTO op_fist_ST0_A0(void)
  
      d = ST0;
      val = lrint(d);
+    if (val != (int16_t)val)
+        val = -32768;
      stw((void *)A0, val);
  }
  
@@ -1899,98 +1576,11 @@ void OPPROTO op_fistll_ST0_A0(void)
      stq((void *)A0, val);
  }
  
-/* BCD ops */
-
-#define MUL10(iv) ( iv + iv + (iv << 3) )
-
-void helper_fbld_ST0_A0(void)
-{
-    uint8_t *seg;
-    CPU86_LDouble fpsrcop;
-    int m32i;
-    unsigned int v;
-
-    /* in this code, seg/m32i will be used as temporary ptr/int */
-    seg = (uint8_t *)A0 + 8;
-    v = ldub(seg--);
-    /* XXX: raise exception */
-    if (v != 0)
-        return;
-    v = ldub(seg--);
-    /* XXX: raise exception */
-    if ((v & 0xf0) != 0)
-        return;
-    m32i = v;  /* <-- d14 */
-    v = ldub(seg--);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d13 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d12 */
-    v = ldub(seg--);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d11 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d10 */
-    v = ldub(seg--);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d9 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d8 */
-    fpsrcop = ((CPU86_LDouble)m32i) * 100000000.0;
-
-    v = ldub(seg--);
-    m32i = (v >> 4);  /* <-- d7 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d6 */
-    v = ldub(seg--);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d5 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d4 */
-    v = ldub(seg--);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d3 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d2 */
-    v = ldub(seg);
-    m32i = MUL10(m32i) + (v >> 4);  /* <-- val * 10 + d1 */
-    m32i = MUL10(m32i) + (v & 0xf); /* <-- val * 10 + d0 */
-    fpsrcop += ((CPU86_LDouble)m32i);
-    if ( ldub(seg+9) & 0x80 )
-        fpsrcop = -fpsrcop;
-    ST0 = fpsrcop;
-}
-
  void OPPROTO op_fbld_ST0_A0(void)
  {
      helper_fbld_ST0_A0();
  }
  
-void helper_fbst_ST0_A0(void)
-{
-    CPU86_LDouble fptemp;
-    CPU86_LDouble fpsrcop;
-    int v;
-    uint8_t *mem_ref, *mem_end;
-
-    fpsrcop = rint(ST0);
-    mem_ref = (uint8_t *)A0;
-    mem_end = mem_ref + 8;
-    if ( fpsrcop < 0.0 ) {
-        stw(mem_end, 0x8000);
-        fpsrcop = -fpsrcop;
-    } else {
-        stw(mem_end, 0x0000);
-    }
-    while (mem_ref < mem_end) {
-        if (fpsrcop == 0.0)
-            break;
-        fptemp = floor(fpsrcop/10.0);
-        v = ((int)(fpsrcop - fptemp*10.0));
-        if  (fptemp == 0.0)  { 
-            stb(mem_ref++, v); 
-            break; 
-        }
-        fpsrcop = fptemp;
-        fptemp = floor(fpsrcop/10.0);
-        v |= (((int)(fpsrcop - fptemp*10.0)) << 4);
-        stb(mem_ref++, v);
-        fpsrcop = fptemp;
-    }
-    while (mem_ref < mem_end) {
-        stb(mem_ref++, 0);
-    }
-}
-
  void OPPROTO op_fbst_ST0_A0(void)
  {
      helper_fbst_ST0_A0();
@@ -1998,18 +1588,6 @@ void OPPROTO op_fbst_ST0_A0(void)
  
  /* FPU move */
  
-static inline void fpush(void)
-{
-    env->fpstt = (env->fpstt - 1) & 7;
-    env->fptags[env->fpstt] = 0; /* validate stack entry */
-}
-
-static inline void fpop(void)
-{
-    env->fptags[env->fpstt] = 1; /* invvalidate stack entry */
-    env->fpstt = (env->fpstt + 1) & 7;
-}
-
  void OPPROTO op_fpush(void)
  {
      fpush();
@@ -2084,6 +1662,34 @@ void OPPROTO op_fucom_ST0_FT0(void)
      FORCE_RET();
  }
  
+/* XXX: handle nans */
+void OPPROTO op_fcomi_ST0_FT0(void)
+{
+    int eflags;
+    eflags = cc_table[CC_OP].compute_all();
+    eflags &= ~(CC_Z | CC_P | CC_C);
+    if (ST0 < FT0)
+        eflags |= CC_C;
+    else if (ST0 == FT0)
+        eflags |= CC_Z;
+    CC_SRC = eflags;
+    FORCE_RET();
+}
+
+/* XXX: handle nans */
+void OPPROTO op_fucomi_ST0_FT0(void)
+{
+    int eflags;
+    eflags = cc_table[CC_OP].compute_all();
+    eflags &= ~(CC_Z | CC_P | CC_C);
+    if (ST0 < FT0)
+        eflags |= CC_C;
+    else if (ST0 == FT0)
+        eflags |= CC_Z;
+    CC_SRC = eflags;
+    FORCE_RET();
+}
+
  void OPPROTO op_fadd_ST0_FT0(void)
  {
      ST0 += FT0;
@@ -2161,33 +1767,6 @@ void OPPROTO op_fabs_ST0(void)
      ST0 = fabs(ST0);
  }
  
-void helper_fxam_ST0(void)
-{
-    CPU86_LDoubleU temp;
-    int expdif;
-
-    temp.d = ST0;
-
-    env->fpus &= (~0x4700);  /* (C3,C2,C1,C0) <-- 0000 */
-    if (SIGND(temp))
-        env->fpus |= 0x200; /* C1 <-- 1 */
-
-    expdif = EXPD(temp);
-    if (expdif == MAXEXPD) {
-        if (MANTD(temp) == 0)
-            env->fpus |=  0x500 /*Infinity*/;
-        else
-            env->fpus |=  0x100 /*NaN*/;
-    } else if (expdif == 0) {
-        if (MANTD(temp) == 0)
-            env->fpus |=  0x4000 /*Zero*/;
-        else
-            env->fpus |= 0x4400 /*Denormal*/;
-    } else {
-        env->fpus |= 0x400;
-    }
-}
-
  void OPPROTO op_fxam_ST0(void)
  {
      helper_fxam_ST0();
@@ -2195,253 +1774,42 @@ void OPPROTO op_fxam_ST0(void)
  
  void OPPROTO op_fld1_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[1];
+    ST0 = f15rk[1];
  }
  
  void OPPROTO op_fldl2t_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[6];
+    ST0 = f15rk[6];
  }
  
  void OPPROTO op_fldl2e_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[5];
+    ST0 = f15rk[5];
  }
  
  void OPPROTO op_fldpi_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[2];
+    ST0 = f15rk[2];
  }
  
  void OPPROTO op_fldlg2_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[3];
+    ST0 = f15rk[3];
  }
  
  void OPPROTO op_fldln2_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[4];
+    ST0 = f15rk[4];
  }
  
  void OPPROTO op_fldz_ST0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[0];
+    ST0 = f15rk[0];
  }
  
  void OPPROTO op_fldz_FT0(void)
  {
-    ST0 = *(CPU86_LDouble *)&f15rk[0];
-}
-
-void helper_f2xm1(void)
-{
-    ST0 = pow(2.0,ST0) - 1.0;
-}
-
-void helper_fyl2x(void)
-{
-    CPU86_LDouble fptemp;
-    
-    fptemp = ST0;
-    if (fptemp>0.0){
-        fptemp = log(fptemp)/log(2.0);  /* log2(ST) */
-        ST1 *= fptemp;
-        fpop();
-    } else { 
-        env->fpus &= (~0x4700);
-        env->fpus |= 0x400;
-    }
-}
-
-void helper_fptan(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if((fptemp > MAXTAN)||(fptemp < -MAXTAN)) {
-        env->fpus |= 0x400;
-    } else {
-        ST0 = tan(fptemp);
-        fpush();
-        ST0 = 1.0;
-        env->fpus &= (~0x400);  /* C2 <-- 0 */
-        /* the above code is for  |arg| < 2**52 only */
-    }
-}
-
-void helper_fpatan(void)
-{
-    CPU86_LDouble fptemp, fpsrcop;
-
-    fpsrcop = ST1;
-    fptemp = ST0;
-    ST1 = atan2(fpsrcop,fptemp);
-    fpop();
-}
-
-void helper_fxtract(void)
-{
-    CPU86_LDoubleU temp;
-    unsigned int expdif;
-
-    temp.d = ST0;
-    expdif = EXPD(temp) - EXPBIAS;
-    /*DP exponent bias*/
-    ST0 = expdif;
-    fpush();
-    BIASEXPONENT(temp);
-    ST0 = temp.d;
-}
-
-void helper_fprem1(void)
-{
-    CPU86_LDouble dblq, fpsrcop, fptemp;
-    CPU86_LDoubleU fpsrcop1, fptemp1;
-    int expdif;
-    int q;
-
-    fpsrcop = ST0;
-    fptemp = ST1;
-    fpsrcop1.d = fpsrcop;
-    fptemp1.d = fptemp;
-    expdif = EXPD(fpsrcop1) - EXPD(fptemp1);
-    if (expdif < 53) {
-        dblq = fpsrcop / fptemp;
-        dblq = (dblq < 0.0)? ceil(dblq): floor(dblq);
-        ST0 = fpsrcop - fptemp*dblq;
-        q = (int)dblq; /* cutting off top bits is assumed here */
-        env->fpus &= (~0x4700); /* (C3,C2,C1,C0) <-- 0000 */
-                               /* (C0,C1,C3) <-- (q2,q1,q0) */
-        env->fpus |= (q&0x4) << 6; /* (C0) <-- q2 */
-        env->fpus |= (q&0x2) << 8; /* (C1) <-- q1 */
-        env->fpus |= (q&0x1) << 14; /* (C3) <-- q0 */
-    } else {
-        env->fpus |= 0x400;  /* C2 <-- 1 */
-        fptemp = pow(2.0, expdif-50);
-        fpsrcop = (ST0 / ST1) / fptemp;
-        /* fpsrcop = integer obtained by rounding to the nearest */
-        fpsrcop = (fpsrcop-floor(fpsrcop) < ceil(fpsrcop)-fpsrcop)?
-            floor(fpsrcop): ceil(fpsrcop);
-        ST0 -= (ST1 * fpsrcop * fptemp);
-    }
-}
-
-void helper_fprem(void)
-{
-    CPU86_LDouble dblq, fpsrcop, fptemp;
-    CPU86_LDoubleU fpsrcop1, fptemp1;
-    int expdif;
-    int q;
-    
-    fpsrcop = ST0;
-    fptemp = ST1;
-    fpsrcop1.d = fpsrcop;
-    fptemp1.d = fptemp;
-    expdif = EXPD(fpsrcop1) - EXPD(fptemp1);
-    if ( expdif < 53 ) {
-        dblq = fpsrcop / fptemp;
-        dblq = (dblq < 0.0)? ceil(dblq): floor(dblq);
-        ST0 = fpsrcop - fptemp*dblq;
-        q = (int)dblq; /* cutting off top bits is assumed here */
-        env->fpus &= (~0x4700); /* (C3,C2,C1,C0) <-- 0000 */
-                               /* (C0,C1,C3) <-- (q2,q1,q0) */
-        env->fpus |= (q&0x4) << 6; /* (C0) <-- q2 */
-        env->fpus |= (q&0x2) << 8; /* (C1) <-- q1 */
-        env->fpus |= (q&0x1) << 14; /* (C3) <-- q0 */
-    } else {
-        env->fpus |= 0x400;  /* C2 <-- 1 */
-        fptemp = pow(2.0, expdif-50);
-        fpsrcop = (ST0 / ST1) / fptemp;
-        /* fpsrcop = integer obtained by chopping */
-        fpsrcop = (fpsrcop < 0.0)?
-            -(floor(fabs(fpsrcop))): floor(fpsrcop);
-        ST0 -= (ST1 * fpsrcop * fptemp);
-    }
-}
-
-void helper_fyl2xp1(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if ((fptemp+1.0)>0.0) {
-        fptemp = log(fptemp+1.0) / log(2.0); /* log2(ST+1.0) */
-        ST1 *= fptemp;
-        fpop();
-    } else { 
-        env->fpus &= (~0x4700);
-        env->fpus |= 0x400;
-    }
-}
-
-void helper_fsqrt(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if (fptemp<0.0) { 
-        env->fpus &= (~0x4700);  /* (C3,C2,C1,C0) <-- 0000 */
-        env->fpus |= 0x400;
-    }
-    ST0 = sqrt(fptemp);
-}
-
-void helper_fsincos(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if ((fptemp > MAXTAN)||(fptemp < -MAXTAN)) {
-        env->fpus |= 0x400;
-    } else {
-        ST0 = sin(fptemp);
-        fpush();
-        ST0 = cos(fptemp);
-        env->fpus &= (~0x400);  /* C2 <-- 0 */
-        /* the above code is for  |arg| < 2**63 only */
-    }
-}
-
-void helper_frndint(void)
-{
-    ST0 = rint(ST0);
-}
-
-void helper_fscale(void)
-{
-    CPU86_LDouble fpsrcop, fptemp;
-
-    fpsrcop = 2.0;
-    fptemp = pow(fpsrcop,ST1);
-    ST0 *= fptemp;
-}
-
-void helper_fsin(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if ((fptemp > MAXTAN)||(fptemp < -MAXTAN)) {
-        env->fpus |= 0x400;
-    } else {
-        ST0 = sin(fptemp);
-        env->fpus &= (~0x400);  /* C2 <-- 0 */
-        /* the above code is for  |arg| < 2**53 only */
-    }
-}
-
-void helper_fcos(void)
-{
-    CPU86_LDouble fptemp;
-
-    fptemp = ST0;
-    if((fptemp > MAXTAN)||(fptemp < -MAXTAN)) {
-        env->fpus |= 0x400;
-    } else {
-        ST0 = cos(fptemp);
-        env->fpus &= (~0x400);  /* C2 <-- 0 */
-        /* the above code is for  |arg5 < 2**63 only */
-    }
+    ST0 = f15rk[0];
  }
  
  /* associated heplers to reduce generated code length and to simplify
@@ -2580,6 +1948,26 @@ void OPPROTO op_fninit(void)
      env->fptags[7] = 1;
  }
  
+void OPPROTO op_fnstenv_A0(void)
+{
+    helper_fstenv((uint8_t *)A0, PARAM1);
+}
+
+void OPPROTO op_fldenv_A0(void)
+{
+    helper_fldenv((uint8_t *)A0, PARAM1);
+}
+
+void OPPROTO op_fnsave_A0(void)
+{
+    helper_fsave((uint8_t *)A0, PARAM1);
+}
+
+void OPPROTO op_frstor_A0(void)
+{
+    helper_frstor((uint8_t *)A0, PARAM1);
+}
+
  /* threading support */
  void OPPROTO op_lock(void)
  {
@@ -2590,3 +1978,4 @@ void OPPROTO op_unlock(void)
  {
      cpu_unlock();
  }
+