]> git.proxmox.com Git - mirror_edk2.git/commitdiff
MdePkg BaseMemoryLibOptDxe: Convert Ia32/CopyMem.asm to NASM
authorJordan Justen <jordan.l.justen@intel.com>
Tue, 31 May 2016 01:52:07 +0000 (18:52 -0700)
committerLiming Gao <liming.gao@intel.com>
Tue, 28 Jun 2016 01:50:48 +0000 (09:50 +0800)
The BaseTools/Scripts/ConvertMasmToNasm.py script was used to convert
Ia32/CopyMem.asm to Ia32/CopyMem.nasm

Contributed-under: TianoCore Contribution Agreement 1.0
Signed-off-by: Jordan Justen <jordan.l.justen@intel.com>
MdePkg/Library/BaseMemoryLibOptDxe/BaseMemoryLibOptDxe.inf
MdePkg/Library/BaseMemoryLibOptDxe/Ia32/CopyMem.nasm [new file with mode: 0644]

index 2ebbbfdb842485b30f61884a9f9befaefd2b92b0..57ab61e71013e4d70c60fdbbd0c4320abd58587f 100644 (file)
@@ -54,6 +54,7 @@
   Ia32/SetMem16.S\r
   Ia32/SetMem.nasm\r
   Ia32/SetMem.S\r
+  Ia32/CopyMem.nasm\r
   Ia32/CopyMem.S\r
   Ia32/ScanMem64.nasm\r
   Ia32/ScanMem64.asm\r
@@ -75,6 +76,7 @@
   Ia32/SetMem16.asm\r
   Ia32/SetMem.nasm\r
   Ia32/SetMem.asm\r
+  Ia32/CopyMem.nasm\r
   Ia32/CopyMem.asm\r
   ScanMem64Wrapper.c\r
   ScanMem32Wrapper.c\r
diff --git a/MdePkg/Library/BaseMemoryLibOptDxe/Ia32/CopyMem.nasm b/MdePkg/Library/BaseMemoryLibOptDxe/Ia32/CopyMem.nasm
new file mode 100644 (file)
index 0000000..967b636
--- /dev/null
@@ -0,0 +1,84 @@
+;------------------------------------------------------------------------------\r
+;\r
+; Copyright (c) 2006, Intel Corporation. All rights reserved.<BR>\r
+; This program and the accompanying materials\r
+; are licensed and made available under the terms and conditions of the BSD License\r
+; which accompanies this distribution.  The full text of the license may be found at\r
+; http://opensource.org/licenses/bsd-license.php.\r
+;\r
+; THE PROGRAM IS DISTRIBUTED UNDER THE BSD LICENSE ON AN "AS IS" BASIS,\r
+; WITHOUT WARRANTIES OR REPRESENTATIONS OF ANY KIND, EITHER EXPRESS OR IMPLIED.\r
+;\r
+; Module Name:\r
+;\r
+;   CopyMem.nasm\r
+;\r
+; Abstract:\r
+;\r
+;   CopyMem function\r
+;\r
+; Notes:\r
+;\r
+;------------------------------------------------------------------------------\r
+\r
+    SECTION .text\r
+\r
+;------------------------------------------------------------------------------\r
+;  VOID *\r
+;  InternalMemCopyMem (\r
+;    IN VOID   *Destination,\r
+;    IN VOID   *Source,\r
+;    IN UINTN  Count\r
+;    );\r
+;------------------------------------------------------------------------------\r
+global ASM_PFX(InternalMemCopyMem)\r
+ASM_PFX(InternalMemCopyMem):\r
+    push    esi\r
+    push    edi\r
+    mov     esi, [esp + 16]             ; esi <- Source\r
+    mov     edi, [esp + 12]             ; edi <- Destination\r
+    mov     edx, [esp + 20]             ; edx <- Count\r
+    lea     eax, [esi + edx - 1]        ; eax <- End of Source\r
+    cmp     esi, edi\r
+    jae     .0\r
+    cmp     eax, edi                    ; Overlapped?\r
+    jae     @CopyBackward               ; Copy backward if overlapped\r
+.0:\r
+    xor     ecx, ecx\r
+    sub     ecx, edi\r
+    and     ecx, 15                     ; ecx + edi aligns on 16-byte boundary\r
+    jz      .1\r
+    cmp     ecx, edx\r
+    cmova   ecx, edx\r
+    sub     edx, ecx                    ; edx <- remaining bytes to copy\r
+    rep     movsb\r
+.1:\r
+    mov     ecx, edx\r
+    and     edx, 15\r
+    shr     ecx, 4                      ; ecx <- # of DQwords to copy\r
+    jz      @CopyBytes\r
+    add     esp, -16\r
+    movdqu  [esp], xmm0                 ; save xmm0\r
+.2:\r
+    movdqu  xmm0, [esi]                 ; esi may not be 16-bytes aligned\r
+    movntdq [edi], xmm0                 ; edi should be 16-bytes aligned\r
+    add     esi, 16\r
+    add     edi, 16\r
+    loop    .2\r
+    mfence\r
+    movdqu  xmm0, [esp]                 ; restore xmm0\r
+    add     esp, 16                     ; stack cleanup\r
+    jmp     @CopyBytes\r
+@CopyBackward:\r
+    mov     esi, eax                    ; esi <- Last byte in Source\r
+    lea     edi, [edi + edx - 1]        ; edi <- Last byte in Destination\r
+    std\r
+@CopyBytes:\r
+    mov     ecx, edx\r
+    rep     movsb\r
+    cld\r
+    mov     eax, [esp + 12]             ; eax <- Destination as return value\r
+    pop     edi\r
+    pop     esi\r
+    ret\r
+\r