ARM7 강좌 [8] : Instruction Set (2)

 


  이번 강좌에서는 데이터 프로세싱 명령에 대해 다루려 합니다. 해당 명령은 ARM7의 50%정도에 해당하는 명령입니다. 실제 개수는 16개이고, 연산명령과 비교명령, 비트 연산명령, 데이터 전송 명령 등이 포함됩니다.


● Data Processing Instruction


  데이터 전송명령의 형식은 다음과 같습니다.


+--------------------------------------------------------------------+

| Cond | 00 | I | OpCode | S |    Rn    |    Rd    |   Operland 2    |

+--------------------------------------------------------------------+

   4      2   1     4      1      4          4            12


  전에 언급했듯이 모든 인스트럭션의 크기는 32 Bit 입니다. 위의 그림에서 숫자는 해당 필드의 비트 수를 의미합니다.


  1) <Cond> [31:28] 4 Bit


     해당 명령의 조건 실행 플래그입니다. 지난 강좌에서 언급했었던 부분인데, 모든 명령어에 포함되므로 데이터 프로세싱 명령에도 포함됩니다.

     혹시나 해서 다시 말씀드리는데, 해당 플래그를 통해 명령을 현재 플래그 레지스터(CPSR)의 상태에 따라 실행 여부를 결정하는데 사용되는 플래그입니다.


  2) <I> [25] 1 Bit


     Operland 2로 지정되어 있는 부분이 Immediate Operand 인지 아닌지 여부를 나타내는 비트입니다. Immediate Operand라 함은, 예를 들어 8086에서 MOV AX,01234h 라고 했을 경우, 1234h를 가리키는 말입니다. 자세한 내용은 Operland2를 설명하면서 자세히 다루겠습니다.


  3) <OpCode> [24:21] 4 Bit


     데이터 프로세싱 명령 중 어떤 명령인지를 나타내는 필드입니다. 해당 필드와 명령어는 다음과 같습니다.


     <OpCode>   Instruction        Description

     -----------------------------------------------------

       0000       AND              Rd:=Op1 AND Op2

       0001       EOR              Rd:=Op1 XOR Op2

       0010       SUB              Rd:=Op1 - Op2

       0011       RSB              Rd:=Op2 - Op1

       0100       ADD              Rd:=Op1 + Op2

       0101       ADC              Rd:=Op1 + Op2 + C

       0110       SBC              Rd:=Op1 - Op2 + C - 1

       0111       RSC              Rd:=Op2 - Op1 + C - 1

       1000       TST              Op1 AND Op2 -> CPSR

       1001       TEQ              Op1 XOR Op2 -> CPSR

       1010       CMP              Op1 - Op2   -> CPSR

       1011       CMN              Op1 + Op2   -> CPSR

       1100       ORR              Rd:=Op1 OR  Op2

       1101       MOV              Rd:=Op2

       1110       BIC              Rd:=Op1 AND (NOT Op2)

       1111       MVN              Rd:=NOT Op2


     명령어들의 간단한 설명만으로도 어느 정도는 이해할 수 있으리라 생각합니다. 각각의 명령에 대해서는 자세히 다루지 않도록 하겠습니다. 나중에 예제를 보시고 이해할 정도라면 족하다고 생각합니다.


  4) <S> [20] 1 Bit


     S 비트가 1인 경우는 데이터 프로세싱 명령의 결과가 CPSR(플래그레지스터)에 영향을 미칩니다. 즉, 0인 경우에는 CPSR은 변하지 않습니다.


  5) <Rn> [19:16] 4 Bit


     ARM 데이터 프로세싱 명령은 그 결과와 첫 번째 오퍼랜드는 항상 레지스터로 지정해야 합니다. Rn은 첫 번째 오퍼랜드를 가리키는 것으로 위에서 Op1으로 표기한 것에 해당합니다. ARM에서 한번에 볼 수 있는 범용 레지스터는 sp, lr, pc 등을 포함해서 r0에서 r15까지라고 말씀 드렸습니다. 즉, 4Bit를 통해 레지스터를 나타내게 됩니다. 해당 필드는 명령에 따라 사용되지 않기도 합니다. MOV나 MVN등이 이에 해당합니다.


  6) <Rd> [15:12] 4 Bit


     오퍼레이션의 결과가 저장될 레지스터를 의미합니다. 역시 레지스터를 가리키므로 4비트를 사용하고 모든 명령에서 디폴트로 사용되는 필드입니다. 말씀드렸듯이 ARM의 데이터 프로세싱 명령의 결과는 항상 레지스터로 들어갑니다.


  7) Operand 2 [11:0] 12 Bit


     드디어 오늘의 가장 험난한 산인 Operand 2 필드까지 왔군요. 설명 드려야 할 부분이 좀 많거든요. 어떻게 설명을 드려야 할지, 막막하긴 하지만, 용기를 가지고 차근차근 설명해 보도록 하겠습니다.


● 데이터 프로세싱 명령의 Operand 2 필드


  오퍼랜드 2의 의미 자체는 별게 아닙니다. 아마도 다들 아시겠지만, ALU에 연산명령을 내릴 경우 한 쪽 입력은 오퍼랜드 1, 다른 쪽은 오퍼랜드 2 그리고, 결과가 나오고... 앞서 설명한 내용에 의거하면 다음과 같이 표현 할 수 있겠죠?



                Op1(Rn)             Operand 2

                --------------     ---------

                 |           |    /        /

                 |           |   /        /

                  |          |  /        /

                  |                     /

                   |        ALU        /

                   |                  /

                    |                /

                     ----------------

                            Rd


  예를 들어 AND r1,r2,r3라는 명령에서 Rd = r1 이고 Rn=r2 입니다. 그리고 r3가 Operand2에 해당하는 부분이 되겠죠. 의미는 r1=r2 & r3 라는 의미입니다.


  여기서 설명하고자 하는 ARM7의 데이터 프로세싱 명령의 Operand2의 타입은 두 가지 종류가 있습니다. <I> 필드의 내용에 따라 구분이 되는데, Immediate Operand 혹은 레지스터 Operand입니다.


  1) Register Operand


     <I> 필드가 0일 경우엔 Op2가 레지스터임을 의미합니다. 레지스터를 나타내기 위해서는 아시다시피 4비트만 있으면 되죠? 그런데 Op2를 위한 비트 수는 총 12 비트입니다. 남는군요.


     구체적으로 레지스터 오퍼랜드2의 형식을 보여드리겠습니다.


    +----------------------------------------------+

     |          Shift [11:4]             | Rm [3:0] |

     +----------------------------------------------+


     위의 그림을 보시면 Rm이라고 레지스터를 지정하는 4비트가 포함되어 있습니다. 그러면 Shift 부분은 뭘까요?


     강좌의 앞부분에서 언급했나요? 무슨 Shift가 ALU의 한쪽에 달려 있다고. 결론적으로는 레지스터를 ALU로 그냥 집어넣는 것이 아니라 Shifter를 통해서 넣어주도록 되어 있습니다. 따라서, Shift라는 필드는 (8비트죠?) 그런 역할을 해주는 것이겠군요. 그럼 왜 8비트일까요? 여기서 다시 한번 Shift를 구체적으로 살펴보겠습니다.


     우선 그전에 Shift 필드에는 Shift 회수를 지정하는 방법이 두 가지가 있는데, 첫 째는 Shift 필드 안에 그 회수를 포함시키는 방법이고, 두 번 째는 Shift 회수가 들어있는 레지스터를 Shift 필드 안에서 지정하는 방법입니다. 경우의 수가 자꾸 늘어가는군요. 해당 타입 두 가지는 Shift 필드의 최하위 비트인 4번 비트에 따라 결정됩니다. 다시 그림을 그려보겠습니다.


     +-------------------+               +-------------------+

     |  count  |type | 0 |               | Rs  | 0 |type | 1 |

     +-------------------+               +-------------------+

         5        2    1                    4    1    2    1


     최하위 비트의 값이 0이냐 1이냐에 따라 두 가지로 구분이 되었습니다. 왼쪽의 경우가 직접 Shift 회수를 지정하는 방법으로, count 부분이 총 5 비트로서 그 값을 의미합니다. ARM7의 레지스터는 32비트이므로 5비트는 있어야 Shift 회수를 표현할 수 있겠지요.


     그러면 Type은 뭘까요? 2비트인 Type의 의미는 다음과 같습니다.


        00 : logical left       (LSL)

        01 : logical right      (LSR)

        10 : arithmetic right   (ASR)

        11 : rotate right       (ROR)


     그렇군요. 단순히 Shift라고 말씀드렸지만 실제로는 좌, 우, 부호의 여부와 Rotate까지 형식을 지정할 수가 있습니다. (무지 복잡해지는 듯한 느낌입니다.^^)


     오른쪽에 레지스터를 지정하는 방식은, 1비트가 남아서 0으로  처리한 것만 제외하고는 별 문제가 없겠죠?


     원래는 여기서 쉬프트 방식 4가지에 대한 설명이 뒤를 이어야 하겠지만. 이러다 보면 한도 끝도 없을 것 같네요.


  2) Immediate Operand


     강좌를 정리하려다 생각하니 Immediate Operand를 설명 안했군요. 여기까지는 해야할 것 같아서.


     레지스터 오퍼랜드의 경우 총 12 비트 중에서 4비트는 레지스터를 지정하고, 나머지 8비트는 해당 레지스터 값을 Shift하는 방법을 지정하도록 되어 있었습니다.


     Immediate 오퍼랜드는 몇 가지 문제가 있습니다. 32비트 레지스터에 값을 써넣고 싶은데 공간은 12비트 밖에는 없다는 것이지요. 8086등에서는 그냥 여러 바이트로 명령을 처리했었으니 그런 문제가 없었지만, ARM에서는 이것 때문에 모든 명령이 32비트라는 규칙을 깰 수는 없었겠지요. 다음은 구체적인 형태입니다.


     +----------------------------------------------------------------+

     |  Rotate [11:8]    |              Imm [7:0]                     |

     +----------------------------------------------------------------+


     이전과 비슷한 모양이군요. 이번엔 Rotate 필드(4비트)가 있고, 또 8비트의 Imm필드가 있습니다. Imm은 말 그대로 Immediate Value를 넣는 공간입니다. 이 공간이 8비트라서, 결국 ARM7에서 어떤 상수 값을 레지스터로 전송하거나 할 경우 8비트까지는 아무런 문제가 없이 넣을 수 있습니다. 그러면 Rotate 필드의 하는 역할은 무엇일까요?


     좀 복잡한데요... ARM7문서에는 다음과 같이 써 있습니다.


“Immediate Operand rotate 필드는 부호 없는 4비트 정수로서 8비트  Immediate 값에 Shift 오퍼레이션을 할 수 있도록 사용되는 값이다. rotate필드 *2 값만큼 8Bit Immediate Value 값을 Right Rotate 시킨다. 결국 8비트 값을 32비트로 확장시키는 역할을  하며 이를 통해 자주 사용되는 많은 상수들을 사용 가능하도록 한다."


     8비트의 값이 ALU로 들어가기 전에 Shifter로 들어가면, 이미 32비트로 확장이 됩니다. 이후 그 값을 그냥 쓰면 8비트 영역만 표현할 수 있지만 Rotate필드 값을 * 2 한만큼 Rotate Right 시킨다 그랬으니, 어떤 변화가 생기겠죠?


오늘 분량이 좀 많았네요... 차근차근... 담에 또 말씀드리죠.. 뭐. 몇 가지 예를 들어 보이면서. 오늘 강좌를 정리할까 합니다.


     ADDEQ      r2,r4,r5                : 제로 플래그가 설정되어 있다면 r2=r4+r5

     SUBS       r4,r5,r7,LSR r2         : r4=r5-(r7>>r2) & effect CPSR

ARM7 강좌 [7] : Instruction Set (1)

 


● ARM7 명령어의 특징


  AMR7은 32 Bit 코어입니다. 특징적인 것은 모든 명령어가 32Bit 하나의 Word로 구성된다는 것입니다. 8086의 경우엔 명령어에 따라 1바이트 명령부터 5바이트까지 있나요? 그런데, ARM7은 모든 명령어를 한 워드로 처리합니다. 일단은 명령어의 개수가 몇 안되고, 주소는 상대주소 방식을 사용하며, 심지어는 Immediate 상수 값도 32비트 값은 그대로 넣을 수 없습니다.


  무슨 이야기인가 하면, 만약 r0에 32비트 상수를 넣고 싶다면, 몇몇 예외를 제외하고는 메모리에 미리 넣어두고 해당 메모리를 상대 주소로 참조해서 얻어 와야 한다는 뜻입니다.


  역시 장단점이 있겠지만, 장점으로는 모든 명령어를 같은 사이즈로 처리함에 따라 파이프라인 구현이 용이하다는 점이 있습니다. 그리고 명령어 해석기를 설계할 경우 예외 처리부분이 없으므로, 쉽고 고속으로 처리할 수 있겠지요. 단점은 앞에서도 간단히 언급했지만 코딩 시에 몇몇 제한이 따른다는 점입니다. 상대 주소 지정 방식은, 이때 사용하는 Offset이 24+2=26 비트이므로, 상대주소라고는 하지만 거의 불편이 없고, 다만 Immediate  오퍼랜드를 지정할 경우에 좀 번거롭다는 점이 있습니다. 그러나 8비트의  해상도를 가지는 오퍼랜드라면 한 워드 내에서 처리 가능합니다. 자세한 내용은 다시 말씀드리겠습니다.


  ARM 명령어의 다른 특징으로는 모든 명령어를 조건적으로 실행시킬 수 있다는 것입니다. 저의 경우엔 이 부분에서 대단히 감명을 받았는데요 예를 들어, 8086에서는 jz, jc 와 같은 점프 명령을 사용합니다. 그 의미는 제로 플래그가 설정되어 있으면 점프를 해라, 혹은 캐리 플래그가 설정되어 있으면 점프를 해라.. 라는 의미임을 아실 것입니다. 그냥 무조건 점프의 경우엔 jmp를 쓰지요.


  ARM의 경우엔 그런 플래그의 사용이 점프명령에 국한되지 않고, 예외 없이 모든 명령어에 사용할 수 있습니다.


        ex)  BEQ        jmp_1   ; Branch if Z flag set to jmp_1

             MOVEQ      r0,r1   ; r0 := r1 if Z flag set...


  위의 경우를 보시면 jmp에 해당하는 B명령뿐만 아니라 MOV 와 같은 데이터 전송명령에도 플래그 옵션을 사용했음을 볼 수 있습니다. 이런 기능의 장점은 잠깐만 생각해 보아도 알 수 있습니다. 예를 들어 C 연산자 중에 ? 연산자를 컴파일 한다고 생각해 봅시다.

   

        ex) a=(b==c) ? d:e;

        (편의상 변수를 레지스터로 바꾸어 생각하겠습니다.)


            CMPS        r2,r3

            MOVEQ       r1,r4

            MOVNE       r1,r5


  아직 명령어를 안 다루었으므로 대충 의미는 추측 해 보세요. 8086이랑 대충은 비슷하니까 어려운 일은 아닐 것입니다. r2와 r3를 비교해서, 그 결과가 같다면 r1에 r4를 넣고, 그렇지 않다면 r1에 r5를 넣는 코드입니다. 만약 같은 일을 8086등에서 하려면 점프 명령이 한 개 이상은 들어가야 하겠죠.


  다시 한번 강조하지만 ARM7에서는 이와 같은 조건 옵션을 모든(!) 명령어에 사용 가능합니다. 실제로 모든 OP 코드의 상위 4비트는 이런 조건옵션을 나타내는데 사용되는 비트입니다. 각 조건에 사용되는 접미사 목록입니다.


        0       EQ      Z Set                   equal

        1       NE      Z Clear                 not equal

        2       CS      C Set                   unsigned higher or same

        3       CC      C Clear                 unsigned lower

        4       MI      N Set                   negative

        5       PL      M Clear                 positive or zero

        6       VS      V Set                   overflow

        7       VC      V Clear                 no overflow

        8       HI      C Set and Z Clear       unsigned higher

        9       LS      C Clear or Z Set        unsigned lower or same

        10      GE      N Set and V Set or      greater or equal

                        N Clear and V Clear     

        11      LT      N Set and V Clear or    less than

                        N clear and V set

        12      GT      Z clear and             greater than

                        ether N set and V set or

                        N Clear and V clear

        13      LE      Z Set or                less than or equal

                        N set and V clear or

                        N clear and V set

        14      AL      always

        15      NV      never


  뒷부분에 가서는 무지 복잡하죠? 저도 치면서 이걸 꼭 쳐야 할 필요가 있을까 생각을 했습니다만, 이왕 시작하는 거.. 하면서 다 쳤군요. 자세하고 정확한 내용은 다른 문서를 참조하시길 바라고 여기서는 그냥 이런 것들이 있구나 하는 정도만 알아두세요.


  다음으로 말씀드릴 명령어의 특징은 대부분의 명령어에 S라는 접미사를 사용하여 플래그 레지스터에 영향을 줄지 여부를 결정할 수 있다는 것입니다. 특히 연산명령을 수행할 때 'S'를 붙이면 해당 결과에 따라서 플래그 값들이 변하게 되고, 붙이지 않으면 영향을 미치지 않도록 할 수 있습니다. 8086에서는 연산의 결과에 따라 항상 플래그 값이 영향을 받죠? 여기서는 받지 않게 할 수도 있다는 점을 말씀드렸습니다. 자세한 내용은 명령어의 세부사항을 참조하세요.


  명령어의 특징을 말씀드리는 중인데, 앞으로도 오퍼랜드 사용 등에 대해 말씀드릴 것이 많이 남아있네요... 그런데 분량은 점점 늘어나고...


  ARM은 지금 말씀드리는 규칙들이 거의 예외 없이 적용됩니다. 명령어가 간단한 대신 옵션이 많거든요...그리고 지금 그 옵션 두 가지를  말씀드렸고요.


  오늘은 그냥 끝내기는 서운하니까 점프 명령 하나만 말씀드리고 마치겠습니다.


  ● Branch and Branch with link (B, BL)


  +------------------------------------------------------------------+

  | Cond | 101 | L |                                                 |

  +------------------------------------------------------------------+

  

  Cond 부분은 위에서 말씀드린 조건 옵션입니다. 101은 B 명령 코드입니다.


  L 부분은 1일 경우 BL 이 되는 것이고 0이면 B 명령입니다. B는 JMP라고 생각하시면 되고, BL은 CALL로 생각하시면 됩니다. 다만 BL의 경우엔 PC값을 스택에 넣는 것이 아니라 r14(lr)에 넣는다는 것이 차이가 있습니다. 나머지 하위 24비트가 Offset으로 사용되는데, ARM7은 모든 명령어들이 Word단위이므로 총 +/- 32메가 바이트 영역을 커버합니다.


  좀 어수선한 느낌입니다만. 오늘은 이만.

ARM7 강좌 [6] : Exception (2)

 


● Exception Overview


  Exception을 처음부터 완전히 이해 할 필요가 있다고는 생각하지 않습니다. 대부분의 것들이 그러하듯 우선은 이런 것이 뭐다 라고 파악만 하고 있다면, 정작 필요할 경우에 다시 자세히 살펴보아도 좋을 것입니다.


  그런 취지에서 Exception을 바라본다면, ARM 7에는 여섯 가지의 CPU 동작 모드를 지원한다는 사실과, 차후 MMU 같은 것에도 그 동작모드가 관여한다는 것. 그리고 각 모드마다 스택을 따로 설정해 준다는 것... 등.


  꼭 알아야 할 것이 있다면 IRQ나 FIQ 정도가 되겠지요. 흔히 말하는 인터럽트 관련 부분이 바로 이 부분입니다. 실제 코딩을 할 경우에는 CPU에서 정해져 있는 IRQ, FIQ관련 레지스터를 설정하고, 해당 벡터 번지를 바꾸는 정도... 그리고 초기화 시에 해당하는 스택 공간을 따로 잡아주는 정도만 신경을 쓰면 됩니다.


  원래는 각 Exception 모드마다 종료 방법이 각기 다름을 설명 해 드리려고 했는데, (구체적으로는 FIQ는 서비스 종료 시에 SUBS pc,r14_fiq,#4)라는 명령을 사용해야 합니다, 혹은 소프트웨어 인터럽트의 경우엔 MOVS pc,r14_svc 를 사용합니다.) 굳이 그런 내용까지 다룰 필요는 없을 듯 하다는 생각입니다. 필요한 경우 도큐먼트를 참조하면 자세히 나와 있습니다. 참고로 그렇게 각각 경우에 따라 복귀 방법이 다른 이유는 추측하자면 파이프라인 기능과 관련이 있는 것 같습니다.


  그러면, 다시 앞으로 돌아가서, Exception과 CPU동작모드의 연관성에 대해 마저 얘기해 보려 합니다. CPU동작 모드는 일반적으로는 Exception에 의하여 바뀌게 되고, User모드가 아니라면 프로그램에 의해 강제로 바꿀수도 있습니다.


  전에 살펴보았던 CPSR(스테이터스 레지스터)과 관련되어, CPSR의 모드비트 부분에 현재 CPU의 동작모드를 나타내는 비트들이 있는데, 해당 비트를 변경시킴으로서 프로그램에서 동작모드를 전환할 수 있습니다. OS를 포팅 할 경우 동작모드와 관련하여 메모리 보호기능 등도 구현될 수 있습니다.


  마지막으로 몇 가지 사항만 말씀드리고 오늘 강좌를 마치려 합니다. 우선, Exception간의 우선순위 문제인데, 기본적으로 ARM7은 IRQ, FIQ를 지원하지 않습니다. 해당 인터럽트가 발생하면 CPU는 CPSR의 인터럽트 금지 플래그를 설정합니다. 만약 도중에 인터럽트를 받고 싶다면 사용자가 해당 플래그를 클리어 해주어야 합니다. 또, 동시에 여러 개의  Exception 이 발생한 경우라면 그 우선순위는 다음과 같습니다.


        1) Reset (가장 높은 우선순위)

        2) Data abort

        3) FIQ

        4) IRQ

        5) Prefetch abort

        6) Undefined Instruction, Software Interrupt


  Exception 부분을 설명하다 보니 강좌가 자칫 너무 딱딱해지는 감이 있어서 그냥 이쯤에서 마무리를 지으려 합니다.


  다음 강좌부터는 좀더 구체적인 ARM7의 인스트럭션에 대해 다루겠습니다. 명령어가 몇 개 되지 않기 때문에 3회 정도로 다룰 생각입니다..


  그럼 다음 강좌에 뵙겠습니다.


ARM7 강좌 [5] : Exception (1)

 


● Exception


  우선 Exception이 무엇을 말하는지를 이제부터 정리해 보고자 합니다. 일반적으로 인터럽트와 유사한 개념으로 사용합니다. 어떻게 보면 인터럽트보다는 조금 큰 개념이랄 수도 있고, 정확한 정의에 대해서는 말씀을 드리지 못하겠군요. 개념을 ARM7에서의 Exception으로 한정해서 말씀드리겠습니다.


  구체적으로 ARM7에는 FIQ(Fast Interrupt reQuest)와 IRQ(Interrupt reQuest), Abort, Software Interrupt, Undefined Instruction Trap의 5가지 Exception이 있고, 각각 Exception이 발생하면 CPU는 대응하는 동작모드로 전환됩니다. 여기에 보통 동작상태인 User 동작모드가 추가되어 동작 모드는 총 6개가 있습니다.


 - IRQ

    : 일반적으로 I/O 장치로부터의 입력이 들어오면 반응을 하는 흔히 말하는 인터럽트 Exception입니다. IRQ의 종류로는 내부 타이머나 시리얼, 혹은 외부 IRQ입력 등이 될 수 있습니다.

 - FIQ

    : 개념적으로는 IRQ와 거의 유사한데, 다만 보다 빠른 처리를 할 수 있도록 제공되는 Exception입니다. IRQ의 소스는 대부분 FIQ로도 매핑 될 수 있습니다. 즉, 타이머 인터럽트를 IRQ로 처리하거나, 혹은 FIQ로 처리할 수도 있다는 의미입니다.

  - Abort

    : CPU가 메모리로부터 인스트럭션을 가져오거나, 혹은 인스트럭션을 동작시키면서 데이터를 가져오려고 할 경우, 해당 메모리를 억세스 할 수 없다면 Abort Exception이 발생합니다. 위에 제시한 두 가지 경우에 대응하여 Prefetch Abort와 Data Abort로 구분할 수 있습니다.

  - Software Interrupt

    : 프로그램에서 임의로 인터럽트를 호출하는 경우입니다. ARM Instruction SWI가 이에 해당합니다. 이 Exception이 발생하면 CPU동작모드가 Supervisor 모드로 바뀌도록 되어 있고, 보통 OS의 시스템 Call을 구현하기 위해 사용됩니다.

  - Undefined Instruction Trap

    : ARM7 에 정의되어 있지 않은 명령어를 만났을 경우 발생하는 Exception입니다. 이 기능은 코프로세서를 사용하는 경우와 관련되어 사용된다고 합니다.


  위에서 언급한 5종류의 Exception에 몇 가지를 더하여, 해당 처리를 위해 ARM7은 0번지에 벡터 테이블을 유지합니다. 즉, 해당 Exception이 발생하면 정해져 있는 벡터 번지로 실행을 옮깁니다. 해당 번지는 다음과  같습니다.


        Address         Exception               Mode on entry

        -----------------------------------------------------

        0x0000.0000     Reset                   Supervisor

        0x0000.0004     Undefined Instruction   Undefined

        0x0000.0008     Software Interrupt      Supervisor

        0x0000.000C     Abort(prefetch)         Abort

        0x0000.0010     Abort(data)             Abort

        0x0000.0014     --reserved--            --

        0x0000.0018     IRQ                     IRQ

        0x0000.001C     FIQ                     FIQ



  한가지 주의할 점은 8086의 경우엔 해당 벡터에 ADDRESS를 넣어 두면, 인터럽트 발생 시에 해당 주소를 가져다가 PC에 넣어주는 일이 발생하지만, ARM7의 경우엔 그냥 해당 벡터로 점프를 합니다. 예를 들어 IRQ가 발생했다면 다음순간의 pc(r15)값은 0000.0018 이 됩니다. 따라서 해당 벡터 번지에는 단순히 번지가 들어가는 것이 아니라 점프명령 같은 것이 들어갑니다.


● 동작모드


  위의 Exception과 관련되어 CPU의 동작모드 몇 가지가 나타나 있습니다. 전에도 몇 번 말했듯이 ARM7에는 6가지의 동작 모드가 있습니다. 해당 모드는 User Mode, FIQ Mode, IRQ Mode, Supervisor Mode, Abort Mode, Undefined Mode 등의 6가지입니다.


  - 동작모드와 범용 레지스터


    동작모드가 왜 있는 걸까요? ARM7은 각 동작모드에 따라서 몇 가지 기능을 제공합니다. 가장 큰 것으로 레지스터를 리-맵핑시키는 기능이 있습니다. 좀 다르게 설명하면, 각 모드마다 전용 레지스터가 따로 있다고도 표현할 수 있겠는데요, 차근차근 설명해 보도록 하겠습니다.


    CPU의 동작모드는 보통 때는 User 모드입니다. 이 때는 기본적으로 r0에서 r15까지를 사용하고 있겠죠. 그러다 가령 FIQ가 발생했다고 하면 동작 모드가 FIQ 모드로 바뀌게 됩니다. 이와 동시에 r8부터 r14까지의 7개의 레지스터는 FIQ 전용 레지스터로 리-맵핑됩니다. 즉, User모드의 레지스터와는 별개였던 레지스터 7개가 r8부터 r14까지의 위치에 배치되는 것이죠. 물론 기존의 User모드에서 사용하던 r8-r14까지의 레지스터와는 별개의 레지스터입니다.


    이렇게 하는 장점을 생각해 보겠습니다. 흔히 인터럽트 처리루틴을 작성할 경우 인터럽트 발생 시 가장먼저 하는 일이 사용 중이던 레지스터를 스택에 저장하고, 또 처리루틴이 종료될 때는 다시 복구시키는 일이었습니다. 그러나 ARM7에서 FIQ의 경우를 살피면, FIQ 처리 루틴의 코딩 시에는 r8부터 r14까지를 자유롭게 사용할 수 있고, 또 저장과 복구 과정을 생략해도 좋습니다. CPU모드가 바뀜에 따라 레지스터 자체가 별개의 다른 것으로 바뀌었기 때문입니다.


    해당 내용을 정리해 보도록 하겠습니다.


    -----------------------------------------------------

    User        FIQ     Super   Abort   IRQ     Undefined

    -----------------------------------------------------

    r0          .       .       .       .       .

    r1          .       .       .       .       .

    r2          .       .       .       .       .

    r3          .       .       .       .       .

    r4          .       .       .       .       .

    r5          .       .       .       .       .

    r6          .       .       .       .       .

    r7          .       .       .       .       .

    r8          r8_fiq  .       .       .       .

    r9          r9_fiq  .       .       .       .

    r10         r10_fiq .       .       .       .

    r11         r11_fiq .       .       .       .

    r12         r12_fiq .       .       .       .

    r13         r13_fiq r13_svc r13_abt r13_irq r13_und

    r14         r14_fiq r14_svc r14_abt r14_irq r14_und

    r15(PC)     .       .       .       .       .

    -----------------------------------------------------


    위의 그림이 각 모드에 따라 리-맵핑되는 레지스터들을 나타낸 그림입니다. FIQ모드에서는 7개, 그리고 나머지 모드에서는 2개씩의 레지스터가 리-맵핑됩니다.


    이 개념이 이해하기가 좀 어려울지도 모르겠군요. 시간을 가지고 차근차근 생각해 보시길 바랍니다.


    그러면 왜 다른 모드들에서는 r13과 r14를 따로 두었을까요? 그것은 그 레지스터들이 특별한 목적을 위해 사용되는 레지스터이기 때문입니다.


    레지스터차원에서 이번에는 IRQ가 발생한 경우를 가지고 설명해 보겠습니다.


    r14는 Link 레지스터로써 Call과 같은 인스트럭션이 발생할 경우 복귀 할 번지를 저장해 두는 레지스터입니다. 다음은 IRQ 발생 과정입니다.


        1) User모드에서 r0-r15를 사용하고 있다.

        2) IRQ 발생

        3) ARM CPU는 동작모드를 IRQ 모드로 바꾼다.

           ( 이때 r13과 r14는 IRQ 전용 레지스터로 대치된다.)

        4) 이 시점의 PC 값은 IRQ 처리 이후 복귀할 번지이다. 그 값을 r14 (이미 IRQ모드가 되었으므로 r14_irq) 에 넣는다.

        5) 만약에 r0부터 r12까지를 IRQ처리 루틴에서 사용하고자 한다면 해당 레지스터를 sp(r13, 역시 r13_irq)를 사용하여 스택에 넣는다.

           .....


    여기서 5)번 과정을 눈 여겨 볼 필요가 있을 듯 합니다. r13이 스택 포인터로 사용됨은 지난 강좌에서 말씀드렸었습니다. 그런데, 각 모드마다 r13을 따로 가지고 있으므로, 스택을 CPU 동작모드마다 따로 관리할 수 있게 되는 것입니다.


    그림이라도 그려서 설명을 드리면 좋을 듯 한데, 텍스트로만 설명하기가 쉬운 일이 아니군요.


    r14는 복귀번지가 들어가기 때문에 항상 디폴트로 사용되므로 여분의 레지스터가 필요하겠죠. 그런 이유로 r13과 r14를 각 모드마다 따로 둔 것입니다. 혹시 이해가 되시나요?


    FIQ모드는 그 이름에서도 나타나 있듯이 7개의 레지스터를 따로 두어서 레지스터 저장 복구 과정을 거의 생략할 수 있도록 한 것이죠.


    그리고 참고로 Exception에서 복귀할 경우엔 기본적으로는 해당 모드의 r14 번지의 내용을 r15번지로 넣는데, 각 모드마다 조금씩의 차이가 있습니다.


    맨 처음 ARM7 을 소개할 때 범용 레지스터가 31개라고  말씀드렸었는데, 지금 다시 계산을 해보면, User모드의 디폴트 16개 + FIQ 모드 7개 + 나머지 4개의 모드 *2 =8개 해서 16+7+2+2+2+2=31 개로 계산이 됩니다.


  - 동작 모드와 PSR(Status 레지스터)


    범용레지스터와 비슷하게 PSR 역시 동작모드마다 따로 관리가 됩니다. 해당 레지스터는 뒤에 모드 이름을 붙여서 SPSR_fiq, SPSR_svc, SPSR_abt, SPSR_irq, SPSR_und 와 같은 이름으로 부릅니다. 따라서 PSR 개수는 CPSR을 포함하여 총 6개가됩니다.


    SPSR은 CPSR값을 저장해 두는 역할을 합니다. 범용레지스터가 아예 맵핑이 바뀌는데 반해, 모드가 바뀔 경우, 예를 들어 IRQ가 발생했다면, 기존에 User모드에서 사용하는 CPSR값을 SPSR_irq에 저장을 합니다. 그리고 IRQ 모드에서는 CPSR과 SPSR_irq를 둘 다 볼 수 있습니다. 후에 IRQ가 끝나는 시점에서 SPSR_irq의 내용을 CPSR로 복구하면 원래의  CPSR값이 유지되는 것이죠.


    가만히 생각해보면 Exception이 발생했을 때 해당 처리 루틴에는 그 순간의 CPSR값을 그대로 가져오는 셈이지요. 다만 시작할 때 해당 값을 SPSR에 저장해 두었기 때문에 IRQ 처리루틴에서 수정이 된다고 해도, 복귀할 때 SPSR에서 CPSR값을 다시 가져오므로, 실행 중이던 환경은 그대로 유지가 되는 것입니다. 이렇듯 ARM7에서는 Exception처리에 있어 되도록 스택 사용을 최소화하려는 노력을 엿볼 수 있습니다.


 오늘 강좌 내용은 좀 어려웠던 것 같습니다. 다른 CPU에는 없는 개념(?)을 설명하느라 그런 것 같습니다. 더 이상 길어지기 전에 오늘은 이만 줄이려 합니다. 다음 강좌에서는 Exception부분에서 좀 더 알아야 할 몇 가지 사항을 간단히 언급하도록 하겠습니다.


ARM7 강좌 [4] : 레지스터

 


● ARM7의 레지스터


  지난 강좌에서 ARM7에는 31개의 General Purpose 레지스터와 6개의 Status 레지스터가 있다고 말씀드렸습니다. 물론 모두 32비트 레지스터입니다.


  그런데, ARM7의 어셈블러에서 사용하는 범용 레지스터 키워드는 r0에서 r15까지 16개 밖에는 되지 않습니다. 즉, 다시 말해서 사용자가 한번에 사용할 수 있는 레지스터는 16개  입니다. 그 중에 몇 개는 프로그램 카운터 (PC) 나 스택 포인터(SP) 등의 용도로 사용됩니다. 나머지 레지스터는 CPU 동작 모드(Exception)과 관련되어 r0-r15로 리-맵핑되어 사용되는데 이는 다시 설명 드리겠습니다.


1. Special Purpose General Register


  위 부분에서 잠시 설명 드렸지만, User가 프로그램 할 때  레지스터 지정을 위해 사용할 수 있는 키워드는 r0에서 r15까지 입니다. 그 중에 몇 가지는 특별한 목적을 위해 사용됩니다.


  - Program Counter (r15)


    : r15는 다른 CPU에서 PC와 같은 역할을 합니다. 다만 차이가 있다면 r15를 일반 다른 레지스터처럼 오퍼랜드로 사용할 수 있다는 점이고(다른 CPU도 마찬가지인가요?) ARM어셈블러에서는 pc라는 키워드와 r15를 동일하게 취급합니다.


  - Stack Pointer (r13)


    : ARM7에는 Stack을 위한 명령어가 따로 없습니다. 즉, Push 나 Pop등의 명령어가 제공되지 않습니다. 그러나 sp라는 키워드를 사용하여 r13을 쓸 수 있는데, 묵시적으로 r13을 스택포인터로 사용할 수 있도록 정해 놓은 듯 합니다. 그러면 왜 하필이면 r0나 r1이 아니고 r13을 sp라고 부르는가 하면, 역시 Exception과 관련된 부분이므로 잠시 후에(혹은 다음강좌에) 설명하도록 하지요. 그리고, Push 명령이나 Pop 명령이 없으므로, ARM7에서는 같은 기능을 일반 데이터 전송 명령을 통해 해결합니다. ARM7의 데이터 전송명령은 Auto Increment 기능이 있어서 하나의 인스트럭션으로 Push나 Pop과 동일한 기능을 수행 할 수 있습니다.


  - Link Register (r14)


    : r14는 링크 레지스터라고 부릅니다. 이 레지스터는 8086등에서는 보지 못했던 기능의 레지스터입니다. 8086등의 프로세서는 서브루틴을 호출할 경우 CALL을 사용하면 다음에 수행될 프로그램 카운터를 스택에 넣고, 호출될 번지를 프로그램 카운터에 넣는 동작을 하는데, ARM7에서는 CALL과 RET와 같은 명령이 없습니다. 대신 Branch with Link 라는 명령(BL)이 있는데, 해당 명령을 수행하면, CALL과 비슷하게 다음에 수행될 pc(r15)값을 스택이 아니라 lr(r14)에 넣고 분기 번지를 pc(r15)에 넣어 분기합니다. 즉, 스택을 사용하지 않는 것이지요. 복귀할 때는 RET대신 mov pc,lr 이라는 데이터 전송명령으로 복귀합니다.


  이런 방식은 나름대로 장단점이 있습니다. 우선 단점을 말하자면, 어떤 서브루틴이 콜 되었을 때, 서브루틴에서는 복귀번지가 r14에 들어있는 상태가 됩니다. 문제는 해당 서브루틴에서 다시 한번 다른 서브루틴을 콜 한다면, 원래 r14에 보관되어 있던 복귀 번지 값이 덮어씌워지는 결과가 생깁니다. 이런 경우엔, 수동으로 sp(r13)를 이용하여 스택에 r14 값을 보관해 두어야 합니다. 즉, Call하기 전에 r14를 스택에 보관해 두고, 리턴해서 복구하는 과정을 거치는 셈이지요.


  그러면 구태여 왜 이런 방법을 사용할까요. 이미 눈치채신 분들도 계시겠지만, 그렇게 Call을 연속적으로 하는 경우가 아닌, 한번만 Call 하는 경우라면, 스택을 사용하지 않고 레지스터를 사용함으로써, 그 속도에서 이익을 얻게 되는 것이죠.


  개인적으로는 기능이야 어떻든, Call과 Ret 마저 없어서 코드를 읽기가 상당히 좋지 않다는 생각입니다. 코드를 보고 어디서 어디까지가 한 프로시저인지 쉽게 분간이 안 갈 경우가 많거든요.


2. ARM7 Status Register


  이제 Status 레지스터를 살펴보려고 합니다. ARM7에는 32비트의 Status 레지스터가 6개가 있습니다. 그러나 6개 모두를 한꺼번에 사용하지는 못하고, 또 그럴 필요도 없죠. 일단은 하나의 32비트 Status 레지스터만 생각하면 됩니다.


  Status 레지스터는 PSR이라고 부릅니다. 그리고 일반적으로 CPSR이라고 하여 Current Processor Status Register로 부릅니다.


  PSR은 크게 Flag Bits부분과 Control Bits부분으로 나뉩니다.


  - Flag Bits

    : 어떤 인스트럭션의 결과 등을 나타내는 부분으로 4 비트가 있습니다. 다른 CPU의 그것과 유사한데, 각각 N, Z, C, V 의 4가지입니다.


      1) Negative/Less Than Flag

        : N으로 표기되는 이 플래그는 연산의 결과가 마이너스인 경우에 세트됩니다.

      2) Zero Flag

        : Z로 표기되는 이 플래그는 연산의 결과가 0이 되었을 경우에 세트됩니다.

      3) Carry/Borrow/Extend Flag

        : C로 표기되는 이 플래그는 자리올림이나 내림이 발생한 경우, 그리고 Shift 연산 등에서 사용됩니다.

      4) Overflow Flag

        : V로 표기되는 이 플래그는 연산의 결과가 오버플로우 되었을 경우 사용됩니다.


      이상의 Flag Bit들은 다른 칩의 상태 레지스터와 다르지 않습니다. 따라서 이해를 하는 데에도 별 무리가 없으리라 생각되며, 더 자세히 알고 싶다면, 각 명령어와 관련된 문서를 참조하시길 바랍니다.


  - Control Bits


    : 컨트롤 비트들은 인터럽트를 제어하는 비트와 계속해서 언급되기만 하고 실체를 드러내지 않고 있는 Exception과 관련된 CPU 동작모드를 설정하거나 확인할 수 있는 기능을 가진 Bit가 있습니다.


      1) IRQ / FIQ Disable Bit

        : ARM7의 인터럽트 중에서 IRQ와 FIQ를 금지시킬 수 있는 플래그입니다. 인터럽트의 종류는 이밖에도 몇 가지가 더 있는데, 그 중에서 IRQ, FIQ는 PSR을 통해 금지시키거나 가능하도록 설정할 수 있습니다.

      2) Mode Bits

        : M0 에서 M4까지의 모드 비트는 CPU의 6개의 동작 상태를 나타냅니다. 즉, 간단히만 말하자면 ARM7은 6개의 동작 모드를 가지는데, 이를테면 User모드와 인터럽트 모드 등입니다. 역시 자세한 내용은 다음 강좌를 통해 말씀드리겠습니다.


   이제 Status 레지스터를 한번 그려보겠습니다.

       +----------------------------------------------------------------+

       | N | Z | C | V |   ...     | I | F |   | M4 | M3 | M2 | M1 | M0 |

       +----------------------------------------------------------------+

    Bit  31  30  29  28              7   6        4    3    2    1    0


  오늘은 ARM7의 레지스터에 대해 기본적인 내용을 알아보았습니다. 하지만 많은 부분에서 ARM7의 동작 모드와 관련되는 부분이 나왔지요. 때문에 다음 시간으로 미룬 부분들이 많군요.


  다음 강좌에서는 ARM7 Exception에 대해서 다루려고 합니다. 오늘은 이만 줄이겠습니다.

ARM7 강좌 [3] : ARM7의 구조

 


● ARM7의 구조

  

  1. 레지스터

    : ARM7에는 31개의 32Bit 레지스터가 있습니다. 또, 동작모드에 따르는 -여기서 동작모드는 Exception부분에서 자세히 다루겠습니다.- 6개의 Status 레지스터가 있습니다.

      

  2. ALU

    : 32Bit 연산이 가능한 ALU가 제공됩니다. 그런데 특이한 것은 ALU의 한쪽 입력은 Barrel Shifter라는 것이 연결되어 있어서 ALU의 인수 하나는 레지스터에서 바로 들어오고, 다른 하나는 레지스터나 버스에서 Barrel Shifter라는 것을 거쳐 입력되도록 되어 있습니다.  이런 이유로 ARM7에서는 제 2 오퍼랜드를 지정할 때, 해당 값을 쉬프트 시켜서 사용할 수 있습니다. 보통 다른 CPU에서는 쉬프트 명령이 따로 있었는데, ARM7에서는 따로 존재하는 것이 아니라 대부분의 명령에서 옵션으로 적용시킬 수 있습니다.


  3. Booth's 곱셈기

    : 곱셈 기능을 제공하는 32 비트 Booth's 곱셈기가 있습니다. 곱셈기는 32 비트 연산을 지원하며, 32비트의 두 입력을 받아서 곱하여, 결과가 32비트를 넘더라도 넘는 부분은 버리고 32비트만을 남깁니다.


  이밖에 인스트럭션 디코더와 인크리멘터가 달린 어드레스 레지스터 등이 있고, 내부적으로는 지난번에도 말했듯이 32비트의 어드레스 & 데이터 버스로 연결됩니다. 또, ARM7은 파이프라인을 제공하고, 추가적으로 StrongARM과 같은 칩에서는 캐쉬 기능과 MMU 기능 등도 제공합니다.


  전에 말씀 드렸지만, ARM7은 CPU의 코어를 말합니다. 즉, 특정 칩을 일컫는 것이 아니기 때문에, 흔히 CPU를 접할 때 다루게 되는 I/O제어나 타이머, 인터럽트 부분 등은 강좌에서 소개되지 않습니다. 왜냐하면, 같은 ARM7 코어의 CPU라 하더라도 해당 부분들이 각기 다르기 때문입니다. 따라서 여러분들이 ARM7 코어를 사용한 칩을 공부하시고자 할 경우엔, 먼저 이 강좌의 내용인 ARM7 코어에 대한 부분을 공부하고, 다음에 해당 칩의 데이터시트를 보셔야 합니다.


  참고로, 제가 공부했던 칩은 샤프에서 나온 LH77790 이라는 칩과 Strong ARM 코어를 사용한 인텔의 SA1100 이라는 칩 두 가지 입니다.

  StrongARM은 Digital 사에서 ARM7 코어를 Licence 얻어서 확장한 형태인데, 기본적으로는 거의 유사하고 MMU같은 기능들이 추가가 된 코어입니다. 현재는 Intel이 Digital로부터 Licence를 구입하여 생산하고 있고, SA110 이나 SA1100, SA1111 등의 칩으로 제작되어 판매되고 있습니다.

  현재 생각으로는 강좌의 끝 부분에 가서 StrongARM인 SA1100에 대해서도 조금 다루어 볼 생각입니다.


  그럼 오늘 강좌는 이만 줄이도록 하겠습니다. 다음 강좌에서는 ARM7의 레지스터에 대한 내용을 다루겠습니다.

+ Recent posts