안녕하세요. 어미새입니다.



이번 포스팅에서는 지난 시간에 이어서 블록헤더 정보인 '머클 루트'에 대해 알아보도록하겠습니다. 머클 루트의 값은 어떻게 생성되는지, 예제를 통해서 검증하는 시간을 갖도록 하겠습니다.

이번 포스팅을 이해하기 위해서는 반드시 해시 함수에 대한 개념이 필요하며, 해시 함수에 대해서 잘 모르시는 분은 아래의 링크를 통해 먼저 해시 함수에 관한 내용을 읽어보시길 바랍니다.



'머클트리(Merkle Tree)' 와 '머클루트(Merkle Root)'


'머클트리(Merkle Tree)' 혹은 '해시트리(Hash Tree)'라는 데이터 구조는 Ralph Merkle이라는 사람이 1979년에 특허를 낸 개념입니다. 머클 트리의 목적은 어떤 블록의 데이터가 분리돼서 전달 될 수 있도록 하는것이며, 블록의 용량을 효율적으로 활용하수 있는 데이터 구조를 가지고 있습니다. 해시 함수의 특징으로 머클 트리 하위 노드들의 해시 값은 상위 노드에 영향을 주며, 어떤 악의적인 유저가 머클 트리 최하위에 있는 트랜잭션 정보를 가짜로 바꿔치기 하면 상위 부모들의 해시 값이 변경되고, 머클 루트 값 또한 변경됩니다. 머클 루트 정보가 변경될 경우 블록 해시 정보 또한 변경되어 해당 블록은 기존의 블록과 전혀 다른 블록으로 인식됩니다.


즉, 머클트리의 목적은 데이터의 간편하고 확실한 인증을 위해 사용합니다.


'머클루트(Merkle Root)'란 블록체인의 원소역할을 수행하는 블록의 바디부분에 저장된 트랜잭션들을 머클 트리한 최종 결과 값입니다.



블록의 구조는 크게 블록 헤더와, 블록 바디 정보로 구성되며, 블록의 바디 정보는 트랜잭션, 즉 거래 정보로 구성된다고 설명해드렸습니다. 블록의 바디 정보에 저장된 트랜잭션의 정보들이 유효한지 머클 트리를 통해 검사할 수 있습니다. 그럼 머클 트리는 어떻게 구성되고 최종적으로 머클 루트는 어떻게 만들어질까요?


머클 루트 연산 원리.


  1. 최초 데이터를 SHA256 형태의 해시값으로 변환한다.

  2. 가장 가까운 노드 2개를 한쌍으로 묶어 합친 후 해시값으로 변환한다.

  3. 계속해서 해시값으로 변환하여 마지막 하나가 남을때까지 이 과정을 반복한다.


<br/>

위의 그림처럼 각 해시된 결과값 TXID의 노드를 2개씩 짝지어 합친 후 다시 SHA256 함수를 통해 해시 값으로 변환하고 최종적으로 하나의 결과 값이 나올때 까지 이 과정을 계속해서 반복합니다. 최종적으로 남은 하나의 노드 값이 '머클루트' 결과 값이 되는겁니다!


다시 한번 정리해보면 아래와 같습니다.


  1. 블록헤더의 머클루트 값은 블록바디의 거래내역 정보인 TXID의 해시트리 결과 값이다.

  2. 머클루트의 역할은 각 거래 정보의(TXID)의 정보들이 변경되었는지에 대한 유효성을 검사하는 역할을 수행한다.

  3. 머클루트의 결과 값을 통해 블록 해시의 정보가 구성됨으로 그 블록의 유효성 또한 검사할 수 있다.

<

머클 루트 연산 과정


비트코인의 블록정보를 쉽게 볼 수 있도록 제공해주는 사이트인 '블록체인 인포' (https://blockchain.info/ko) 라는 사이트를 통해 블록 정보를 확인해보겠습니다. 제가 보고 있는 현 시점에서 블록체인 인포 사이트의 최신블록의 정보는 아래의 그림과 같이 #508186 입니다.



최신 블록인 #508186을 선택(클릭)하여 해당 블록의 정보를 자세히 살펴보겠습니다.



비트코인의 블록 정보를 확인해 볼 수 가 있습니다. 각 해당 요소들에 대한 설명에 대해서는 추후 계속적인 포스팅에 대해서 설명해 드리겠습니다. 이번 시간은 머클 루트 값을 구하는 과정을 테스트할 예정이기 때문에 다수의 거래정보가 있는 거래 리스트를 확인해 보겠습니다.



최신 블록은 위의 그림과 같이 정말 많은 거래 내역이 있기때문에, 테스트에 적합하지 않습니다. 거래 내역이 2건 내지 4건인 블록이 적당한 수치인것 같습니다. 마침 #99997번째 블록의 거래내역이 2건이기 때문에 해당 블록으로 테스트를 진행해보겠습니다. 해당 블록의 머클 루트와 거래정보는 아래의 그림과 같습니다.




블록#99997의 머클 루트는 5140e5972f672bf8e81bc189894c55a410723b095716eaeec845490aed785f0e 이며, 거래 내역은 아래의 그림과 같습니다.



그럼 이제 거래 내역의 TXID 정보를 합산한 후 SHA256으로 변환하는 코드를 짜고 그 결과 값을 확인해 보겠습니다.




결과는 위의 그림처럼.. 이상한 결과가 나오고 있습니다... 여러분은 알고 계셨나요?? 머클루트는 이렇게 구하는게 아니라는걸요??


머클루트의 결과 값을 정확하게 구하기 위해서는 엔디안이라는 개념이 필요합니다, 컴퓨터에서 어떤 크기의 데이터를 메모리에 저장할 때 바이트 단위로 나누어 저장하며, CPU 아키텍처에 따라 바이트 저장 순서가 달라질 수 있기 때문에 리틀-엔디안빅-엔디안 방식으로 나누어 질 수 있습니다.


쉽게 생각해서 앞선 TXID를 컴퓨터가 이해하기 쉬운 형태로 변환한 후, 합산해야합니다. 우선 정확하게 머클 루트를 구하는 예제 코드를 보여드리겠습니다.



위의 예제 코드의 1번의 과정처럼 문자열을 스왑해주고, 2번의 과정으로 스왑된 데이터를 바이너리로 형태로 변경해야합니다. 그리고 이렇게 만들어진 데이터 TXID 1번과, TXID 2번의 문자열을 합산하는것이 아니라 이어 붙여준 후 해시 함수를 2번 연산해 주어야합니다. 이렇게 해시 함수를 통해 얻은 결과 값을 4번과정과 같이 다시 역으로 꺼내주면 정확한 머클 루트 값을 구할 수 있습니다.


위의 예제 소스의 결과는 아래와 같습니다.



이렇게 해서 블록의 바디 정보인 TXID 정보를 토대로 머클 루트 결과 값을 만드는 과정을 확인해볼 수 있었습니다. 다음 포스팅에서는 비트코인의 블록헤더 정보는 무엇이고, 어떻게 값을 구하는지에 대해 알아보도록 하겠습니다.


추가로 머클 루트 구하는 방법을 테스트해보고 싶으신분은 아래의 링크를 통해 풀 코드를 확인해보시면 좋겠습니다. 해당 코드는 TXID의 양이 많더라도, 루프 문을 통하여 값을 구할 수 있도록 짜여진 코드입니다.


지금까지 긴 글 읽어주셔서 감사합니다!


[참고자료]


https://steemit.com/kr/@jayground8/hashmerkleroothttps://steemit.com/kr/@jsralph/merkle-treeshttps://steemit.com/kr/@twinbraid/5uzvbu-02http://twinbraid.blogspot.kr/2017/11/blog-post.htmlhttps://blockchain.info/ko/block/

안녕하세요. 어미새입니다.



비트코인의 블록체인 구조를 이해하기 위해서는 해시 함수에 대한 개념정리가 먼저 필요합니다.


해시함수

  1. 해시함수는 임이의 길이를 갖는 메시지를 입력받아 고정된 길이의 해시값을 출력하는 함수이다.

  2. 해시 함수를 사용하는 목적은 메시지의 오류나 변조를 탐기 위해, 즉 데이터의 무결성을 제공하기 위해 사용한다.


해시함수의 특징

  1. 어떤 입력 값에도 항상 고정된 길이의 해시 값을 출력한다.

  2. 입력 값의 아주 일부만 변경되어도 전혀 다른 결과 값을 출력한다.(눈사태 효과)

  3. 출력된 결과 값을 토대로 입력 값을 유추할 수 없다.

  4. 입력 값은 항상 동일한 해시 값을 출력한다.


해시 함수에 대한 보다 자세한 내용을 원하시는 분은 이전에 작선 포스팅을 참조하시면 좋을것 같습니다. (http://withbabybird.tistory.com/6)


본 포스팅에서는 비트코인의 블록체인 구성 요서에 대한 간략한 개요정도만 설명할 예정이며, 추후 각 구성요서에 대한 개별 포스팅을 진해하여 자세한 내용을 다루도록하겠습니다.


블록체인(Block-chain)


블록체인 기술은 블록과 블록을 체인형태(링크드 리스트)로 연결한 자료구조를 사용합니다. 블록체인 기술은 분산 컴퓨팅 기반의 데이터 위변조 방지 기술로써, 데이터를 '블록' 단위로 관리합니다. 블록체인 기술은 분산되고, 독립적인 데이터 관리를 가능하도록 도와주며, 네트워크에 연결된 모든 사용자들이 블록체인 데이터의 변경 결과를 열람할 수 있으며, 합이 알고리즘에 의해 새롭게 추가되는 블록의 검증이 이루어지고, 검증된 블록만들 기존의 블록체인에 연결하여 데이터 위변조를 방지할 수 있게됩니다. 즉 블록체인 기술은 분산되고 독립적인 공통 장부(원장, Ledger) 관리 기술이라고 할 수 있습니다.


비트코인 시스템은 블록체인 기술을 통해 순수하게 사용자들로만 이루어진, 그리고 조작이나 통제가 불가능한 금융 시스템을 만들 수 있게 되었습니다.


'블록(Block)'


블록은 블록체인의 원소 개념으로, 다수의 트랜잭션(거래 정보)를 가지고 있으며, 데이터 베이스(블록 체인)에 저장하기 위한 데이터 묶음(트랜잭션 묶음)이라고 생각하시면 좋을것 같습니다. 블록의 이름은 Height(높이)라는 용어로 불리며, 블록체인을 길게 이어진 수평선으로 보는 것이 아니라 한 칸 한 칸 쌓아나가 탑의 형태로 구성된다고 생각하여 Height(높이)라는 말을 쓴다고 합니다. 하지만 이 이름은 정확한 블록의 이름이 아니며, 블록의 정확한 이름은 블록의 식별자 역할을 수행하는 블록의 해시 값입니다.

비트코인 시스템에 적용된 블록체인의 '블록'은 평균 10분에 한번식 생성될 수 있도록 설게되었으며, 블록의 크기는 1MB로 약 1800 - 4200건의 거래내역을 담을 수 있습니다. 비트코인의 블록체인에 저장되는 '블록'은 크게 블록 헤더정보와, 블록 바디정보로 구분할수있습니다.

블록 헤더 : 블록 헤더는 전반적인 블록의 상태 정보를 나타내며, 버전(Version), 이전 블록 해시(Previous block hash), 머클 루트(Merkle Root), 타임(Time), 난이도 목표(bits), 논스(Nonce) 정보로 구성됩니다.

블록 바디 : 블록 바디에는 다수의 거래 정보(트랜잭션)로 구성됩니다.



'블록 해시(Hash of the block)'


블록 해시는 블록의 식별자 역할을 수행하며, 블록 헤더 정보인 버전, 이전 블록 해시, 머클 루트, 타임, bits, 논스정보를 각 표현식에 맞게 변경한 후 합산하여 SHA256 해시함수를 통해 출력된 결과 값입니다,



'버전'


비트코인 네트워크의 버전 정보를 의미합니다. 해당 블록이 생성되는 시점에서 네트워크에서 사용되었던 버전 정보를 기록합니다.


'이전 블록 해시(Previousblockhash)'


블록체인의 자료구조는 링크트 리스트 형태로 구성됩니다. 블록이 생성되는 시점에서 이전 블록의 정보를 참조하여 블록이 체인 형태로 연결될 수 있도록 도와주는 역할을 수행합니다.



위의 그림처럼 각 블록의 헤더 정보에는 이전 블록의 해시정보를 가지고 있습니다. 각 블록이 이전 블록의 해시 정보를 가지고 있기 때문에 각 블록이 서로 서로 연결되어 있는 구조가 될 수 있습니다.


'머클 루트(Merkle Root)'


'머클 루트'는 블록의 바디 부분에 저장된 트랜잭션(거래 정보) 들의 해시 트리라고 생각하시면 되겠습니다. 각 트랜잭션과 가까운 노드 끼리 쌍을 지어 해시 값을 구하여 최종적으로 구해진 해시 값이 머클루트 해시 값이 되겠습니다.

머클루트의 역할은 아래와 같습니다.

  1. '머클루트'(머클해시)값을 통해 단일 블록 내에 존재하는 트랜잭션의 무결성을 검증할 수 있다.

  2. '머클루트'(머클해시)값을 이용하여 블록의 해시 값을 생성하였기 때문에 블록의 해시의 무결성도 함께 검증할 수 있다.

쉽게 말해 해당 블록이 유효한지에 대한 무결성을 검증하기 위한 요소가 머클루트 혹은 머클해시라는 구성요소입니다.


'타임(Time)'


해당 블록의 대략적인 생성 시간을 의미합니다. 타임 스탬프는 유닉스 기준일 자로 표시되며 1970년 1월 1일 자정부터 경과한 시간을 초 단위로 계산한 값입니다.


'bits'


bits는 난이도 해시 목표 값을 의미하는 지표입니다. 이 부분에 대해서는 마이닝 즉 채굴이 어떻게 이루어지는지에 대한 포스팅에서 자세히 다루도록 하겠습니다.


'Nonce'


난스는 블록을 만드는 과정에서 해시 값을 구할 때 필요한 재료 역할을 수행합니다. 이 부분에 대해서도 채굴과 관련된 포스팅에서 자세히 다루도록 하겠습니다.


이것으로 비트코인의 블록체인 기술 및 구성요소에 대한 시간을 마치도록 하겠습니다. 각 구성요소에 대한 자세한 내용은 추후 개별 포스팅을 통해 심도있게 다루겠습니다.

긴글 읽어주셔서 정말 감사합니다!


[참고 사이트]


https://steemit.com/kr/@jsralph/merkle-trees

https://steemit.com/kr/@feyee95/1-1

https://commons.wikimedia.org/wiki/File:Bitcoin_block_structure.svghttp://hanaloum.blogspot.kr/2014/06/block-1_9584.htmlhttps://www.slideshare.net/YechanAn/blockchain-77203988http://blog.naver.com/PostView.nhn?blogId=renucs&logNo=220958282185&parentCategoryNo=&categoryNo=36&viewDate=&isShowPopularPosts=false&from=postViewhttps://homoefficio.github.io/2016/01/23/BlockChain-%EA%B8%B0%EC%B4%88-%EA%B0%9C%EB%85%90/http://privacy.jiransoft.co.kr/%EB%B9%84%ED%8A%B8%EC%BD%94%EC%9D%B8%EA%B3%BC-%EB%B8%94%EB%A1%9D%EC%B2%B4%EC%9D%B8%EA%B8%B0%EC%88%A0/https://brunch.co.kr/@ppineapple17/1


안녕하세요. 어미새입니다.


이전 블록체인 포스팅에서 합의 문제, 합의 알고리즘에 대해서 알아봤습니다. 블록체인에서 합의 알고리즘이란 어떤 방식으로 블록을 생성해 낼 것이며, 어떤 블록이 '진짜'인지 판별하기 위한 알고리즘이라고 설명해드렸습니다. 좀 더 구체적으로 설명을 해드리자면 블록체인을 조작할 수 없어야 하고어떤 블록이 유효한지 확인할 수 있는 메커니즘이 필요합니다. 이러한 과정을 검증하는 메커니즘이 합의 프로토콜, 합의 알고리즘이라고 생각하시면 됩니다. 또한 합의 알고리즘은두 개의 유효한 블록체인이 생성됐을 때 하나를 선택하는 방법도 필요합니다.


이번 포스팅에서는 '해시함수'란 무엇이고 블록체인에서 '해시함수'는 어떤 역할을 수행하는지에 대해 알아보도록 하겠습니다.('해시함수'의 특징 및 역할은 추후 블록 구성요소에 대해 학습하기 위해서 반드시 개념을 알고 넘어가야합니다.)


해시 함수란 무엇인가?


해시함수는 메시지의 오류나 변조를 쉽고 빠르게 탐지할 수 있습니다. 또한, 데이터의 무결성을 제공하기 위해 사용되며, 매우 빠른 데이터 검색을 위한 소프트웨어에서도 널리 사용됩니다. 비트코인에서는 SHA-256 방식의 해시 함수를 사용하고 있습니다. 해시함수는 아래와 같은 특징을 가지고 있습니다.


해시 함수의 특징


  1. 어떤 입력 값에도 항상 고정된 길이의 해시 값을 출력한다.

  2. 입력 값의 아주 일부만 변경되어도 전혀 다른 결과 값을 출력한다.(눈사태 효과)

  3. 출력된 결과 값을 토대로 입력 값을 유추할 수 없다.

  4. 입력 값은 항상 동일한 해시 값을 출력한다.


SHA(Secure Hash Algorithm)


해시(Hash)의 종류에는 MD 알고리즘 및 SHA 알고리즘이 있습니다. 이번 포스팅에서는 비트코인에서 사용되는 알고리즘인 SHA256 함수에 대해서 알아보도록 하겠습니다. SHA(Secure Hash Algorithm)알고리즘은 미국 NSA에 의해 만들어졌습니다. 160비트의 값을 생성하는 해시 함수로, MD4가 발전한 형태입니다. MD5보다 조금 느리지만 좀 더 안전한 것으로 알려져 있으며, SHA에 입력하는 데이터는 512비트 크기의 블록이며 알고리즘의 동작원리는 아래 그림과 같습니다.



SHA 알고리즘은 크게 SHA-1과 SHA-2로 나눌 수 있으며 종류에 따른 성능은 아래의 표와 같습니다.



간다한 실습을 통해 해시 함수의 특징을 이해 해보도록 하겠습니다. 먼저 아래의 사이트는 입력 값을 SHA256 방식으로 변환해주는 사이트입니다.


사이트에 접속하시면 아래의 그림과 같은 화면이 있습니다, 상단의 입력박스에 해시하고자하는 입력 값을 누른 후 파란색 버튼인 'SHA256 해시를 생성!' 버튼을 누르면 입력값을 해시 값으로 변경하여 결과 값이 출력됩니다.



위의 사이트를 활용하여 앞서 설명한 해시 함수의 특징을 살펴보겠습니다.


  1. 어떤 입력 값에도 항상 고정된 길이의 해시값을 출력한다.

위의 특징은 다시 말해서 입력 값의 길이와 상관 없이, 즉 책 한권의 분량의 데이터를 넣어도, 몇 글자 되지 않은 작을 글자를 넣어도 같은 결과가 나온다는 의미입니다. 먼저 어미새라는 짧은 문자열을 입력한 후 결과 값을 확인해 보겠습니다.



위의 그림과 같이 결과 값은 256비트(32바이트) 데이터의 길이로 결과 값이 출력되는 것을 확인 할 수 있었습니다. 그럼 이번에는 아주 긴 문자열을 넣어보도록 하겠습니다.



위의 그림과 같이 입력 값의 길이가 길어도 고정된 길이인 256비트의 길이로 결과 값이 출력되는 것을 확인할 수 있습니다. 즉 입력 길이에 상관없이 항상 고정된 문자열의 길이를 반환하는 특징을 확인할 수 있습니다. 그렇다면 이러한 특징을 어떻게 활용할 수 있을까요? 이 부분에 대한 설명을 하기 위해서는 먼저 해시 함수의 두 번째 특징인 눈사태 효과에 대한 설명이 필요합니다.


2.눈사태 효과 : 입력 값의 아주 일부만 변경되어도 전혀 다른 결과 값을 출력한다.


눈 사태 효과는, 입력 값의 아주 일부만 변경되어도 전혀 다른 결과 값을 출력하는 특징입니다. 먼저 Hello word라는 단어를 입력하고 결과 값을 출력해보겠습니다.



Hello word의 결과 값은 위의 그림과 같이 256비트의 고정된 길이의 결과 값 AEA1D1146A00E1C55E49C7837C224ECFB76CA0337FD4BB6DC09E892CA0190119이 출력되는것을 확인할 수 있었습니다. 이번에는 마지막에 s를 추가하여 Hello words를 입력하고 결과 값을 출력해보겠습니다.



Hello wordHello words는 단어 한글자 차이지만 아래처럼 전혀 다른 결과 값이 출력되는것을 확인할 수 있었습니다.

1번 결과 : AEA1D1146A00E1C55E49C7837C224ECFB76CA0337FD4BB6DC09E892CA0190119

2번 결과 : 1FCBB61355A529153565A480CA98017D9FD97DD38B0C2CBE3EA56E68F3BC8745


입력 값의 아주 일부만 변경되어도 전혀 다른 결과 값이 출력됩니다, 입력 값의 일부만 변경되었을 뿐인데 이렇게 전혀 다른 값으로 출력 된다면 출력된 결과 값을 토대로 입력값을 유추하는건 불가능할겁니다.


그럼 아주 방대한 데이터의 내용이 변경되었는지 확인하는 과정이 있다고 생각해봅시다. 데이터가 변경되었는지 한 글자 한 글자식 비교한다면 아주 오랜 시간이 소요될겁니다. 하지만 해시함수를 이용한다면 어떤 길이의 입력값이라도 256비트의 고정된 결과값을 출력할 것이고 입력값의 아주 일부만 변경되어도 전혀 다른 값이 출력되는 특징 때문에 데이터가 변경되었는지 쉽게 확인할 수 있습니다.


추가적으로 해시함수는 입력된 값이 같을 경우 항상 같은 결과 값을 출력해야합니다. 입력된 값은 같으나 다른 결과가 나온다면 데이터의 무결성을 검증할 수 없겠죠?

입력된 결과 값은 다르지만 같은 결과 값이 출력될 경우가 있습니다. (이련 경우는 아주~ 아주~~~ 희박하다고 합니다.) 입력 값이 다르지만 같은 결과 값이 출력되는 경우를 충돌이라고 표현하며, 충돌이 적은 해시함수가 좋은 해시함수가 되겠습니다.


이상으로 간단한 해시 함수의 정의와, 해시함수의 특징에 대해 알아봤습니다. 긴 글 읽어주셔서 감사합니다!



[참고 사이트]

https://blog.iwanhae.ga/introduction_of_bitcoin/

https://steemit.com/kr/@twinbraid/2b3hcu

http://www.convertstring.com/ko/Hash/SHA256

https://seed.kisa.or.kr/iwt/ko/intro/EgovHashFunction.do


탈중앙화 Application(DApp)


  1. 백엔드가 탈중앙화된 피어 투 피어(Peer-to-Peer) 네트워크에서 동작.

  2. 소스가 오픈 소스인 일종의 인터넷 애플리케이션.

  3. 어떠한 단일 노드도 탈중앙화 애플리케이션(DApp)에 대한 제어권을 가질 수 없음.


DApp은 기본적으로 피어 투 피어 네트워크에서 동작하기 때문에 인터넷에 연결된 어떤 컴퓨터라도 피어가 될 수있으므로 애플리케이션 데이터를 잘못된 값으로 변경하거나 다른 피어들과 올바르지 않은 정보를 공유하는 피어를 찾아내고 방지하는 것이 큰 도전 과제입니다.

피어가 발행한 정보가 올바른지 검증하기 위한 방법이 일종의 합의 프로토콜, 합의 알고리즘 입니다. 여기서 이야기하는 합의 프로토콜, 합의 알고리즘은 P2P 네트워크(분산시스템)의 신뢰도를 보장하기 위해서 나온 알고리즘이며, 합의 문제는 블록체인 나오기 전부터 존재하던 개념입니다. 그럼 가장먼저 합의 문제에 대해 간략하게 알아보도록 하겠습니다.


합의 문제(Consensus Problem)


P2P 네트워크와 같이 정보 도달에 시간차가 있는 네트워크에서 참가자가 하나의 결과에 대한 합의를 얻기 위한 알고리즘입니다.

예를 들어 분산 컴퓨팅으로 이루어진 비행기 예매 시스템에 합의 알고리즘이 없다고 가정해봅시다. 손님 A와 손님 B가 같은 자리 a를 동시에 예매했을 경우 합의 알고리즘이 없다면 들어온 시스템에 따라 자리 a를 예매한 사람이 달라지게 됩니다. 이런 시스템 오류와 무결성을 보장하기 위하여 합의 문제를 해결하는 합의 알고리즘이 생겨났습니다.



블록체인 합의 문제


전 재산 1,000원을 가지고 있는 A가 B와 C에게 동시에 1,000원을 송금한다는 메시지를 보냈을 경우 블록체인 시스템에서 합의를 하지 못하면 큰 문제가 생길 수 있습니다. 블록체인에서 합의 알고리즘이란 쉽게 말해 블록체인 상에서 의사결정 방식을 의미합니다.

예를 들어 A, B 채굴자가 동시에 블록을 생성했다면, 어느 블록이 진짜 블록이라고 부를 수 있을까? 만약 중앙집권적인 기관이었다면 전부 통제가 가능하기 때문에 두 개의 블록이 생성되지 않았을 뿐만 아니라 설사 생성된다 하더라도, 블록체인을 운영하는 중앙기구에서 어떤 블록이 진짜인지 선택하면 문제는 해결됩니다.

하지만 탈 중앙화된 블록체인에서는 해당 의사결정을 해 줄 사람이 없기 때문에 이를 결정할 어떤 과정이 필요한 것입니다. 이때 등장한 것이 바로 합의 알고리즘이라고 생각하시면 되겠습니다.

블록체인 기술에서 대표적으로 사용하는 합의 알고리즘에는 비트코엔이서 사용되는 PoW(Proof of Work), 이더리움이 지향하려고 하는 PoS(Proof of Stake), EOS에서 사용되는 DPoS(Delegated Proof of Stake)등이 있습니다.


긴글 읽어주셔서 감사합니다!



[자료 출처]https://blog.theloop.co.kr/category/%ED%95%A9%EC%9D%98/https://blog.naver.com/zeigal/221189671484https://bismart.com/en/best-text-analytics-systems/아이리포 - 블록체인 합의 알고리즘 편




 


안녕하세요. 어미새입니다.


이더리움 백서를 쉽게 이해할 수 있도록 풀어서 설명하는 연재물을 작성하고 있습니다. 지난 포스팅을 읽지 못하셨던분은 먼저 아래의 포스팅을 읽어보시는것을 추천드립니다.



Remind


비트코인 시스템은 이세상에 없던 기술들을 총 집합하여 탄생한것이 아니라 아주 오래전부터 그와 관련된 이론들과 논의들이 있었다는 내용과, 비트코인이 어떤 의미에서 혁신적이었는지에 대한 내용을 다뤘으며, 작업 증명 방식, 지분 증명 방식의 두가지 합의 알고리즘을 언급함으로써 이더리움에 시작은 작업 증명 방식으로 이루어지나 추후 지분 증명 방식으로 변화할것을 암시하였습니다.

또한, 기존의 비트코인 시스템에서 사용되는 '상태(State)'와 '상태 변환 함수(state transition function)'에 대한 개념에 대하여 먼저 설명한 후 이더리움에서는 이 부분을 어떻게 수정할지에 대한 내용을 다루게됩니다.


채굴


[출처 : 이더리움 백서(링크)]


앞서 언급한 내용들을 중앙 집권화된 서비스 방식으로 구현하자면 매우 간단한 일입니다. 그 이유는 중앙 서버에 상태 변화과정을 저장하고 관리하면 어렵지 않게 구현할 수 있습니다.

하지만 탈 중앙화된 통화 시스템을 구축하기 위해서는 분산 합의 과정이 필요하고, 네트워크가 정상적으로 유지될 수 있도록 도와주는 노드들이 필요합니다. 또한, 이 노드들은 "블록(blocks)"이라 불리는 트랜잭션 패키지를 계속적으로 생성하고 합의하는 역할을 수행해야합니다.

비트코인 네트워크는 약 10분에 한번식 하나의 블록을 생성하도록 계획되었고, 각 블록은 타임스탬프, 논스(nonce), 이전 블록에 대한 참조(이전 블록의 해시), 그리고 이전 블록 이후에 발생한 모든 트랜잭션의 목록을 포함합니다. 이 과정을 통해서 지속적으로 성장하는 블록체인이 생성되며, 비트코인 장부의 최신상태(state)를 나타내기 위해 지속적인 업데이트가 이루어져야합니다.


생성된 블록이 유효한지 아닌지를 확인하기 위한 알고리즘은 아래와 같습니다.


  1. 생성된 블록에 참조되는 이전 블록이 실제 존재하는 블록인지, 유효한지 확인한다.

  2. 타임 스탬프 값이 이전 블록의 타임스탬프 값보다 큰 값인지 확인한다, 만약 크다면 2시간 이내인지 확인한다.

  3. 작업증명(proof of work)이 유효한지 확인한다. (새로운 블록을 찾는 과정이 유효했는지에 대한 검증)

  4. S[0]를 이전 블록의 마지막 상태(state)가 되도록 설정한다.

  5. TXn개의 트랜잭션을 가지는, 블록의 트랜잭션 목록으로 가정한다. 폐구간 0...n-1의 모든 i에 대해, S[i+1] = APPLY(S[i], TX[i])집합 중 어느 하나라도 에러를 리턴하면 거짓(false)을 리턴하며 종료한다.

  6. 참(true)을 리턴하고, S[n]를 이 블록의 마지막 상태로 등록한다.


1 ~ 3번 과정은 새로운 블록에 대한 유효성 검증이며, 4 ~ 6번 과정은 지난 이더리움 백서 1편에서 언급한 비트코인의 상태 변화 시스템에 대한 내용입니다.

가장 최근의 블록의 상태 정보를 가져오고, 현재 블록에 있는 트랜잭션 목록들에 대한 유효성을 점검한 후 상태 정보를 업데이트한다고 생각하시면 쉬울것 같습니다. 이 과정이 이해가 되지 않으시다면 1편에서 설명한 상태 변화 시스템에 대한 내용을 다시 읽어보시면 좋을것 같습니다.


기본적으로 블록의 트랜잭션들은 유효한 상태변환을 진행해야합니다. 여기서 유심있게 살펴봐야하는점은 블록내에 어떠한 방법으로도 상태정보가 기록되지 않았다는 점을 주목해야합니다. 상태는 유효성을 검증하는 노드가 매번 계산해서 기억해야 하는 추상적(abstaction)인 개념이며, 이것은 원시 상태(genesis state), 즉 제네시스 블록으로 부터 현재 블록까지의 모든 트랜잭션을 순차적으로 적용함으로 계산할 수 있습니다.

채굴자(마이너)가 블록에 포함시키는 트랜잭션의 순서를 주목해보겠습니다. 만약 어떤 블록에 A와 B라는 트랜잭션이 있다고 가정해보겠습니다. 그리고 B의 트랜잭션은 A의 UTXO를 소비한다고 가정했을 경우 B는 A의 UTXO 정보가 필요하기 때문에 반드시 A의 트랜잭션이 먼저 블록에 담겨 있어야합니다. 만약 트랜잭션 A가 먼저 블록에 담겨 있지 않을 경우 B는 존재하지 않은 트랜잭션 A의 UTXO 정보를 사용하게됨으로 해당 블록의 유효성이 보장되지 않습니다. (즉 블록의 트랜잭션을 어떤순서로 담느냐에 따라 블록이 유효할수도, 유효하지 않을수도 있다는 의미입니다.)



 


블록 유효성 검증 알고리즘에서 "작업증명(proof of work)"의 조건은 256비트 숫자로 표현되는 블록의 이중-SHA256 해시 값이 동적으로 조정되는 목표값 보다 반드시 작아야 된다는 조건입니다. (비트코인 마이닝편 참조)

작업 증명의 목적은 블록 생성을 계산적으로 어렵게 만들어서 sybil 공격자들이 마음대로 전체 블록체인을 조작하는 것을 방지하기 위함입니다. SHA256 함수는 예측 불가능한 유사난수 함수(pseudorandom function)로 설계되어 있기 때문에 유효 블록을 생성하기 위한 유일한 방법은 블록 헤더의 논스(nonce) 값을 계속 증가시키면 블록 해시 값이 목표값 보다 작은지에 대한 검증을 반복하는 방법밖에 없습니다.

현재 목표 값인 2187(이더리움 백서 작성 시간 기준)에서 하나의 유효블록을 발견하기 위해서는 평균적으로 264번의 시도를 해야합니다. 네트워크는 평균적으로 10분마다 새로운 블록이 생성될 수 있도록 2016개의 블록마다 목표 값을 변경하게됩니다.

채굴자들은 이러한 연산 작업에 대한 보상으로 25 BTC(이더리움 백서 작성 시간 기준)를 획득할 자격을 가지게 되며, 출력 금액보다 입력 금액이 큰 트랜잭션이 있다면 그 차액을 "트랜잭션 수수료(transaction fee)"로 얻게 됩니다. 이러한 과정이 비트코인이 발행되는 유일한 방법이며, 원시 상태(genesis state)에는 아무런 코인이 포함되어 있지 않습니다.

채굴 목적에 대한 이해를 위해 악의적인 공격자가 있을 떄 어떤 일이 발생하는지 생각해보겠습니다. 일반적으로 비트코인의 뼈대를 이루는 암호기법은 안전한 것으로 알려져 있습니다. 그렇기 때문에 공격자는 비트코인 시스템에서 암호 기법에 의해 직접적으로 보호되지 않는 부분인 '트랜잭션 순서'를 공격 목표로 잡을것입니다.


  1. 어떤 상품(가급적이면 바로 전달되는 디지털 상품)을 구매하기 위해 판매자에게 100 BTC를 지불한다.

  2. 상품이 전송되기를 기다린다.

  3. 판매자에게 지불한 것과 같은 100 BTC를 공격자 자신에게 보내는 트랜잭션을 생성한다.(이중지불 시도)

  4. 비트코인 네트워크가, 공격자 자신에게 보내는 트랜잭션이 판매자에게 지불하는 트랜잭션보다 먼저 수행된 것으로 인식하도록 한다.


1번 과정이 발생하고 몇 분 후에 몇몇 채굴자들이 해당 트랜잭션을 블록에 포함하게됩니다. 그리고 이 블록 번호를 270000 이라고 가정해보겠습니다. 블록은 10분에 한번식 생성되기 때문에 대략 1시간 후에는 이 블록 다음의 체인에 5개의 블록들이 추가될 것입니다. 트랜잭션이 포함된 블록 이후 5개의 블록들이 연결되었기 때문에 컨펌(confriming)되었다고 생각할 수 있으며, 이 시점에서 판매자는 BTC 지불이 완료된 것으로 판단하고 상품을 전송하게됩니다. (상품은 디지털 상품으로 가정하에 전송하는 순간 상품을 받았다고 가정합니다.)

이제 공격자는 판매자에게 보낸 것과 동일한 100 BTC를 공격자 자신에게 보내는 트랜잭션을 생성합니다. 이때 만약 공격자가 그냥 단순하게 트랜잭션을 시도한다면, 채굴자들이 채굴자들이 APPLY(S,TX)를 실행하여 해당 트랜잭션(TX)은 더이상 존재하지 않는 UTXO를 소비하는 행위인것을 알게되고, 해당 트랜잭션은 진행되지 않습니다.

그렇기 때문에, 공격자는 판매자에게 보낸 시점의 이전 블록인 269999 블록으로 되돌아가 공격자 자신에게 보내는 트랜잭션을 포함한 270000 블록을 생성하여, 블록체인 "분기점(fork)"을 생성합니다.

비트코인 네트워크는 가장 긴 블록체인을 참으로 인식하기 때문에 메인 블록체인에 이미 연결된 270005번 블록까지 조작해야합니다. 그렇기 때문에 공격자는 자신의 체인을 가장 길게 만들기 위해서 네트워크에 연결된 다른 노드들의 계산능력 조합보다 더 큰 계산 능력을 가져야합니다. (이를 51% attack이라 한다.)


Think


오늘 이더리움 백서 번역본에서는 비트코인의 채굴 방식과, 공격 방식에 대한 설명 부분에 대해서 다뤘으며, 백서 후반부에서 이더리움에서는 어떠한 방식의 채굴 방식을 선택할 것이고 공격자의 공격을 어떻게 막을것인지에 대한 이야기가 진행됩니다.

지난 포스팅에서도 잠간 언급되었지만, 탈 중앙화된 암호화폐는 어느 한순간에 나온 개념이 아니며, 아주 오래전부터 연구되어왔던 내용들을 비트코인에서 처음으로 구현하게된것입니다. 그렇기 때문에 블록체인의 개념을 한단어로 정의하기 어렵고, 내용이 방대하여 학습에 어려움이 있는것 같습니다.

하지만 하나식 천천히 반복적으로 뜯어서 학습을 진행하게되면 이해하는데 어려움이 없을것이라고 생각합니다. 이더리움에 대한 명확한 이해를 하기 위해서는 필수적으로 비트코인에 대한 이해가 선행되어야한다고 생각합니다. 오늘 포스팅에서 언급된 내용들에 대한 내용들은 비트코인 포스팅에서 설명한 내용들과 상당히 겹치는 부분들이 많습니다. 혹시 오늘 포스팅이 이해가 되지 않으셨던분들은 비트코인 마이닝 과정, UTXO, 51% acttact에 대한 내용들을 읽어보시면 좋을것 같아서 링크를 남겨두도록 하겠습니다.




오늘은 이더리움 백서부분에 대한 해석을 여기까지만 하도록 하겠습니다, 본격적인 이더리움에 대한 설명은 머클트리, 블록체인 기술을 이용한 사례, 스크립팅에 대한 챕터 이후 설명이 시작됩니다.

조금은 이전 비트코인 포스팅과 겹치는 부분이 있어서 이더리움을 공부하기 위해 들어오신분들에겐 답답한 마음이 생길 수 있을것 같으나, 비트코인을 변형하여 만들어진 플랫폼이다보니 그 만큼 비트코인에 대한 설명이 중요하다고 생각합니다. (백서의 흐름대로 학습해야지 나중에 더욱더 이해하기 쉽다고 생각합니다.)

혹시 이더리움 백서를 먼저 읽어보고 싶은 분을 위해 이더리움 백서 링크를 첨부해 드립니다.



 

이상 긴 글 읽어주셔서 감사합니다!



[참고문헌]

https://github.com/ethereum/wiki/wiki/%5BKorean%5D-White-Paper#%EC%83%81%ED%83%9C%EB%B3%80%ED%99%98%EC%8B%9C%EC%8A%A4%ED%85%9C%EC%9C%BC%EB%A1%9C%EC%84%9C%EC%9D%98-%EB%B9%84%ED%8A%B8%EC%BD%94%EC%9D%B8bitcoin-as-a-state-transition-system

https://github.com/ethereum/wiki/wiki/White-Paper

'이더리움 > 이더리움(백서)' 카테고리의 다른 글

이더리움 백서(6편)  (0) 2018.04.12
이더리움 백서(5편)  (0) 2018.04.11
이더리움 백서(3편)  (0) 2018.04.10
이더리움 백서(1편)  (0) 2018.04.06
이더리움 개요  (0) 2018.04.05

+ Recent posts