우선 '삼국지연의'라는 작품에 단어가 몇 개나 나오는지 알아야 한다. 몇 가지 다른 버전을 제공하셨는데, 버전마다 큰 차이가 있을 수 있으므로 구체적인 단어 수를 결정해야 합니다.
중간값을 취하고 삼국지의 단어 수를 70만 단어로 설정했다고 가정해보자. 그 다음에는 각 한자가 몇 바이트를 차지하는지 알아야 합니다. 영문자의 경우 일반 텍스트 환경에서 영문자 하나가 1바이트(8비트 이진수)를 차지하는 경우가 많습니다. 그러나 한자를 인코딩하는 방식은 다릅니다. 예를 들어, UTF-8 인코딩에서는 영어 문자나 숫자가 여전히 1바이트를 차지하는 반면, 중국어 문자나 중국어 기호는 3바이트를 차지합니다.
UTF-8 인코딩에서는 한자 70만 개가 210만 바이트를 차지합니다. 200GB 하드 드라이브는 약 20억 4,800만 바이트의 데이터를 저장할 수 있습니다. 따라서 각 한자가 3바이트를 차지한다면 200G 하드 드라이브에는 약 298392934 "삼국지"를 저장할 수 있습니다.
그러나 이는 대략적인 추정일 뿐이며, 버전과 인코딩 방법에 따라 차지하는 공간이 달라질 수 있으므로 주의하시기 바랍니다.