과학자들은 DNA 염기 서열에 있는 염기 개수를 뜻하는 베이스페어(bp)라는 단위를 이용해서 DNA의 길이와 유전정보의 양 그리고 염색체의 길이를 표시하고 있다.
염기는 A나 C 또는 G 아니면 T처럼 영어 알파벳 한 글자로 표시되므로 알파벳 한 글자당 한 바이트를 사용하는 컴퓨터에 파일로 저장하면 GATTACA처럼 7개 염기로 구성된 염기 서열의 길이는 7bp가 되고 이를 저장한 컴퓨터 파일의 크기는 7바이트(byte)가 되며, 염기 서열 속 염기 개수에 따라 1,000bp 즉 1킬로베이스페어(Kbp)는 1킬로바이트(Kbyte)가 되고, 100만bp 즉 1메가베이스페어(Mbp)는 1메가바이트(Mbyte)가 된다.
사람의 유전체 정보는 흔히 30억 개의 염기 서열이라고 알려져 있는데, 30억 = 3빌리언(billion) = 3기가로 환산되므로 염색체 길이의 총합은 약 3기가베이스페어(Gbp)가 되고 컴퓨터 파일로 저장하면 약 3기가바이트(Gbyte)가 된다. 물론 사람 세포는 아버지로부터 받은 염색체 3기가와 어머니로부터 받은 염색체 3기가를 함께 가지고 있으므로 실제로는 6기가, 즉 6Gbp 분량의 염색체와 염기 서열이 우리의 유전체 정보가 된다. 주변에서 흔히 보이는 휴대용 USB 메모리 저장 장치 용량이 수십 기가바이트 수준이고 최신 스마트폰의 저장 공간도 수백 기가바이트 수준이라는 점과 비교하면 의외로 무척이나 적은 느낌이 드는 정보량이다.
사람의 가장 큰 상염색체인 1번의 염기 서열 길이는 약 248Mbp이며, 가장 짧은 상염색체인 21번의 염기 서열 길이는 약 48Mbp이고, 두 번째로 짧은 상염색체인 22번의 경우 약 52Mbp이다. 성염색체인 Y의 길이는 약 62Mbp이고, X염색체의 길이는 약 155Mbp이다. 인간 미토콘드리아 염색체의 길이는 코로나19 바이러스 지놈 크기(30Kbp 정도)보다도 적은 약 17Kbp이다.
USB 메모리 안에 저장된 파일들이 손상되는 경우를 일상생활에서 흔히 경험할 수 있듯이 유전체 정보들 역시 생로병사를 거치며 살아가는 과정에서 손상되는 일들이 발생하게 된다. 그 손상이 염색체 수준의 큰 범위일 수도 있고 현미경으로는 보이지 않는 염기 서열 수준의 미세한 정도일 수도 있으며, 때로는 큰 병을 유발할 수도 있고 아니면 별일 없이 넘어가기도 한다. 생명의 설계도 파일에 발생하는 이러한 손상에 대한 연구가 바로 각종 질병 원인을 규명하고 치료하는 첫 단추가 된다.
예컨대 염색체 단위 이상으로 잘 알려진 다운증후군은 세포핵 내에 21번 염색체가 1쌍, 즉 2개가 아닌 3개일 때 생기는 질병으로 신생아 약 700명 중 1명꼴로 발생하는 드물지 않은 질병이다. 염색체 이상 질환들 중에서 가장 먼저 발견되었고 빈도도 가장 높지만 애석하게도 아직까진 치료 방법이 개발되지 않았다.
암을 일으키는 염색체 단위 손상으로 가장 먼저 밝혀진 필라델피아 염색체는 22번과 9번 염색체의 끝부분이 동시에 떨어져 나갔다가 각자 자기의 원래 자리가 아닌 다른 염색체에 가서 잘못 붙으면서 생기는 변종 염색체를 말하는데, 이때 22번 염색체의 BCR이라는 유전자와 9번 염색체의 ABL이라는 유전자가 접합하게 되면 백혈구 세포들은 만성 골수성 백혈병이라는 암을 유발하게 된다. 필라델피아 염색체로 인한 만성 골수성 백혈병을 치료하는 약은 개발되어 있는데, 이 약이 바로 최초의 표적치료 항암제로 유명한 글리벡이다.
일생을 살아가는 동안 사람의 몸을 구성하는 수십조 개의 세포에서 얼마나 많은 손상이 발생하고 있는지 상상해 보면 우리 몸에는 놀라운 수리 능력이 필요하다고 할 것이다. 앞으로도 이러한 능력을 더욱 강력하게 보완해 줄 수 있는 혁신적 신약들이 개발되기를 기대해 본다.