게놈(genome)이란 유전자(gene) + 염색체(chromosome)의 합성어로 생물에 담긴 유전정보 전체를 의미한다. DNA 는 A, T, G, C 라는 4가지 염기를 가지고 있는데, 사람의 경우 약 30억개의 염기가 존재한다. 복잡하고 다양한 생명현상의 원인과 결과가, 결국 단순한 4가지 염기의 다양한 조합으로 이루어진 염기서열(sequence)에 담겨 있는 것이다. 따라서, 염기서열정보는 개개인의 차이에 대한 이해, 인간질병 예방과 치료, 다양한 생물학적 제품개발을 위한 가장 근본적인 정보인 것이다.

인간게놈프로젝트(human genome project)는 인간의 30억 염기서열을 해독하는 것을 목표로, 1990년 미국과 영국을 주축으로 시작되어 약 13년간 30억달러가 투자된 초대형 국제 과학프로젝트이다. 기존의 생명정보와는 차원이 다른 대용량의 30억 염기서열을 조합하고 분석하기 위해서, 전산과 통계가 반드시 필요했는데, 생물정보학(Bioinformatics)은 바로, 인간게놈프로젝트의 핵심 기술 중 하나였으며, 이 프로젝트를 통해 발전하게 되었다. 생물정보학은 대량의 생명정보로부터 유용한 정보를 뽑아내기 위해 전산알고리즘과 통계이론을 활용하는 학문이다.
생물정보학의 중요성은 갈수록 높아지고 있다. 전통적인 생명현상 연구는 실험을 통해 생산된 소량의 데이터를 다루기 때문에, 일반적으로 분석이 복잡하거나 어렵지 않았다. 하지만, 인간게놈프로젝트 이후의 연구추세는 대량의 유전체정보를 기반으로 진행되고 있으며, 유전자의 기능, 질병의 원인, 개인의 차이, 환경의 영향 등을 유전체적 관점에서 연구하고 해석하는 것이 핵심이 되었다. 뿐만 아니라, 대량의 유전체 데이터를 생산하는 실험법의 획기적인 발달로, 분석해야 하는 정보량은 이전과는 비교할 수 없을 만큼 많아지고, 다양하고, 복잡해졌다. 이는 갈수록 생명현상 연구에 있어 엄청나게 많은 양의 정보를 분석하고, 새로운 형태의 데이터를 이해하고 이를 위한 새로운 분석법을 개발하는 것이 중요한 부분이 되어간다는 것이다. 이러한 생명현상연구 패러다임의 급격한 변화 중심에 생물정보학이 있다.

생물정보학은 다양한 학문이 결합한 융합학문인데, 생물학, 전산, 통계가 가장 큰 부분을 차지하고 있다. 일반적으로 생물학은 연구의 주제를 제공하고, 전산과 통계는 연구를 수행하기 위한 도구로서 활용되고 있다. 하지만, 생물정보에 적합한 전산알고리즘 및 통계기법의 개발 역시 생물정보학의 중요한 연구주제이다. 염기서열을 맵핑하는 알고리즘, 대용량 mRNA 발현 데이터 통계처리법, 암유전체에서 유전자변이를 탐지하는 알고리즘 등이 바로 여기에 속한다. 이외의 대부분의 생물정보학은 개발된 분석기법을 이용하여 유용하고 가치있는 정보를 추출하는 작업이다. 생물정보학과 관련된 모든 연구주제는 주어진 생명정보에 대한 깊이 있는 지식과 이해가 뒷받침될 때, 좋은 결과를 얻을 수 있다.