El primer borrador del genoma humano completo se publica en Nature.

El genoma humano es un conjunto completo de secuencias de ácido nucleico para humanos, codificado como ADN dentro de los 23 pares de cromosomas en los núcleos celulares y en una pequeña molécula de ADN que se encuentra dentro de las mitocondrias individuales. Estos generalmente se tratan por separado como el genoma nuclear y el genoma mitocondrial. Los genomas humanos incluyen genes de ADN que codifican proteínas y ADN no codificante. Los genomas humanos haploides, que están contenidos en las células germinales (el óvulo y el espermatozoide creados en la fase de meiosis de la reproducción sexual antes de que la fertilización cree un cigoto) constan de tres mil millones de pares de bases de ADN, mientras que los genomas diploides (que se encuentran en las células somáticas) tienen el doble de el contenido de ADN. Si bien existen diferencias significativas entre los genomas de los individuos humanos (del orden del 0,1 % debido a las variantes de un solo nucleótido y del 0,6 % al considerar los indeles), estas son considerablemente menores que las diferencias entre los humanos y sus parientes vivos más cercanos, los bonobos y chimpancés (~ 1,1% de variantes de un solo nucleótido fijas y 4% cuando se incluyen indeles). Aunque la secuencia del genoma humano se ha determinado (casi) por completo mediante la secuenciación del ADN, aún no se comprende por completo. La mayoría de los genes (aunque probablemente no todos) han sido identificados mediante una combinación de enfoques bioinformáticos y experimentales de alto rendimiento, pero aún queda mucho trabajo por hacer para dilucidar aún más las funciones biológicas de sus productos de proteína y ARN. Los resultados recientes sugieren que la mayoría de las grandes cantidades de ADN no codificante dentro del genoma tienen actividades bioquímicas asociadas, incluida la regulación de la expresión génica, la organización de la arquitectura cromosómica y las señales que controlan la herencia epigenética.

Antes de la adquisición de la secuencia completa del genoma, las estimaciones del número de genes humanos oscilaban entre 50 000 y 140 000 (con vaguedades ocasionales acerca de si estas estimaciones incluían genes que no codifican proteínas). A medida que mejoraba la calidad de la secuencia del genoma y los métodos para identificar genes que codifican proteínas, el número de genes codificadores de proteínas reconocidos se redujo a 19.000-20.000. Sin embargo, una comprensión más completa del papel que desempeñan las secuencias que no codifican proteínas, sino que expresan ARN regulador, ha elevado el número total de genes a al menos 46.831, más otros 2.300 genes de micro-ARN. Para 2012, se han observado elementos de ADN funcionales que no codifican ni ARN ni proteínas. Una encuesta de población de 2018 encontró otros 300 millones de bases del genoma humano que no estaban en la secuencia de referencia. Las secuencias codificantes de proteínas representan solo una fracción muy pequeña del genoma (aproximadamente el 1,5 %) y el resto está asociado con el ARN no codificante. genes, secuencias reguladoras de ADN, LINE, SINE, intrones y secuencias para las que aún no se ha determinado ninguna función.