Первый проект полного генома человека опубликован в журнале Nature.

Геном человека представляет собой полный набор последовательностей нуклеиновых кислот человека, закодированных в виде ДНК в 23 парах хромосом в ядрах клеток и в небольшой молекуле ДНК, обнаруженной в отдельных митохондриях. Их обычно рассматривают отдельно как ядерный геном и митохондриальный геном. Геномы человека включают как гены ДНК, кодирующие белки, так и некодирующие ДНК. Гаплоидные геномы человека, содержащиеся в зародышевых клетках (яйцеклетки и гаметы сперматозоидов, созданные в фазе мейоза полового размножения до того, как в результате оплодотворения образуется зигота), состоят из трех миллиардов пар оснований ДНК, в то время как диплоидные геномы (обнаруженные в соматических клетках) имеют вдвое содержание ДНК. Хотя между геномами людей существуют значительные различия (порядка 0,1% из-за однонуклеотидных вариантов и 0,6% из-за вставок), они значительно меньше, чем различия между людьми и их ближайшими живыми родственниками, бонобо и шимпанзе (~ 1,1% фиксированных однонуклеотидных вариантов и 4% при включении инделей). Хотя последовательность генома человека была (почти) полностью определена секвенированием ДНК, она еще не полностью понята. Большинство (хотя, вероятно, не все) генов были идентифицированы с помощью комбинации высокопроизводительных экспериментальных и биоинформатических подходов, однако еще предстоит проделать большую работу для дальнейшего выяснения биологических функций их белков и РНК-продуктов. Недавние результаты показывают, что большая часть огромных количеств некодирующей ДНК в геноме связана с биохимической активностью, включая регуляцию экспрессии генов, организацию архитектуры хромосом и сигналы, контролирующие эпигенетическое наследование.

До получения полной последовательности генома оценки количества генов человека варьировались от 50 000 до 140 000 (иногда неясно, включали ли эти оценки гены, не кодирующие белок). По мере улучшения качества последовательности генома и методов идентификации генов, кодирующих белок, количество распознанных генов, кодирующих белок, сократилось до 19 000–20 000. Однако более полное понимание роли, которую играют последовательности, которые не кодируют белки, а вместо этого экспрессируют регуляторную РНК, увеличило общее количество генов как минимум до 46 831 плюс еще 2300 генов микроРНК. К 2012 году были отмечены функциональные элементы ДНК, которые не кодируют ни РНК, ни белки. Опрос населения 2018 года обнаружил еще 300 миллионов оснований генома человека, которых не было в эталонной последовательности. Последовательности, кодирующие белок, составляют лишь очень небольшую часть генома (примерно 1,5%), а остальная часть связана с некодирующей РНК. гены, регуляторные последовательности ДНК, LINE, SINE, интроны и последовательности, функция которых еще не определена.