Чрезвычайно редкие модели неравновесия по сцеплению в исследованиях ассоциаций с разнообразными предками.
Природная генетика (2023)Процитировать эту статью
293 Доступа
30 Альтметрика
Подробности о метриках
Неравновесие по сцеплению (LD) — это корреляция между близлежащими генетическими вариантами. В исследованиях генетических ассоциаций ЛД часто моделируется с использованием больших корреляционных матриц, но этот подход неэффективен, особенно в исследованиях разнообразия предков. В настоящем исследовании мы представляем графические модели LD (LDGM), которые представляют собой чрезвычайно разреженное и эффективное представление LD. LDGM происходят из генеалогий всего генома; статистические отношения между аллелями в LDGM соответствуют генеалогическим отношениям между гаплотипами. Мы опубликовали LDGM и прецизионные матрицы LDGM для конкретных предков для 18 миллионов распространенных вариантов (частота второстепенных аллелей > 1%) в пяти группах предков, подтвердили их точность и продемонстрировали улучшение времени выполнения на порядок величины для часто используемых вычислений матрицы LD. Мы реализовали чрезвычайно быстрый метод полигенного прогнозирования множественных предков, BLUPx-ldgm, который работает лучше, чем аналогичный метод, основанный на эталонной корреляционной матрице LD. LDGM позволят использовать сложные методы, которые будут масштабироваться для получения разнообразных данных о генетических ассоциациях предков среди миллионов вариантов и людей.
Это предварительный просмотр контента подписки, доступ через ваше учреждение.
Доступ к журналу Nature и 54 другим журналам Nature Portfolio.
Приобретите Nature+, нашу выгодную подписку с онлайн-доступом.
29,99 долларов США / 30 дней
отменить в любое время
Подпишитесь на этот журнал
Получите 12 печатных выпусков и онлайн-доступ.
189,00 долларов США в год
всего $15,75 за выпуск
Возьмите напрокат или купите эту статью
Цены варьируются в зависимости от типа статьи
от$1,95
до $39,95
Цены могут зависеть от местных налогов, которые рассчитываются во время оформления заказа.
LDGM, прецизионные матрицы LDGM и древовидные последовательности доступны в Zenodo (ссылка 84; https://doi.org/10.5281/zenodo.8157131). Данные о поэтапных генотипах 1000 геномов с высоким охватом доступны по адресу http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20201028_3202_phased. Независимые от LD блоки доступны по адресу https://github.com/jmacdon/LDblocks_GRCh38. Сводные статистические данные Биобанка Великобритании и LD доступны по адресу s3://broad-alkesgroup-ukbb-ld/UKBB_LD/. Состояния предков доступны через выпуск Ensembl 100 и могут быть загружены с ftp://ftp.ensembl.org/pub/release-100/fasta/ancestral_alleles (ссылка 83).
Мы выпустили пакет программного обеспечения с открытым исходным кодом ldgm v.0.1, реализованный на Python и MATLAB. ldgm позволяет делать выводы из LDGM и прецизионных матриц LDGM, а также проводить эффективный в вычислительном отношении анализ сводной статистики GWAS с использованием LDGM. Он доступен по адресу https://github.com/awohns/ldgm и хранится в Zenodo85 (https://doi.org/10.5281/zenodo.8161389). Все функции анализа сводной статистики GWAS с помощью LDGM, включая BLUPx-ldgm, в настоящее время реализованы в MATLAB; планируется реализация Python. BLUPx-ldgm также реализован в bcftools, доступном по адресу https://github.com/freeseek/score; tskit доступен по адресу https://github.com/tskit-dev/tskit. Скрипты для воспроизведения результатов этой рукописи доступны по адресу https://github.com/awohns/ldgm_paper.
Международный консорциум HapMap. Гаплотипическая карта генома человека. Природа 437, 1299–1320 (2005).
Статья в Академии Google
Райх, Д.Э. и др. Неравновесие по сцеплению в геноме человека. Природа 411, 199–204 (2001).
Статья CAS PubMed Google Scholar
Абекасис, GR и др. Степень и распределение неравновесия по сцеплению в трех геномных регионах. Являюсь. Дж. Хум. Жене. 68, 191–197 (2001).
Статья CAS PubMed Google Scholar
Финукейн, Гонконг и др. Разделение наследственности с помощью функциональной аннотации с использованием сводной статистики ассоциаций по всему геному. Нат. Жене. 47, 1228–1235 (2015).