Чрезвычайно редкие модели неравновесия по сцеплению в исследованиях ассоциаций с разнообразными предками.
ДомДом > Блог > Чрезвычайно редкие модели неравновесия по сцеплению в исследованиях ассоциаций с разнообразными предками.

Чрезвычайно редкие модели неравновесия по сцеплению в исследованиях ассоциаций с разнообразными предками.

Aug 24, 2023

Природная генетика (2023)Процитировать эту статью

293 Доступа

30 Альтметрика

Подробности о метриках

Неравновесие по сцеплению (LD) — это корреляция между близлежащими генетическими вариантами. В исследованиях генетических ассоциаций ЛД часто моделируется с использованием больших корреляционных матриц, но этот подход неэффективен, особенно в исследованиях разнообразия предков. В настоящем исследовании мы представляем графические модели LD (LDGM), которые представляют собой чрезвычайно разреженное и эффективное представление LD. LDGM происходят из генеалогий всего генома; статистические отношения между аллелями в LDGM соответствуют генеалогическим отношениям между гаплотипами. Мы опубликовали LDGM и прецизионные матрицы LDGM для конкретных предков для 18 миллионов распространенных вариантов (частота второстепенных аллелей > 1%) в пяти группах предков, подтвердили их точность и продемонстрировали улучшение времени выполнения на порядок величины для часто используемых вычислений матрицы LD. Мы реализовали чрезвычайно быстрый метод полигенного прогнозирования множественных предков, BLUPx-ldgm, который работает лучше, чем аналогичный метод, основанный на эталонной корреляционной матрице LD. LDGM позволят использовать сложные методы, которые будут масштабироваться для получения разнообразных данных о генетических ассоциациях предков среди миллионов вариантов и людей.

Это предварительный просмотр контента подписки, доступ через ваше учреждение.

Доступ к журналу Nature и 54 другим журналам Nature Portfolio.

Приобретите Nature+, нашу выгодную подписку с онлайн-доступом.

29,99 долларов США / 30 дней

отменить в любое время

Подпишитесь на этот журнал

Получите 12 печатных выпусков и онлайн-доступ.

189,00 долларов США в год

всего $15,75 за выпуск

Возьмите напрокат или купите эту статью

Цены варьируются в зависимости от типа статьи

от$1,95

до $39,95

Цены могут зависеть от местных налогов, которые рассчитываются во время оформления заказа.

LDGM, прецизионные матрицы LDGM и древовидные последовательности доступны в Zenodo (ссылка 84; https://doi.org/10.5281/zenodo.8157131). Данные о поэтапных генотипах 1000 геномов с высоким охватом доступны по адресу http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20201028_3202_phased. Независимые от LD блоки доступны по адресу https://github.com/jmacdon/LDblocks_GRCh38. Сводные статистические данные Биобанка Великобритании и LD доступны по адресу s3://broad-alkesgroup-ukbb-ld/UKBB_LD/. Состояния предков доступны через выпуск Ensembl 100 и могут быть загружены с ftp://ftp.ensembl.org/pub/release-100/fasta/ancestral_alleles (ссылка 83).

Мы выпустили пакет программного обеспечения с открытым исходным кодом ldgm v.0.1, реализованный на Python и MATLAB. ldgm позволяет делать выводы из LDGM и прецизионных матриц LDGM, а также проводить эффективный в вычислительном отношении анализ сводной статистики GWAS с использованием LDGM. Он доступен по адресу https://github.com/awohns/ldgm и хранится в Zenodo85 (https://doi.org/10.5281/zenodo.8161389). Все функции анализа сводной статистики GWAS с помощью LDGM, включая BLUPx-ldgm, в настоящее время реализованы в MATLAB; планируется реализация Python. BLUPx-ldgm также реализован в bcftools, доступном по адресу https://github.com/freeseek/score; tskit доступен по адресу https://github.com/tskit-dev/tskit. Скрипты для воспроизведения результатов этой рукописи доступны по адресу https://github.com/awohns/ldgm_paper.

Международный консорциум HapMap. Гаплотипическая карта генома человека. Природа 437, 1299–1320 (2005).

Статья в Академии Google

Райх, Д.Э. и др. Неравновесие по сцеплению в геноме человека. Природа 411, 199–204 (2001).

Статья CAS PubMed Google Scholar

Абекасис, GR и др. Степень и распределение неравновесия по сцеплению в трех геномных регионах. Являюсь. Дж. Хум. Жене. 68, 191–197 (2001).

Статья CAS PubMed Google Scholar

Финукейн, Гонконг и др. Разделение наследственности с помощью функциональной аннотации с использованием сводной статистики ассоциаций по всему геному. Нат. Жене. 47, 1228–1235 (2015).

0.01. c and f show the alternative mean-squared error, defined as m−2 Tr((I−PR)(I−RP)). This measures the difference between PR, the product of the LD correlation matrix and the LDGM precision matrix, and the identity matrix (see Supplementary Note, section 4). Compared with the MSE, the alternative MSE is less sensitive to large eigenvalues of R, probably explaining why it is not elevated for AMR. For the identity matrix, the alternative MSE and the MSE are identical. In all plots, the lower whisker, lower hinge, center, upper hinge and upper whisker correspond to (lower hinge − 1.5× interquartile range (IQR)) and the 25th percentile, median, 75th percentile, and (upper hinge + 1.5× IQR), respectively./p>