HUMEDITロゴ

【論文】新型コロナウイルスと遺伝に関する論文の訳 #2

【論文】新型コロナウイルスと遺伝に関する論文の訳 #2

新型コロナウイルスにおける重症化の遺伝的機序

受信日 2020年9月27日
受理日 2020年11月30日
加速記事プレビューを公開
オンライン公開日 2020年12月11日
この記事を引用します。Pairo-Castineira, E. et al.
重症化の遺伝的機序について
新型コロナウイルス。ネイチャー https://doi.org/10.1038/

s41586-020-03065-y (2020).

方法

症例募集

GenOMICC試験(ゲノミクス.org)に登録された2,636人の患者は、地域の臨床試験によりCovid-19を確認し、治療臨床医の見地から、継続的な心肺モニタリングが必要であるとみなされた。 英国では、この種のモニタリングは、依存度の高い病棟または集中治療室で行われている。 さらに135人の患者がISARIC4C(isaric4c.net)を介して募集され、これらの患者は地域の臨床検査によりCovid-19を確認し、入院が必要であるとみなされた。 いずれの試験も、適切な研究倫理委員会(スコットランド15/SS/0110、イングランド、ウェールズおよび北アイルランド: 19/WM/0247)により承認された。 治験実施計画書の最新版および以前の版は、Genomic.org/protocolで入手可能である。 参加者全員がインフォームド・コンセントを与えた。

ジェノタイピング

DNAは、BACC3プロトコルを用いてNucleon Kit(Cytiva)を用いて全血から抽出した。 DNA試料を、1mlのTE緩衝液pH 7.5(10mM Tris-Cl pH 7.5、1mM EDTA pH 8.0)中に再懸濁した。 DNAの収率をQubitを用いて測定し、遺伝子型タイピング前に50ng/μlに正規化した。
遺伝子タイピングは、Illumina Global Screening Array v3.0+多疾患ビーズチップ(GSAMD-24v3-0-EA)およびインフィニウム化学を用いて実施した。 要約すると、これは、(1)全ゲノム増幅、(2)断片化とそれに続くハイブリダイゼーション、および(3)一塩基伸長および染色の3段階からなる。 各サンプルについて、50ng/μlに標準化された4...lのDNAを使用した。 各試料は、730,059のSNPに対してアレイ上で質問された。 アレイをIllumina iScanプラットフォーム上でイメージングし、ゲノムStudio Analysisソフトウェアv2.0.3、GSAMD-24v3-0-EA_20034606_ A1.bpmマニフェストおよびメーカー提供のクラスターファイルを用いて遺伝子型を自動的に呼び出した。 1667例において、Illumina NovaSeq 6000全ゲノム配列決定により遺伝子型および補完変異体が確認された。 サンプルはヒト参照ゲノムhg38に整列し、Genomics EnglandのDRAGENパイプライン上でGVCFステージに呼び出された変異体(ソフトウェアv01.011.269.3.2.22、ハードウェアv01.011.269)を用いた。 変異体は、GATK GenotypeGVCFsツールv4.1.8.1,50を最小深さ8Xまで濾過した(ヘテロ接合変異体検出の95%感度、51)遺伝子型を統合し、対立遺伝子頻度と注釈をつけた v1.10.2.

品質管理

Genotype callは、GenomeStudio内で製造業者および52の推奨事項を用いて慎重に検討され、最初の呼び出し率が低い(<90%)サンプルを除外し、その後データを再検討した。 簡単に説明すると、XおよびYマーカー呼び出しはすべて、Gentrainスコアが低く、クラスター分離が認められ、ヘテロ接合体呼び出しの過剰または欠損が認められるマイナーアレル頻度が1%を超える常染色体マーカーと同様に、必要に応じて視覚的に検査し、治癒させた。 ゲノムスタジオで遺伝子型に基づく性決定を実施し、記録の予想と一致しない場合はサンプルを除外した。 XXY遺伝子型を有する5人の個体も検出され、下流のGWAS分析のために除外された。 GenotypeStudio plink-input-report-plugin-v2-1-4を用いて、ゲノム参照コンソーシアムヒト構築物37(GRCHb37)およびIllumina「ソース」ストランド配向で遺伝子型を輸出した。 次いで、PLINK 1.9を用いて一連のフィルタリングステップを適用し、2790人および479095変異体をさらに分析した(コールレートが95%未満、コールレートが99%を超える変異体およびマイナーアレル頻度(MAF)が1%を超える変異体の選択、およびコールレートが97%を超える最終サンプルの選択)。

近親性

近親性と祖先推論は、英国バイオバンク49と1M veteran program.53に準拠して計算された。解析では56の重複ペアにフラグを立て、そのうちの1つはジェノタイピングの質(GenomeStudio p50GCスコアまたは/および個体のコール率)に応じて削除された。これにより、2734個のユニークな個体のセットが残された。英国バイオバンク49で定義されている高連結不平衡(LD)の領域は、MAF<1%またはミッシングネス>1%のSNPと同様に解析から除外された。King 2.1を用いて、Kingコマンド--kinship --degree 3を用いて3次までの関係行列を構築し、イグラフツール http://igraph.sf.net の関数 biggest_independent_vertex_set()を用いて、無関係な個体の最初のセットを作成した。主成分分析(PCA)は、剪定されたSNPを持つ無関係個体のセットにおいて、1000マーカーのウィンドウ、80マーカーのステップサイズ、0.1のr2閾値を使用して、gcta 1.955で実施された。PC1、PC2またはPC3に大きなウェイトを持つSNPは、次のKing 2.1のラウンドの入力として保持するために、剪定されたSNPの数の少なくとも2/3を維持したまま削除された。King 2.1の第2ラウンドは、非ヨーロッパ人の親族関係を過大評価しないように、PC1、PC2、PC3のウェイトが低いSNPを用いて実行した。このラウンドの後、2718人の個体が3親等までの親族関係がないと考えられた。

遺伝的先祖返り

1000ゲノムプロジェクトデータセットからの非関連個体を上記と同じ手順を用いて計算し、共通のSNPを用いて両データセットを統合した。 併合された遺伝子型タイピングされたデータを、ステップサイズ50およびr2が0.05の1000マーカーのウィンドウを用いて、plinkで剪定し、残りの92Kマーカーを、gcta 1.9を用いて20の第一主成分を計算するために使用した。 GenOMICC個体の祖先は、1000のゲノムで定義されたADMIXTURE56個体群を用いて推測した。 ある個体が1つの祖先に関連する確率が80%を超える場合、その個体は1Mの退役軍人コホートのように混合系に割り当てられ、そうでない場合、その個体は1Mの退役軍人コホートのように混合系に割り当てられた。この基準に従うと、ヨーロッパ系(EUR)の1818人、アフリカ系(AFR)の190人、東アジア系(EAS)の158人、南アジア系(SAS)の254人、および混合系(2以上)の301人が存在する。

補正

遺伝子型ファイルをプラスストランドに変換し、Hardy-Weinberg Equilibrium (HWE) p-value<10-6のSNPを削除した。インピュテーションはTOPMedリファレンスパネル57を用いて計算し、結果はGRCh38ヒトリファレンスゲノムとプラスストランドで与えた。インピュテーションされたデータセットは、BCFtools 1.9を用いて単原性と低インピュテーション品質スコア(r2<0.4)のフィルタリングを行った。GWASを実行するために、VCF形式のファイルをさらにr2>0.9でフィルタリングし、QCtools 1.3.58 英国バイオバンクのインputation score >0.9で我々のバリアントセット(n=5,981,137)と重複しているインputed variantを抽出し、QCtools 1.3を使用して症例と対照を含む単一のBGENファイルにGenOMICCデータとマージしました。

GWAS

3度の関連個体を削除した。 この集団に対して信頼できるGWASを実施するには十分な検出力が得られなかったため、米国系の13例を除外した。 最終データセットは2244人である。 PCAを用いて遺伝的祖先を推定したところ、ヨーロッパ系で1676人、東アジア系で149人、南アジア系で237人、アフリカ系で182人であった(拡張データ表1)。 一部の個体について年齢または剥奪状態が欠けている場合、その値はその祖先の平均値に設定された。 GWASは各祖先群に対して別々に実施された。 PLINK.59を用いたロジスティック回帰モデルに適合させることにより、個々のSNPにおける症例対照状態と対立遺伝子量との関連性の検定を各民族群について実施した。 すべてのモデルは性別、年齢、平均中心年齢2歳、居住郵便番号の欠乏スコアの10分位、および共変量としての最初の10のゲノム主成分を含んでいた。

ゲノム主成分を、英国バイオバンクおよびGenOMICC参加者全員の統合サンプルで計算した。 具体的には、456,750の遺伝的変異体が同定され、これらはGenOMICCデータセットに含まれると呼ばれる遺伝子型に含まれる変異体と、補定された英国バイオバンク遺伝子型との間で共有され、補定情報スコアは0.95を超え、マイナーアレル頻度は1%を超えていた。 これらの変異体で遺伝子型を統合した後、2.5%未満のマイナーアレル頻度、1.5%を超える欠損率を有する変異体を除去したところ、p値が10~50未満のハーディ・ワインベルグ平衡からの逸脱が示されたか、または以前に同定された英国バイオバンク内の連鎖不均衡領域内にあった。 PLINK indep-pairwiseコマンドを用いて、50の変種ステップで移動する1000の変種ウィンドウに基づいて残りの変種を最大r2 0.01までLD-枝刈りし、13,782のSNPを生成した後、先頭20のゲノム主成分をFlashPCA2.60を用いて計算した。

ヨーロッパ系のGWAS結果をMAF>0.01、HWE p値>10-50および遺伝子型タイピング率>0.99についてフィルタリングした。 別の遺伝子型タイピング法および対照と症例の補定パネルを用いるバイアスを避けるために、追加のフィルターを追加した。 これは、全症例および全対照が異なる方法を用いて遺伝子型タイピングされていたため、回帰分析を用いるために制御することができなかった。 2020年8月にダウンロードされた英国のBiobank European対照群とgnomAD hg38非フィンランドのヨーロッパ人の各祖先のMAFを比較したところ、(a) MAF>10%gnomadのSNPでは、gnomADと英国のバイオバンク対照MAFの間で5%の絶対差(b) gnomadでMAF<10%のSNPでは、UKのBiobank対照群とgnomADの間で25% gnomAD MAFの差(差)があった。 ヨーロッパ以外の祖先からのGWASを、同じ祖先>5%に相当する英国バイオバンク対照群と、ヨーロッパのGWASでQCを通過したSNP群のMAFについてフィルタリングした。 英国のBiobank European個人とgnomaAD対立遺伝子頻度の差を計算するために、フィンランド人以外のヨーロッパ人のgnomoAD対立遺伝子頻度を用いた。なぜなら、ヨーロッパのバイオバンク対照は主にフィンランド人ではないからである。 合計約4.7MのSNPを含む各祖先のろ過されたGWASを、METAL62標準誤差モードと集団階層化のための制御(ゲノム制御オン)を用いて、トランス民族メタ解析で組み合わせた。 最も近い遺伝子は、FUMA v1.3.6 SNP2GENE関数63を用いて、はLD R2 > 0.6および英国バイオバンク release 2リファレンスパネルを用いて定義した。 ヨーロッパ人個人における性特異的GWASを、それぞれの症例について性別および家系をマッチさせた非血縁男性症例1180例および非血縁女性症例496例および英国バイオバンクランダム対照5例を用いて実施した。 個々のSNPにおける症例対照状態と対立遺伝子用量との関連性の検定を、PLINKを用いたロジスティック回帰モデルに適合させることにより実施した。 年齢、平均年齢二乗、住居郵便番号の剥奪10分位および最初の10主成分をモデルの共変量として加えた。

剥奪スコア

英国データサービスは、国勢調査データに基づき、郵便番号ごとに生成された剥奪の尺度を提供しています。最新版の剥奪スコアは2017年に発表され、2011年の国勢調査に基づいています。ほとんどのサンプルでは部分的な郵便番号しか利用できなかったため、これらの指標を直接使用することはできませんでした。しかし、トップレベルの郵便番号エリア全体の人口数で加重した平均を計算することで、スコアの近似値を生成した。 最初の入力ファイルは、https://doi.org/10.5257/census/aggregate-2011-2 で特定された国勢調査の集計データの一部である。 具体的には、郵便番号データは http://s3-eu-west-1.amazonaws.com/statistics.digitalresources.jisc.ac.uk/dkan/files/Postcode_Counts_and_Deprivation_Ranks/postcodes.zip からダウンロードした。各トップレベル郵便番号について、公表されている各郵便番号の人口数と剥奪スコアが抽出され、加重平均スコアが計算された。さらに、より粗視化された分析のために、各トップレベル郵便番号スコアを10分位と5分位階級に分類した。

全ゲノム配列決定

全ゲノム配列決定(WGS)gVCFファイルを、全ゲノム配列データを有する1667個体について得た。 補定された変異体の位置に重複する変異体をGATkを用いて呼び出し、dep th<8Xの変異体(95%のカバー率が期待できる最小深さ)を濾過した。 個々のVCFファイルを複数サンプルのVCFファイルに結合し、帰属変異体と比較した。 1667例中1613例を最終GWASに用いた。 サンプルを濾過し、bcftools 1.9を用いて変異体を注釈付けした。 補定から得たVCFファイルを同じ方法で処理した。 WGSおよび帰属データの両方について、PLINK 2.064を用いて対立遺伝子頻度を計算した。

コントロール

英国バイオバンク

英国バイオバンクの参加者は、遺伝子型の欠損率または不均一性に基づいて英国バイオバンクによって外れ値として同定されず、遺伝子型から推測された性別が自己報告性と一致していない場合、潜在的な対照とみなされた。 これらの個人について、性別(UKBID 31)、年齢、祖先、および居住地の郵便番号剥奪スコアの10分位に関する情報を計算した。 具体的には、参加者の誕生月(UKBID 34)および年(UKBID 52)に基づき、年齢を2020年4月1日の年齢として計算した。 参加者の居住地郵便番号の最初の部分は、参加者の居住地(UKBID 22702および22704)に基づいて計算され、GenOMICC参加者について以前に記載されたように、剥奪スコアの10分位にマッピングされた。 先行研究は、GenOMICC参加者について以前に報告されたように推論された。 2020年8月に英国のBiobankからダウンロードした情報に基づき、Covid- 19のPCR検査を受けた参加者を除外した後、GenOMICC参加者それぞれについて、一致する推定祖先を有する5人を対照としてサンプリングした。 各対照群のサンプリング後、3度目までの関係者を潜在的な追加対照群から除外した。 個々の特性についてより厳密なマッチングを行う追加解析も実施した(補足情報:マッチさせた対照)。

10万人ゲノムプロジェクト

倫理的承認(14/EE/1112および13/EE/032)を受けて、10万人ゲノムプロジェクトの同意を得た参加者は、イングランドと北アイルランド、スコットランド、ウェールズの13の地域のNHSゲノム医学センターに登録され、DNA抽出のために全血が採取されました。品質保証後、Illumina Laboratory Servicesにより、Genomics England Sequencing CentreのHiseq 2500またはHiseq Xシークエンサーを用いて125または150塩基対の全ゲノムシークエンシングが行われ、その後、Starlingを用いて小変異(一塩基変異および小インデル)が検出された。症例-対照状態間の関連性の検定は、SAIGE(v0.39)を使用して混合モデル関連検定を実行することにより行った。GenOMICC研究からの1675人と、無関係の45,875人の参加者でヨーロッパ系の祖先を持つ者が含まれた。GenOMICC研究参加者と10万人ゲノムプロジェクトからの全ゲノム配列データを組み合わせたデータセットについて、ゲノム主成分を計算した。主成分分析(PCA)は、マイナー対立遺伝子頻度>0.005、LDプルーニング(r2 <0.1、ウィンドウサイズ500kb)後に選択された約30,000のSNPを用いてGCTAソフトウェアを用いて実施した。ヌル・ロジスティック混合モデルのフィッティングは、PCAに使用したSNPを用いて行われ、共変量として年齢、性別、年齢の二乗、年齢×性別、および最初の20個のゲノム主成分を含んだ。 SAIGEを用いた関連性の検定は、遺伝子型の質およびマイナー対立遺伝子頻度≧0.05のためにWGSデータセットのバリアントをフィルタリングした後に実施した。各表現型についてマイナー対立遺伝子数が20以上の変異体、症例と対照との間の差異欠落度(p値 <1×10-5)、およびHardy-Weinberg平衡からの離脱(p値 <1×10-5)を含むように、GWAS特異的な質のフィルタリングを行った。

ジェネレーションスコットランド

ジェネレーション・スコットランド スコットランドの家族の健康調査 ジェネレーション・スコットランド(以下、ジェネレーション・スコットランド)は、スコットランド全土の5つの地域センターから採取された24,084人の参加者からなる集団ベースのコホートである65 。参加者の大部分は、Illumina HumanOmniExpressExome-8v1_Aまたはv1-2のいずれかを使用して遺伝子型を決定し、20,032人が以前に説明したQC基準に合格した66,67。TOPMed参照パネルを使用した遺伝子型インピュテーションは、ミシガン大学のサーバーhttps://imputationserver. sph.umich.edu.68上のMinimac4 v1.0を使用して最近行われた(凍結5b)。関連するバリアントの品質チェックの目的で、無関係(PLINK1.9 < 5%を使用して推定された降臨によるゲノム共有同一性)の7689人の参加者からのインピュテーションデータを、ヨーロッパ系祖先のGenOMICC症例を使用したGWASの対照遺伝子型として使用しました。GWASは、PLINK2 (https://www.cog-genomics.org/plink/2.0/) glm関数で実装されたロジスティック回帰フレームワークで実行され、年齢、性別、およびヨーロッパ系祖先の最初の10の主成分を調整した。これらの座標は、KING v2.2.2.554を使用して1000ゲノムヨーロッパ集団サンプルの主成分空間への投影から得られ、品質チェックを通過し、参照集団と交差する標的遺伝子型マーカーのLD剪定されたサブセット。

検証

ディスカバリーGWASでのヒット数の一致は、以下の方法で検証されました。
ジェネレーション・スコットランドと100Kからのコントロール。ヒットが検証されたとみなすためには、3つのGWASすべてで効果の方向性が同じである必要があり、ジェネレーション・スコットランドと100Kの両方でp値がp<0.05/nvalidationsでなければならない(ここでnvalidationsとは、発見のしきい値p < 5×10-8での解析における有意な独立遺伝子座の数である)。

複製

GenOMICC EUR遺伝子座は、PLINK 1.964の凝集関数および凝集パラメータr2 = 0.1、pval = 5×10-8およびpval2 = 0.01を用いて定義し、ENSEMBL GRCh37遺伝子注釈を用いて、最も近い遺伝子までの距離を計算した。 Covid-19における重篤な疾患または死亡についてのGWASの報告はない。 代用として、我々の知見の一部の複製を提供するために、Host Genetics Initiative build 37、バージョン2(2020年7月)B2(入院Covid-19対集団)GWASを用いて複製分析を行った。 サンプルの重複を避けるために、英国バイオバンクを含まないすべてのコホートおよびGWASを含め、完全解析から要約統計量を用いた。 複製p値は、6.25×10-4(0.05/8、ここで、8は発見において有意な遺伝子座の数である)に設定された。

ゲノムワイドメタ解析

GenOMICC、HGIおよび23andMe間のメタ解析は、METAL,62における固定効果逆分散メタ解析を用いて実施し、ゲノムコントロールを補正した。 23andMeの研究は、EURの遺伝的祖先グループの症例と対照から構成されている。 HGI B2解析はトランス家系のメタ解析であり、大多数の症例は多民族ヨーロッパ(EURおよびFIN)であり、ヨーロッパ以外の家系の238例(Ad6例、AMR、BRACOVID研究、SAS南アジア62例、GNH研究)であった。

Post-GWAS解析

TWASおよびMeta-TWAS

MetaXcanフレームワーク23およびダウンロード可能なGTEx v8 eQTL MASHR-Mモデル(http://predictdb.org/).)を用いてトランスクリプトームワイド関連を行った。 TWASを実施するためのSNPカバレッジを増加させるために、ヨーロッパ系統の最初のGWAS要約統計量を、フィジ69補完機能(https://github.com/bogdanlab/ fizi)、1000ゲノムヨーロッパ集団をLD基準として、30%をある地域のSNPの最低比率(-min-prop 0.3)として用いて補完した。 次いで、補完されたGWAS結果を調和させ、hg38まで持ち上げ、GWASツール https://github.com/hakyimlab/summary-gwas-imputation/wiki/GWAS-Harmonization-And-Imputation. を用いて1000ゲノムリファレンスパネルにリンクした。 S-PrediXcan機能を有する全血(補足図16)および肺(図2)GTEx v8組織に対してTWASを実施するために、補完および調和GWAS要約統計量を用いた。 得られたp値は、有意な遺伝子関連を見出すためにBonferroni補正を用いて補正した。 GTEx v8肺組織および全血組織におけるサンプルサイズの限界を克服するために、これらの組織において小さなp値を有する遺伝子の優先順位付けを行い、全組織およびS‐Multixcan70においてGTEx v8遺伝子発現を用いた。

メンデルのランダム化

メンデルの法則に基づく2サンプルの要約データベース19は、GenOMICCと遺伝子型-組織発現プロジェクト71 GTEx v7の結果を使用して実行されました(SMR / HEIDIの事前準備データを使用:https://cnsgenomics.com/software/smr/#DataResource )、ジェネレーションスコットランド65,72が連鎖不平衡参照を形成します。ヨーロッパの祖先の結果からのGenOMICCの結果が結果として使用されました。 GTEx(v7)の全血発現は曝露として生じます。 GTEx v7に関連する追加データは、GTExからダウンロードされました:https://gtexportal.org/(2020年2月20日、2020年4月5日、および2020年7月4日アクセス)、およびSMR / HEIDIはhttps://cnsgenomics.com/software/からダウンロードされました。 smr /(2020年7月3日にアクセス)。分析はPython3.7.3とSMR / HEIDI v1.03を使用して実施されました(プロットはSMR / HEIDI v0.711を使用して作成されました)。 LD参照は、人口ベースのGeneration Scotlandコホート(許可を得て使用、前述67)のデータを使用して作成されました。Plinkv1.9(www.cog-genomics.org/plink/1.9/)を使用して、5,000人のランダムなセットから作成されました。 )、ゲノム関連性のカットオフを持つ個人のセット&lt; 0.01が抽出されました。 2,778人が最終セットに残った。 SMR / HEIDI分析に使用されたすべてのデータは、常染色体の2対立遺伝子SNPに限定されていました。4,264,462のバリアントが最終的にマージされたデータセットに残っていました。重要な(GTEx v7による;公称p値が公称p値のしきい値を下回る)ローカル(転写開始部位までの距離&lt; 1Mb)タンパク質コーディング遺伝子(GENCODE v19による)のGTEx v7全血からのeQTL、MAF&gt; 0.01(GTEx v7およびGenOMICC)は、潜在的な操作変数と見なされました。バリアントごとに、最初に最も強く関連付けられているEnsembl遺伝子IDを選択し、次に各Ensembl遺伝子IDが最も強く関連付けられているバリアントを選択しました。 4,614個の固有のEnsembl遺伝子ID用の機器が利用可能でした。結果は、関心のあるものとして先験的に選択された遺伝子のリスト(補足表3)に基づいて、そして全体として一緒に評価されました。 Covid-19-Host Genetics Initiative-https://www.covid19hgの結果で、ボンフェローニ補正された有意な結果の複製が試みられました。 org / -eQTLgen式データセットを使用してUKBiobankを除外(2020年7月2日データリリース)。20入院中のCovid-19対母集団(ANA_B2_V2)が、私たち自身に最も類似した表現型として選択されたため、複製コホート。上記の分析をさらに検証するために、一般化された要約データメンデルランダム化(GSMR)73が、https://www.eqtlgen.org/index.html(2020年10月26日アクセス)20および一般に公開されている暴露データを使用して実行されました。 TYK2およびIFNAR2で利用可能なGenOMICCEURデータ(補足図15)。 GSMRは、GCTAバージョン1.92.1 beta6Linuxを使用して実行されました。多面発現SNPは、HEIDI外れ値テスト(しきい値= 0.01)を使用してフィルタリングされ、機器SNPは、LDクランピング(LDr2しきい値= 0.05およびウィンドウサイズ= 1Mb)を使用してゲノム全体の有意水準(PeQTL&lt; 5e-8)で選択されました。 英国バイオバンクの50,000人の無関係な個人(SNP由来のゲノム関連性&lt; 0.05、HapMap 3 SNPを使用)の帰属遺伝子型を、凝集のLDリファレンスとして使用しました。 GSMRは、LDクランピングによって削除されなかった残りのLDを考慮します。

ゲノム領域プロット

ゲノム領域プロットは、https://github.com/Geeketics/LocusZooms(補足図5,6)を用いて作成した。

遺伝子レベルおよびパスウイ解析

EUR先祖代々の結果における遺伝子レベルでの有意性の負担をMAGMA v1.08(補足図17)を用いて算出した。74 SNPの位置が遺伝子領域の上流または下流5 kb以内(転写開始部位から転写停止部位までと定義)であれば、SNPを遺伝子に割り当てた。 MAGMA SNP-wise平均法を適用し、検定統計量として二乗SNP Z統計量の和を利用した。 1000ゲノムプロジェクトヨーロッパ参照パネルを用いて、SNP間のLDを推定した。 補助ファイルは、2020年9月1日に https://ctg.cncr.nl/software/ マグマからダウンロードされました。 タンパク質をコードする遺伝子の遺伝子位置ファイルは、NCBI (ftp.ncbi.nlm.nih.gov): gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz on 29/04/2015、および genomes/Homo_sapiens/ARCHIVE/ANNOTATION_RELEASE.105/ mapview/seq_gene.md.gz on 25/05/2016. から入手した。 LDを推定するために使用される参照データファイルは、1000ゲノムプロジェクトのフェーズ3から導出される。 遺伝子-遺伝子相関を説明する回帰モデルを用いて、MAGMAにおいて競合遺伝子セット増菌分析を行い、ゲノム上の機能的に類似した遺伝子のクラスター化から生じるバイアスを低減した。74遺伝子セットは、KEGG 2019、Reactome 2016、GO Biological Process 2018、Biocarta 2016およびWikiPathways 2019のデータベースから照会された。 Benjamini-Hochberg法を用いて偽発見率(<0.05)を制御した。

情報内容別のメタ解析

これらの結果を、SARS-CoV-2複製および応答における宿主遺伝子に関する既存の生物学的データと関連付けるために、GenOMICC metaTWASの遺伝子レベル解析(MAIC)24を行い、SARS-CoV-2ウイルス複製およびCovid-19における宿主応答に関与する既存の宿主因子のシステマティックレビューと併せて解析した。45多様な情報源からの遺伝子レベルデータを評価および統合するために、情報量(MAIC)によるメタ解析を開発した。24複数のin vitroおよびin vivo研究により、SARS-CoV-2と直接相互作用するか、またはSARS-CoV-2に対する宿主応答を定義する主要宿主遺伝子が同定された。 これらの研究の系統的レビューを以前に行った45。このGWASからの新しい関連を文脈に入れるために、著者らは、情報内容(MAIC)によるメタ解析を用いて、既存の生物学的データと組み合わせた遺伝子レベル結果のデータドリブンメタ解析を行った24。簡単に述べると、MAICはランク付けされたリストとランク付けされていないリストの両方を集約し、特に不均一なソースデータで提示された場合、他の方法より良好な性能を示した。 MAICへの入力は、命名された遺伝子のリストである。 MAICは、その遺伝子を報告したソースデータセットの数に応じて各遺伝子のスコアを割り当て、そのリスト上で上位にランク付けされた遺伝子のスコアに基づいて、各データソース(通常は個々の実験)に対してデータ駆動型のウェイト付けを作成する。 この手順は、スコアとウェイトが安定した値に収束するまで繰り返し実行されます。 単一のタイプの実験が結果に不当にバイアスをかけないようにするために、入力遺伝子リストをカテゴリーに割り当て、各カテゴリーからの1つの重み付けだけが任意の遺伝子のスコアに寄与することができるルールを適用した。

組織/機能的なゲノム濃縮

GTExプロジェクト(https://gtexportal.org/)によるRNAシーケンシングから要約した平均遺伝子発現データをダウンロードしました。GTEx v7のデータには、ヒト48組織の19,791遺伝子の遺伝子発現が含まれています。遺伝子発現値は、100万リードあたりの転写産物数(TPM)で正規化した。各組織における各遺伝子の発現特異性を測定するために、各遺伝子の発現特異性は、全組織中の各組織におけるその発現の割合、すなわち0から1の範囲の値として定義した。機能的ゲノム富化解析のために、我々は、SNPをアノテーションするためにldscソフトウェア(https://alkesgroup.broadinstitute.org/LDSCORE/)に提供されている内蔵の一次機能アノテーションv2.2を考慮した。アノテーションされたSNPを用いて、我々は層別化LDスコア回帰(S-LDSC)75を用いて、ヒト組織または特定の機能的ゲノム特徴が重度のCovid-19と関連しているかどうかを検定した。我々のGWAS要約統計は、ldscのmunge_sumstats.pyプロシージャによって調和された。各組織における遺伝子アノテーションのHapMap3 SNPs(MHC領域を除く)のLDスコアを1-cMウィンドウを用いて計算した。濃縮スコアは、アノテーションされたSNPによって捕獲された遺伝性の割合をアノテーションされたSNPの割合で割ったものとして定義された。

遺伝的な相関関係

我々は、LD-Hubに保存されている818のGWAS対象表現型とSevere Covid-19との遺伝的相関を評価するために、LDスコア回帰法(LDSC)76と高精細尤度法(HDL)25の両方の手法を適用した77 。HDL解析では、各表現型についてSNPベースの狭義遺伝率を推定し、818の複合形質のGWASについては、HDL参照パネルとの重なりが90%未満のSNPを持つものは削除した。

ゲノム構築

結果は、Genome Reference Consortium Human Build37を使用して表示されます。帰属された遺伝子型と全ゲノム配列データは、UCSCリフトオーバーツール(ftp://ftp.ensembl.org/pub/から取得したチェーンファイル)に基づくGATK4.0のPicardliftoverVCFモードを使用してGenomeReference Consortium Human Build38からリフトオーバーされました。 assembly_mapping / homo_sapiens / GRCh38_to_GRCh37.chain.gz.78

レポートサマリー

調査設計の詳細については、このペーパーにリンクされているNature Researchレポートの概要を参照してください。

データの可用性

本試験の結果を裏付ける完全な要約レベルのデータはhttps://genomicc.org/data.から入手可能である。 個々のレベルのデータは、ISARIC4C/GenOMICCデータ解析プラットフォームの適格な研究者によって、https://genomicc.org/data.での適用により分析することができる。 23andMeディスカバリー・データセットの完全なGWAS要約統計量は、23andMe参加者のプライバシーを保護する23andMeとの契約に基づき、23andMeを通じて適格な研究者に利用可能である。 詳細およびデータへのアクセスの申請については、 https://research.23andMe.com/dataset-access/ にアクセスしてください。

  1. McKenna, A., Hanna, M., Banks, E., Sivachenko, A., Cibulskis, K., Kernytsky, A., Garimella, K., Altshuler, D., Gabriel, S., Daly, M. & DePristo, M.A. ゲノム解析ツールキット。次世代DNAシークエンシングデータを解析するためのMapreduceフレームワーク。 Genome research 20, 1297–303 (2010).
  2. Meynert, A.M., Ansari, M., FitzPatrick, D.R. & Taylor, M.S. 全ゲノムおよびエクソームシークエンシングにおける変異体検出感度とバイアス。 BMC bioinformatics 15, 247(2014).
  3. Guo, Y., He, J., Zhao, S., Wu, H., Zhong, X., Sheng, Q., Samuels, D.C., Shyr, Y. & Long, J. イルミナヒトエクソームジェノタイピングアレイのクラスタリングと品質管理。 Nature protocols 9, 2643–62 (2014).
  4. Gaziano, J.M., Concato, J., Brophy, M., Fiore, L., Pyarajan, S., Breeling, J., Whitbourne, S., Deen, J., Shannon, C., Humphries, D., Guarino, P., Aslan, M., Anderson, D., LaFleur, R., Hammond, T., Schaa, K., Moser, J., Huang, G., Muralidhar, S., Przygodzki, R. & OLeary, T.J. 百万人の退役軍人プログラム。健康や病気への遺伝的影響を研究するためのメガバイオバンク。 Journal of clinical epidemiology 70, 214–23 (2016).
  5. Manichaikul, A., Mychaleckyj, J.C., Rich, S.S., Daly, K., Sale, M. & Chen, W.-M. ゲノムワイドな関連研究におけるロバストな関係推論 Bioinformatics (Oxford, England) 26, 2867–73 (2010).
  6. Yang, J., Lee, S.H., Goddard, M.E. & Visscher, P.M. GCTA: ゲノムワイドな複合形質解析のためのツール。 American journal of human genetics 88, 76–82 (2011).
  7. Alexander, D.H. & Lange, K. 個人の祖先推定のための混和アルゴリズムの強化 BMC bioinformatics 12, 246 (2011).
  8. D, T., Dn, H., Md, K., J, C., Za, S., R, T., Sag, T., A, C., Sm, G., Hm, K., An, P., J, L., S, L., X, T., Bl, B., S, D., A, E., We, C., Dp, L., Ac, S., Tw, B., Q, W., Dk, A., Ae, A.-K., Kc, B., E, B., S, G., R, G., Km, R., Ss, R., E, S., P, Q., W, G., Gj, P., Da, N., Sr, B., Mc, Z., S, Z., Jg, W., La, C., Cc, L., Ce, J., Rd, H., Td, O. & Gr, A. NHLBI TOPMedプログラムによる53,831種の多様なゲノムの配列決定。 (2019). https://doi.org/10.1101/563866.
  9. Wigginton, J.E., Cutler, D.J. & Hardy-Weinberg平衡の厳密な検定についての注意点。 American journal of human genetics 76, 887–93 (2005).
  10. Chang, C.C., Chow, C.C., Tellier, L.C., Vattikuti, S., Purcell, S.M. & Lee, J.J. 第二世代のプリンク。より大規模でリッチなデータセットへの挑戦。 GigaScience 4, 7 (2015).
  11. Abraham, G., Qiu, Y. & Inouye, M. FlashPCA2: バイオバンク規模の遺伝子型データセットの主成分分析 Bioinformatics (Oxford, England) 33, 2776–2778 (2017).
  12. Karczewski, K.J., Francioli, L.C., Tiao, G., Cummings, B.B., Alföldi, J., Wang, Q., Collins, R.L., Laricchia, K.M., Ganna, A., Birnbaum, D.P., Gauthier, L.D., Brand, H., Solomonson, M., Watts, N.A., Rhodes, D., Singer-Berk, M., England, E.M., Seaby, E.G., Kosmicki, J.A., Walters, R.K., Tashman, K., Farjoun, Y., Banks, E., Poterba, T., Wang, A., Seed, C., Whiffin, N., Chong, J.X., Samocha, K.E., Pierce-Hoffman, E., Zappala, Z., ODonnell-Luria, A.H., Minikel, E.V., Weisburd, B., Lek, M., Ware, J.S., Vittal, C., Armean, I.M., Bergelson, L., Cibulskis, K., Connolly, K.M., Covarrubias, M., Donnelly, S., Ferriera, S., Gabriel, S., Gentry, J., Gupta, N., Jeandet, T., Kaplan, D., Llanwarne, C., Munshi, R., Novod, S., Petrillo, N., Roazen, D., Ruano-Rubio, V., Saltzman, A., Schleicher, M., Soto, J., Tibbetts, K., Tolonen, C., Wade, G., Talkowski, M.E., Neale, B.M., Daly, M.J. & MacArthur, D.G. 141,456人のヒトの変異から定量化された突然変異制約スペクトル。 Nature 581, 434–443 (2020).
  13. Willer, C.J., Li, Y. & Abecasis, G.R. METAL: ゲノムワイドな関連スキャンの高速かつ効率的なメタ解析。 Bioinformatics (Oxford, England) 26, 2190–1 (2010).
  14. Watanabe, K., Taskesen, E., Bochoven, A. van & Posthuma, D. FUMAとの遺伝的関連を機能的にマッピングし、アノテーションを行う。 Nature communications 8, 1826 (2017).
  15. Purcell, S., Neale, B., Todd-Brown, K., Thomas, L., Ferreira, M.A.R., Bender, D., Maller, J., Sklar, P., Bakker, P.I.W. de, Daly, M.J. & Sham, P.C. PLINK: 全ゲノム関連と集団ベースの連鎖解析のためのツールセット。 American journal of human genetics 81, 559–75 (2007).
  16. Smith, B.H., Campbell, A., Linksted, P., Fitzpatrick, B., Jackson, C., Kerr, S.M., Deary, I.J., Macintyre, D.J., Campbell, H., McGilchrist, M., Hocking, L.J., Wisely, L., Ford, I., Lindsay, R.S., Morton, R., Palmer, C.N.A., Dominiczak, A.F., Porteous, D.J. & Morris, A.D. Cohort profile: Generation scotland: Scottish family health study (gs:SFHS). 健康や病気に関する遺伝子研究の研究とその参加者、そしてその可能性。 International journal of epidemiology 42, 689–700 (2013).
  17. Amador, C., Huffman, J., Trochet, H., Campbell, A., Porteous, D., Wilson, J.F., Hastie, N., Vitart, V., Hayward, C., Navarro, P. & Haley, C.S. スコットランドの最近のゲノム遺産。 BMC genomics 16, 437 (2015).
  18. Nagy, R., Boutin, T.S., Marten, J., Huffman, J.E., Kerr, S.M., Campbell, A., Evenden, L., Gibson, J., Amador, C., Howard, D.M., Navarro, P., Morris, A., Deary, I.J., Hocking, L.J., Padmanabhan, S., Smith, B.H., Joshi, P., Wilson, J.F., Hastie, N.D., Wright, A.F., McIntosh, A.M., Porteous, D.J., Haley, C.S., Vitart, V. & Hayward, C. 20,032世代のスコットランドの参加者を対象としたゲノムワイド関連研究のためのハプロタイプ研究コンソーシアムのインputationの探索。 Genome medicine 9, 23 (2017).
  19. Das, S., Forer, L., Schönherr, S., Sidore, C., Locke, A.E., Kwong, A., Vrieze, S.I., Chew, E.Y., Levy, S., McGue, M., Schlessinger, D., Stambolian, D., Loh, P.-R., Iacono, W.G., Swaroop, A., Scott, L.J., Cucca, F., Kronenberg, F., Boehnke, M., Abecasis, G.R. & Fuchsberger, C. 次世代の遺伝子型インピュテーションサービスと方法。 Nature genetics 48, 1284–1287 (2016).
  20. Pasaniuc, B., Zaitlen, N., Shi, H., Bhatia, G., Gusev, A., Pickrell, J., Hirschhorn, J., Strachan, D.P., Patterson, N. & Price, A.L. 要約統計量の高速で正確な代入は、機能強化の証拠を強化します。 Bioinformatics (Oxford, England) 30, 2906–14 (2014).
  21. Barbeira, A.N., Pividori, M., Zheng, J., Wheeler, H.E., Nicolae, D.L. & Im, H.K. 複数の組織から予測されたトランスクリプトームを統合すると、関連性の検出が向上します。 PLoS genetics 15, e1007889 (2019).
  22. Battle, A., Brown, C.D., Engelhardt, B.E. & Montgomery, S.B. ヒト組織全体の遺伝子発現に対する遺伝的影響。 Nature 550, 204–213 (2017).
  23. Smith, B.H., Campbell, H., Blackwood, D., Connell, J., Connor, M., Deary, I.J., Dominiczak, A.F., Fitzpatrick, B., Ford, I., Jackson, C., Haddow, G., Kerr, S., Lindsay, R., McGilchrist, M., Morton, R., Murray, G., Palmer, C.N.A., Pell, J.P., Ralston, S.H., St Clair, D., Sullivan, F., Watt, G., Wolf, R., Wright, A., Porteous, D. & Morris, A.D. Generation Scotland: スコットランドの家族の健康調査; 遺伝子と遺伝率を研究するための新しいリソース。 BMC Medical Genetics 7, 74 (2006).
  24. Zhu, Z., Zheng, Z., Zhang, F., Wu, Y., Trzaskowski, M., Maier, R., Robinson, M.R., McGrath, J.J., Visscher, P.M., Wray, N.R. & Yang, J. GWAS要約データから推測される危険因子と一般的な疾患との因果関係。 Nature communications 9, 224 (2018).
  25. Leeuw, C.A. de, Mooij, J.M., Heskes, T. & Posthuma, D. MAGMA: GWASデータの一般化された遺伝子セット分析。 PLoS computational biology 11, e1004219 (2015).
  26. Finucane, H.K., Bulik-Sullivan, B., Gusev, A., Trynka, G., Reshef, Y., Loh, P.-R., Anttila, V., Xu, H., Zang, C., Farh, K., Ripke, S., Day, F.R., Purcell, S., Stahl, E., Lindstrom, S., Perry, J.R.B., Okada, Y., Raychaudhuri, S., Daly, M.J., Patterson, N., Neale, B.M. & Price, A.L. ゲノムワイド関連解析要約統計量を使用した機能アノテーションによる遺伝率の分割。 Nature genetics 47, 1228–35 (2015).
  27. Bulik-Sullivan, B., Finucane, H.K., Anttila, V., Gusev, A., Day, F.R., Loh, P.-R., Duncan, L., Perry, J.R.B., Patterson, N., Robinson, E.B., Daly, M.J., Price, A.L. & Neale, B.M. 人間の病気や形質にまたがる遺伝的相関のアトラス。 Nature genetics 47, 1236–41 (2015).
  28. Zheng, J., Erzurumluoglu, A.M., Elsworth, B.L., Kemp, J.P., Howe, L., Haycock, P.C., Hemani, G., Tansey, K., Laurin, C., Pourcain, B.S., Warrington, N.M., Finucane, H.K., Price, A.L., Bulik-Sullivan, B.K., Anttila, V., Paternoster, L., Gaunt, T.R., Evans, D.M. & Neale, B.M. LD hub: SNPの遺伝率と遺伝的相関分析のための要約レベルのGWASデータの可能性を最大化するlDスコア回帰を実行するための集中型データベースとWebインターフェイス。 Bioinformatics (Oxford, England) 33, 272–279 (2017).
  29. Hinrichs, A.S., Karolchik, D., Baertsch, R., Barber, G.P., Bejerano, G., Clawson, H., Diekhans, M., Furey, T.S., Harte, R.A., Hsu, F., Hillman-Jackson, J., Kuhn, R.M., Pedersen, J.S., Pohl, A., Raney, B.J., Rosenbloom, K.R., Siepel, A., Smith, K.E., Sugnet, C.W., Sultan-Qurraie, A., Thomas, D.J., Trumbower, H., Weber, R.J., Weirauch, M., Zweig, A.S., Haussler, D. & Kent, W.J. UCSCゲノムブラウザーデータベース:更新2006。 Nucleic acids research 34, D590–8 (2006).
  30. Sun, J., Ye, F., Wu, A., Yang, R., Pan, M., Sheng, J., Zhu, W., Mao, L., Wang, M., Huang, B., Tan, W. & Jiang, T. 比較トランスクリプトーム分析は、SARS-CoV-2感染に対する宿主細胞の集中的な初期段階の応答を明らかにします。 (2020). https://doi.org/10.1101/ 2020.04.30.071274.
  31. Rosa, B.A., Ahmed, M., Singh, D.K., Choreno-Parra, J.A., Cole, J., Jimenez-Alvarez, L.A., Rodriguez-Reyna, T.S., Singh, B., Golzalez, O., Carrion, R., Schlesinger, L.S., Martin, J., Zuniga, J., Mitreva, M., Khader, S.A. & Kaushal, D. IFNシグナル伝達と好中球脱顆粒転写シグネチャーはSARS-COV-2感染中に誘導されます。 bioRxiv : the preprint server for biology (2020). https://doi.org/10.1101/2020.08.06.239798.
  32. Zhang, J.-Y., Wang, X.-M., Xing, X., Xu, Z., Zhang, C., Song, J.-W., Fan, X., Xia, P., Fu, J.-L., Wang, S.-Y., Xu, R.-N., Dai, X.-P., Shi, L., Huang, L., Jiang, T.-J., Shi, M., Zhang, Y., Zumla, A., Maeu75 / 5000 Covid-19患者の免疫反応の単一細胞の状況。Covid-19患者における免疫学的反応のスケープ。 Nature immunology 21, 1107–1118 (2020).
  33. Mick, E., Kamm, J., Pisco, A.O., Ratnasiri, K., Babik, J.M., Calfee, C.S., Castaneda, G., DeRisi, J.L., Detweiler, A.M., Hao, S., Kangelaris, K.N., Kumar, G.R., Li, L.M., Mann, S.A., Neff, N., Prasad, P.A., Serpa, P.H., Shah, S.J., Spottiswoode, N., Tan, M., Christenson, S.A., Kistler, A. & Langelier, C. 上気道の遺伝子発現は、Covid-19を他の急性呼吸器疾患と区別し、SARS-COV-2による自然免疫反応の抑制を明らかにします。 medRxiv : the preprint server for health sciences (2020). https://doi.org/10.1101/2020. 05.18.20105171.
  34. Wei, J., Alfajaro, M.M., Hanna, R.E., DeWeirdt, P.C., Strine, M.S., Lu-Culligan, W.J., Zhang, S.-M., Graziano, V.R., Schmitz, C.O., Chen, J.S., Mankowski, M.C., Filler, R.B., Gasque, V., de Miguel, F., Chen, H., Oguntuyo, K., Abriola, L., Surovtseva, Y.V., Orchard, R.C., Lee, B., Lindenbach, B., Politi, K., van Dijk, D., Simon, M.D., Yan, Q., Doench, J.G. & Wilen, C.B. ゲノム全体のCRISPRスクリーンは、SARS-CoV-2感染を調節する宿主遺伝子を明らかにします。 (2020). https://doi.org/10.1101/2020.06.16.155101.
  35. Heaton, B.E., Trimarco, J.D., Hamele, C.E., Harding, A.T., Tata, A., Zhu, X., Tata, P.R., Smith, C.M. & Heaton, N.S. SRSFプロテインキナーゼ1および2は、SARS-COV-2を含むヒトコロナウイルスの必須の宿主因子です。 bioRxiv : the preprint server for biology (2020). https://doi.org/10.1101/2020.08.14.251207.

謝意

本試験に参加した患者およびその愛する人々が、生活の中で最も困難な時期の1つであり、英国の病院でこれまでに経験したことのある最も極度の状態の間に個人的リスクのある患者を募集したすべての集中治療室の研究スタッフに感謝する。 GenOMICCは、敗血症研究(フィオナ・エリザベス・アグニュー信託)、集中治療学会、J. K. Baillie氏へのWellcome-Beit Prize award(Wellcome Trust 103258/Z/13/A)、BBSRC研究所プログラム支援助成金(BBS/E/D/20002172、BBS/E/D/10002070、BBS/E/D/30002275)の資金提供を受けて行われました。全ゲノムシークエンシングはジェノミクス・イングランドとの提携で行われ、英国保健社会福祉省、UKRI、LifeArcの資金提供を受けた。 ISARIC4Cは以下の助成金を受けています。The 医学研究審議会 [grant MC_PC_19059]、国立健康研究所 (NIHR) [grant CO-CIN-01]、NIHR健康保護研究ユニット (HPRU) 英国公衆衛生大学のリバプール大学での新興および人獣共通感染症の研究 (PHE)とのパートナーシップ、リバプール熱帯医学学校およびオックスフォード大学オックスフォード [grant 200907]からの助成金を受けています。インペリアル・カレッジ・ロンドンの呼吸器感染症NIHR HPRU with PHE [ award 200927], ウェルカムトラストおよび国際開発省 [215091/Z/18/Z], ビル&メリンダゲイツ財団 [OPP1209135], およびリバプール実験がん医学センター (Grant Reference. 本研究のインフラ支援には、インペリアルカレッジロンドンのNIHR生物医学研究センター [IS-BRC-1215-20013]、に対する欧州の準備のためのEUプラットフォーム (Re) emerging Epidemics (PREPARE) [FP7 project 60252525]、NIHR 臨床研究ネットワークが協力している。 PJMO は NIHR Senior Investigator Award [ award 201385] の支援を受けている。本研究の見解は著者のものであり、必ずしも DHSC、DID、NIHR、MRC、Wellcome Trust、PHE のものではありません。HMはユニバーシティ・カレッジ・ロンドン病院のNIHR BRCの支援を受けた。アイルランドの健康調査委員会(Clinical Trial Network Award 2014-12)は、アイルランドでのサンプル収集に資金を提供している。この研究は、プロジェクト788の下で英国バイオバンクリソースを使用して実施された。ジェネレーション・スコットランドは、スコットランド政府保健局長のチーフサイエンティストオフィス[CZD/16/6]およびスコットランド資金調達評議会[HR03006]からコアサポートを受け、現在はウェルカム・トラスト[216767/Z/19/Z]のサポートを受けています。GS:SFHSサンプルのジェノタイピングは、スコットランドのエジンバラ大学エジンバラ臨床研究施設の遺伝学コアラボによって実施され、英国医学研究評議会およびWellcome Trust(ウェルカムトラスト戦略賞レジリエンスとうつ病を縦断的に戦略化(STRADL)リファレンス 104036/Z/14/Z)の資金提供を受けた。Genomics Englandと10万人ゲノムプロジェクトは、国立健康研究所、ウェルカムトラスト、医学研究評議会、英国癌研究所、保健社会福祉省、NHS Englandから資金提供を受けています。M. CaulfieldはNIHRの上級研究員である。この研究は、バーツとケンブリッジにあるNIHRバイオメディカル研究センターのトランスレーショナルリサーチのポートフォリオの一部である。ヒト遺伝学ユニットで行われた研究は、MRC(MC_UU_00007/10、MC_UU_00007/15)の資金提供を受けています。LK は、国家生産性投資基金(MR/R026408/1)からのRCUKイノベーションフェローシップの支援を受けた。A Bretherickは、臨床医のためのウェルカムトラスト博士号トレーニングフェローシップ (204979/Z/16/Z)およびエジンバラ臨床アカデミックトラック (ECAT)プログラムからの資金提供を認めている。我々は、MRC人間遺伝学ユニットプログラム助成金「健康と疾患における定量的形質」(U. MC_UU_00007/10)からの支援を認めます。A. Tenesaは、MRC研究助成金MR/P015514/1、HDR-UK賞HDR-9004およびHDR-9003からの資金提供を感謝します。この研究は、NHS病院での研究への採用を促進している国立衛生研究所臨床研究ネットワーク(NIHR CRN)とチーフサイエンティストオフィス(スコットランド)、そして世界的なISARICとInFACTコンソーシアムに多大な貢献をしていただきました。著者らは、これらの結果の解釈についてアドバイスをいただいたDr. Rebecca Coll, ウェルカム-ウォルフソン研究所、クイーンズ大学ベルファスト、クイーンズ大学ベルファストに、LD-Hubで使用されている調和のとれたGWAS要約統計を共有してくれたJie Zheng(ブリストル大学)に感謝の意を表したい。著者は、原稿と解析に多くの実質的な改善を与えてくれた匿名の査読者に感謝の意を表したい。ここで表明された見解は純粋に著者のものであり、いかなる状況においても欧州委員会の公式見解を表明するものではない。

著者寄稿

JK, PK, CHi, PH, AN, DM, LL, DMc, HM, TW, CPP, JKBは研究デザインに貢献した。SC, JF, FG, WO, SK, AF, KRo, LMu, PJO, MGS, AL, JKBは研究調整に貢献した。NW, AF, LMuは研究室作業に貢献した。EP-C、SC、LK、ADB、KR、DP、SW、NP、MHF、JF、AR、EG、DH、BW、YW、AM、AK、LM、ZY、RZ、CZ、GG、BS、MZ、CH、JY、XS、CPP、AT、KRo、AL、VV、JFW、JKBはデータ解析に貢献した。SC, CDR, DJP, CHa, CS, MS-H, LT, AH, SCM, AP, ARe, MC, RS, JKBは症例および対照の募集に貢献した。SC, CDR, RB, JM, JKBは所見の解釈に貢献した。EP-C、SC、LK、ADB、KR、CDR、RB、JM、CPP、KRo、VVV、JFW、JKBは原稿作成に貢献した。JKBは本研究の発案者であり、原稿の第一稿を執筆した。最終版の原稿は全著者が承認した。GenOMICCの募集サイトは以下の通りであり、各サイトの募集患者数の多い順に記載されている。

競合他社との利害関係

著者らは、競合する利害関係はないと宣言している。

追加情報

補足情報は、 https://doi.org/10.1038/s41586-020-03065-y. お問い合わせ・資料請求は、J.K.B.宛にお送りください。

査読情報Natureは、Paul McLarenとその他の匿名の査読者に、この論文の査読への貢献に感謝します。査読者の報告書を入手できます。

転載・許可情報 http://www.nature.com/reprints. で入手可能です。

QQ Plot GCC EUR
QQ Plot GCC AFR
QQ Plot GCC EAS
QQ Plot GCC SAS
QQ Plot GCC TE
QQ Plot GCC HGI

拡張データ図1 Q:Qプロット

gcc.eur - ヨーロッパ、gcc.afr - アフリカ、gcc.eas - 南アジア、および民族を超えたメタ解析(gcc.te.meta)、およびGenOMICC、HGI、および23andMeデータからなるメタ解析(gcc.hgi.23m)の各祖先グループについて、生の(補正なしの)p値を示します。 λ - ゲノムインフレ値。GenOMICC EURでの一次分析では、いくつかの残留インフレが明らかになっていることに注意してください。. 共変量としてより多くの主成分(20PC)を用いて解析を繰り返しても、インフレ率は改善しなかった(λ0.5 = 1.10)。

拡張データ図1 Q:Qプロット

拡張データ 図2 MAICの共有情報内容

MAIC分析におけるデータソース間の共有情報量の表現。各実験またはデータソースは円の外輪上のブロックで表され、データソースのブロックの大きさは入力リストの情報量の総和に比例する。線は支配的なデータソースに応じて色分けされている。同じカテゴリー内のデータソースは同じ色を共有している(凡例参照)。最大のカテゴリとデータソースにはラベルが付けられている。この図のインタラクティブ版は https://baillielab.net/maic/covid にあります。GenOMICCメタTWASの特異的濃縮の確率を推定するために、メタTWAS遺伝子のベースライン分布からランダムに1000回サンプリングし、同じセットのCovid-19システマティックレビュー入力でMAICを再実行したが、ランダムにサンプリングした入力リストをGenOMICCメタTWASの結果に置き換えた。これらの経験的な結果に基づいて正規分布をモデル化し、MAICがこのように強く濃縮される確率をランダムチャンスによってp = 4.2×10-12と推定した。

拡張データ 図3 症例と対照群のゲノムオーバーラップ

最初の10の主成分について、すべてのケースとコントロールの分布を示すPCAプロット。症例は、色付きの閉じた円で示されている。ヨーロッパ(EUR、青)、アフリカ(AFR、赤)、東アジア(EAS、緑)、南アジア(SAS、紫)。各祖先グループのコントロールは、その祖先グループの色を薄くした閉じた円で示されている。英国バイオバンクの人口背景は、薄い灰色の閉じた円として示されている。

rs2236757 A/G

コホート オッズ比 OR 95%-CI 重量
gee-AFR rs2236757 1.08 [0.76; 1.53] 2.9%
gee-EAS   1.30 [0.89; 1.91] 2.4%
gee-SAS   1.27 [0.99; 1.62] 5.9%
gee-EUR   1.29 [1.17; 1.41] 43.0%
23m   1.22 [0.96; 1.55] 6.3%
hgi   1.20 [1.09; 1.32] 39.7%
         
効果固定モデル   1.24 [1.17; 1.32] 100.0%
不均一性: I2=0%, τ2=0, d= 0.87   p-val=1.16e-12

rs73064425 T/C

コホート オッズ比 OR 95%-CI 重量
gee-AFR rs73064425 7.74 [0.43; 138.83] 0.1%
gee-EAS   4.02 [1.26; 12.76] 0.5%
gee-SAS   1.26 [0.96; 1.66] 9.0%
gee-EUR   2.14 [1.88; 2.45] 39.3%
23m   1.87 [1.56; 2.24] 20.2%
hgi   1.70 [1.47; 1.98] 31.0%
         
効果固定モデル   1.86 [1.71; 2.02] 100.0%
不均一性: I2=69%, τ2=0.0281, p<0.01   p-val=1.97e-49

rs2109069 A/G

コホート オッズ比 OR 95%-CI 重量
gee-AFR rs2109069 0.84 [0.59; 1.21] 2.3%
gee-EAS   0.93 [0.55; 1.58] 1.1%
gee-SAS   1.11 [0.83; 1.47] 3.7%
gee-EUR   1.36 [1.25; 1.48] 41.1%
23m   1.13 [0.99; 1.29] 17.2%
hgi   1.19 [1.08; 1.31] 34.5%
         
効果固定モデル   1.23 [1.16; 1.30] 100.0%
不均一性: I2=61%,τ2=0.0091, p=0.03   p-val=3.10e-13

rs10735079 G/A

コホート オッズ比 OR 95%-CI 重量
gee-AFR rs10735079 0.90 [0.62; 1.32] 2.2%
gee-EAS   0.69 [0.41; 1.18] 1.1%
gee-SAS   1.24 [0.96; 1.60] 4.8%
gee-EUR   0.77 [0.71; 0.85] 38.7%
23m   0.96 [0.83; 1.12] 13.8%
hgi   0.87 [0.80; 0.95] 39.4%
         
効果固定モデル   0.86 [0.81; 0.91] 100.0%
不均一性: I2=69%,τ2=0.0135, p<0.01   p-val=5.04e-08

rs12004298 (ABO locus)

コホート オッズ比 OR 95%-CI 重量
gee-EUR rs12004298 1.11 [1.01;1.21] 33.7%
hgi   1.20 [1.10;1.31] 31.1%
23m   1.15 [1.06; 1.25] 35.2%
         
効果固定モデル   1.15 [1.09; 1.21] 100.0%
不均一性: I2=0%,τ2=0, p=0.44  

拡張データ 図4 GenoMICC試験内の先祖代々のグループにおける効果の大きさ

データは、GenOMICC(a-d)、ABO遺伝子座(e)においてゲノム全体で有意な関連を持つ4つの複製された亜種について示されている。フォレストプロットは、固定効果モデルの下での効果サイズの不均一性の尺度とp値(p)、95%信頼区間を持つメタ解析推定値、およびp値(P-val)を表示している。太字の対立遺伝子は、報告された効果(オッズ比)の参照対立遺伝子である。4群で分析した症例+対照群の標本サイズは以下の通りである。GenOMICC内のアフリカ人(AFR)1092例、東アジア人894例、ヨーロッパ人10055例、南アジア人(SAS)1422例。HGI - Covid-19 Host Genetics Initiative; 23m - 23andMe。観察された効果の大きさの不均一性は、先祖代々のグループ間の真の違いによるものか、小グループでの限られた統計力(広い信頼区間から明らか)によるものか、あるいは残留交絡因子によるものかもしれない。

拡張データ 表1 対象となった患者2244人のベースライン特性

部分特性 GenOMICC (n=2109) ISARIC 4C(n=135)
欠損データ 欠損データ
女性の性 624(30%) 46(34%)
年齢(年、平均±SD) 57.3±12.1 57.3±2.9
ヨーロッパ系 1573(75%) 103(76%)
南アジア系 219(10%) 18(13%)
アフリカ系 174(8%) 8(6%)
東アジア系 143(7%) 6(4%)
重大な併存疾患 396(19%) 49(2%) 40(30%) 26(19%)
侵襲的換気 1557(74%) 35(2%) 25(19%) 31(25%)
死亡(60日) 459(22%) 338(16%) 22(16%) 30(22%)

主成分分析(拡張データ 図3)により先祖群を決定した。 有意な併存疾患は、GenOMICCにおける機能的に制限される併存疾患の存在として、治療を行う臨床医の評価において定義した。 ISARIC4Cでは、重大な併存疾患とは、慢性心疾患、肺疾患、腎疾患、肝疾患、癌、認知症の存在を指す。
年齢は平均±標準偏差で示す。

拡張データ表2外部データでの複製

SNPchr:pos(b37)RiskAltORgcc.ukbPgcc.ukb0Rhgi.23mPhgi.23mLocus
rs73064425 3:45901089 T C 2.1 4.8x10-30 1.7 1.5x10-28* LZTFL1
rs9380142 6:29798794 A G 1.3 3.2x10-8 1 0.76 HLA-G
rs143334143 6:31121426 A G 1.9 8.8x10-18 1.1 0.019 CCHCR1
rs3131294 6:32180146 G A 1.5 2.8x10-8 0.99 0.91 NOTCH4
rs10735079 12:113380008 A G 1.3 1.6x10-8 1.1 0.00082* OAS1/3
rs2109069 19:4719443 A G 1.4 4x10-12 1.1 5x10-5* DPP9
rs74956615 19:10427721 A T 1.6 2.3x10-8 1.4 2x10-6* TYK2
rs2236757 21:34624917 A G 1.3 5x10-8 1.2 4.1x10-5* IFNAR2

リスク – リスク対立遺伝子; Alt-代替対立遺伝子; または-リスク対立遺伝子の効果量(オッズ比)。 CI-オッズ比の95%信頼区間。 P-p値、遺伝子座-最上位のSNPに最も近い遺伝子。 下付き文字の識別子はデータソースを示します。gcc-GenOMICC研究、ヨーロッパの祖先、英国バイオバンクとの比較。 hgi.23m-複製に使用される新型コロナウイルス ホスト遺伝学イニシアチブおよび23andMeメタ解析。 *ボンフェローニの有意な値が強調表示され、外部レプリケーションを示します。