암의 병렬 기능 주석
Aug 19, 2023
Scientific Reports 12권, 기사 번호: 18487(2022) 이 기사 인용
784 액세스
3 알트메트릭
측정항목 세부정보
바이오마커 발견 및 정밀 의학을 위해 엑솜 서열분석을 사용하려면 뉴클레오티드 수준의 변이를 암호화된 단백질의 기능적 변화와 연결해야 합니다. 그러나 수천 개의 암 관련 과오 돌연변이 또는 불확실한 중요성(VUS)의 변이체에 기능적으로 주석을 달기 위해 생화학적 및 기능적 분석을 위해 변이체 단백질을 정제하는 것은 비용이 많이 들고 비효율적입니다. 우리는 96웰 플레이트의 작은 배양물과 원유 추출물을 사용하여 다수의 VUS에 대한 병렬 기능 주석(PFA)을 설명합니다. 히스톤 메틸트랜스퍼라제 계열의 구성원을 사용하여 암 관련 돌연변이의 높은 처리량 구조적 및 기능적 주석을 보여줍니다. 파라로그의 기능적 주석을 결합함으로써 우리는 서열 기반 기능 예측의 정확도를 90% 이상 향상시키는 두 가지 계통발생 및 클러스터링 매개변수를 발견했습니다. 우리의 결과는 히스톤 메틸트랜스퍼라제의 발암성/종양 억제 기능을 정의하고 암 관련 돌연변이의 효과를 예측하는 서열 기반 알고리즘의 정확성을 향상시키는 PFA의 가치를 보여줍니다.
암 관련 돌연변이의 기능적 주석은 어려운 일입니다1,2. 대부분의 미스센스 돌연변이는 알려진 기능이 없는 위치에서 발생하여 운전자 대 중립(승객) 돌연변이의 식별을 방지합니다. 현재 기능적 주석 방법은 뉴클레오티드 및 아미노산(aa) 서열 보존을 사용하여 돌연변이 병원성을 예측합니다3,4,5. 검증은 야생형과 비교하여 aa 측쇄의 돌연변이 발산에 의존하고 배경 돌연변이 비율6을 기준으로 양성 선택 확률을 통계적으로 추정합니다. 그러나 보존된 aa를 변경한다고 해서 항상 기능이 변경되는 것은 아닙니다. 구조적 및 열역학적 정보를 기능적 예측에 통합하는 알고리즘은 단백질 구조 및 리간드 상태에 대한 구조적 정보가 부족하여 제한됩니다. 복합체 내 단백질의 경우 aa 치환이 기능에 미치는 영향을 예측하는 것은 어렵습니다. 잘 특성화된 단백질에 대한 예측은 향상되지만 이러한 정보를 얻으려면 비용과 시간이 많이 소요되는 단백질 정제 및 특성화가 필요합니다. 어떤 돌연변이가 암을 유발하는지 아는 것은 세포 및 동물 기반 연구의 우선순위를 정하는 데 중요하지만 기능적 예측 프로그램은 이러한 고비용 실험을 안정적으로 안내할 수 없습니다6,9.
우리는 단백질 정제 없이 불확실한 중요성(VUS)의 암 관련 미스센스 변종의 높은 처리량 특성화를 위한 병렬 기능 주석(PFA)을 설명합니다. 우리는 암에서 가장 빈번하게 돌연변이가 발생하는 유전자 중 하나인 3개의 혼합 계통 백혈병(MLL) 계열 히스톤 H3 라이신 4(H3K4) 메틸트랜스퍼라제를 사용하여 PFA의 가치를 입증합니다(그림 S1A)10,11,12,13,14,15, 16,17,18,19,20. MLL 계열 효소의 돌연변이는 H3K4 메틸화 패턴의 게놈 전체 이상과 관련이 있으며, 이는 악성 종양을 촉진하는 비정상적인 전사 프로그램과 연결됩니다. 수백 개의 MLL1-3 VUS 중 대부분은 알려진 기능이 없는 아미노산 위치에 있습니다(그림 S1B). 우리는 촉매적 변종 억제자, Zeste 강화자, Trithorax(SET) 도메인 내 또는 주변의 99개 암 관련 미스센스 돌연변이를 스크리닝하여 널리 사용되는 두 가지 기능 예측 프로그램과 결과를 비교했습니다. 3개의 MLL 파라로그의 기능 주석을 사용하여 두 개의 계통발생 및 클러스터링 매개변수를 결합하면 서열 기반 기능 예측 정확도가 90% 이상으로 향상된다는 사실을 발견했습니다. 이러한 결과는 바이오마커 발견 및 정밀 의학에 대한 암 관련 돌연변이의 기능적 효과를 예측하기 위한 계산 방법을 개선하기 위한 기반을 제공합니다.
예측 도구가 자주 돌연변이되는 효소군에서 임상적으로 관련된 과오 돌연변이를 얼마나 잘 분류하는지 더 잘 이해하기 위해 MLL1-3의 촉매 SET 도메인에서 VUS를 기능적으로 분석하여(그림 1) 결과를 널리 사용되는 세 가지 계산 예측 프로그램과 비교했습니다. MLL 효소는 히스톤 H3 라이신 4(H3K4) 메틸화를 촉매합니다. 변형은 악성 종양과 관련된 메틸화의 게놈 전체 이상과 관련이 있습니다. MLL1-3은 여러 암에서 가장 흔히 돌연변이가 발생하는 유전자 중 하나입니다25,26. 수백 개의 MLL1-3 VUS 중 대부분은 알려진 기능이 없는 아미노산 위치에 있습니다(그림 S1).
50% of WT. Error bars, standard deviation from 2 independent experiments. (C) Representative results from PFA for MLL3 VUS mutations by fluorography of SDS-PAGE. Upper, Coomassie-stained gel of quenched enzymatic reactions; middle, signal from reactions with H3K4me0 (unmethylated) or H3K4me1 (monomethylated) peptides; bottom, expression of MLL3 variants by Coomassie-stained SDS-PAGE. Assays were as described for Fig. 1, limiting the recombinant subunits required for full enzymatic activity31,32,33 to minimize activity variation from differing MLL expression. Rates of monomethylation and dimethylation were determined using unmodified or monomethylated substrates. Activity depended on recombinant expression (no activity in uninduced control, UIC, lane 1). Lanes 2–11 show representative wild-type (WT) and variant MLL3 complexes, demonstrating that activity variation cannot be explained by differential expression. An uncropped version of Fig. 2C is shown in Fig. S11./p> 50% of wild-type with FATHMM scores > − 0.75. The third region representing false-negative (FN) predictions (48% of mutations) had activity < 50% wild-type and FATHMM scores indicating no disease./p> 0.8 "probably damaging", 0.2 to 0.8 "possibly damaging", < 0.2 benign). (C) CancerVar OPAI scores vs. relative activity of VUS. Vertical line,default threshold (< 0.95) for variants with uncertain probability of oncogenicity. (D) Violin plot of mean activity differences between VUS with low (< 1.5) or high (> 1.5) parallel cluster scores (pClustScore). Significance was from 2-tailed unpaired t-tests. Dashed line, median; dotted lines, upper and lower quartiles. (E) Variant ProxRatioEach scores showing proximity of adjacent missense mutations in each protein, plotted as a function of amino acid position using Mixed Lineage Leukemia (MLL) 1 numbering. (F) Clustal Omega phylogenetic cluster analysis of human SET1/MLL proteins shows three clades diverged in product specificity (me1, 2, 3 is degree of methylation)33. (G) Comparison of family vs. versus clade conservation scores in PolyPhen-2 false-positive (FP) and true-positive (TP) amino acid positions. Two-way ANOVA compared means within groups. ****P < 0.0001; ns, P > 0.05./p> 0.8, predicting "probably damaging." Mutations with activity < 50% of wild-type (53.5% of total) represented TP predictions. All but 4 of the remaining (42% of total) with activity > 50% of wild-type represent FP predictions. PoylPhen-2 incorporated structural information into the predictions7, but in contrast to FATHMM, lacked precision to adequately distinguish FP from TN inferences./p> 50% of wild-type represent FP (18%) and TN (29%) predictions./p> 50% of WT. Mut, mutant. (B) Recursive partitioning classification tree for enzymatic activity using FI-score, pClustScore, ΔAtoms, Blosum62 and ΔΔG parameters for MLL1-3 VUS. Circles, internal nodes that can be partitioned into subnodes; boxes, terminal nodes; red, VUS with activity ≤ 50% of WT; blue, VUS with activity > 50% of WT. Circles, P values input nodes; box plots of Activity(MT/WT) values are in terminal nodes. (Goodness of Fit R2 = 0.65, RMSE = 0.22) (C) Confusion matrix showing predictive accuracy of the tree based on the tenfold cross-validation scheme. The recursive partitioning algorithm was repeated85 with 10 rounds of fitting, each using randomly chosen data subsets, with 90% training set and 10% testing set. D-G) Actual vs. Predicted plots. X-axes, actual activity; y-axes, predicted activity based on the regression model. Red diagonal line, line of identity; dashed lines, cutoff for VUS with less than or greater than 50% WT activity. (D) FI-Score and pClustScore parameters as predictors. (E) FATHMM inference score as predictor. (F) PolyPhen-2 inference score as predictor. (G) CancerVar Oncogenic Prioritization by Artificial Intelligence (OPAI) score as predictor. Shown are adjusted R2 values./p> 3.005 were correctly classified as LOF with very low activity (P < 0.001). For VUS variants with FI-Scores ≤ 3.005, pClustScore became the major factor distinguishing high- vs. low-activity variants. Blosum62, ΔAtoms and ΔΔG parameters were not significant. Thus, combining FI-Score and pClustScore was significantly better at predicting the functional impact of VUS mutations (R2 = 0.63) than FATHMM (R2 = 0.0002), PolyPhen-2 (R2 = 0.05) or CancerVar (R2 = 0.001) (Fig. 5D–G)./p> 95% purity. For methyltransferase assays, an equal volume of wild-type or mutant lysate was incubated with 3 µM WRAD, 250 µM H3 peptide (unmodified or monomethylated), and 1–2 µCi [3H]-SAM (PerkinElmer Life Sciences) in assay buffer (20 mM Tris pH 8.5, 1 mM TCEP, 200 mM NaCl, 1 µM ZnCl2). Samples were incubated at 15 °C for 30 min. Lysates from cells transformed with empty vector (pGST II) or uninduced wild-type plasmids served as negative controls. Reactions were quenched with 0.5 M EDTA (1:1, v:v). Quenched reactions were brought to 200 µL using assay buffer with 0.5 M EDTA and 0.2 mg/ml BSA and transferred to 96-well streptavidin-coated FlashPlate microplates (PerkinElmer). Samples were incubated overnight at 4 °C to allow binding of biotinylated H3 peptide to the streptavidin-coated surface before scintillation counting in a Hidex Sense Plus microplate reader (LabLogic). For the gel-based fluorography assays, reactions were quenched with SDS-loading buffer and separated by 4–12% BisTris SDS-PAGE (LifeTechnologies) at 200 V for 30 min. Gels were stained with Coomassie, imaged, then placed in enhancing solution (Enlightening, PerkinElmer Life Sciences) for 30 min at room temperature. Gels were dried for 2.5 h at 72 °C under constant vacuum and exposed to film (Eastman Kodak Co. Biomax MS Film) at − 80 °C for 6–72 h before developing. Densitometry using ChemiDoc ImageLab (BioRad) software was used to quantify H3 peptide methylation./p>