Publication:
Computational investigation of structural and functional effects of cancer related variants

dc.contributor.advisorSARICA, Pemra Özbek
dc.contributor.authorYazar, Metin
dc.contributor.departmentMarmara Üniversitesi
dc.contributor.departmentFen Bilimleri Enstitüsü
dc.contributor.departmentBiyomühendislik Anabilim Dalı
dc.date.accessioned2026-01-13T15:33:03Z
dc.date.issued2023
dc.description.abstractTek nükleotid varyantları (TNV'ler), gen ekspresyonu, protein katlanması ve diğerleri arasında protein-protein etkileşimleri dahil olmak üzere hücredeki birçok biyolojik işlevi etkileyebilen tek nükleotit değişiklileridir. Kanser, hücrelerin anormal ve kontrolsüz çoğalmasına yol açan genetik değişikliklerden kaynaklanan karmaşık ve çok faktörlü bir hastalıktır. TNV'lerin kanser gelişimi üzerinde önemli bir etkisi vardır. TNV'lerin etkilerinin kesin olarak tanımlanması, karakterizasyonu ve tahmini, çeşitli biyolojik mekanizmaların ve bunların hastalık koşulları sırasındaki değişimlerinin anlaşılmasında hayati bir rol oynamaktadır. Varyantlar, fenotipik sonuçlar üzerinde faydalı, nötr veya negatif etkilere neden olabilir ve sırasıyla iyicil, nötr veya patojenik olarak tanımlanır. İyicil ve nötr varyantlar genellikle hafif ila tolere edilebilir veya faydalı etkilere sahipken, çoğu patojenik varyant bireyler üzerinde zararlı etkilere neden olur ve bu bireylerin popülasyondaki sıklığının azalmasına yol açar. Bu etkileri belirlemeye yönelik deneysel süreç, zaman alıcı, verimsiz ve elverişsiz olabilir. Sonuç olarak, varyantların etkilerini tahmin etmek için hesapsal yöntemlerin kullanılması giderek daha popüler hale gelmektedir. Bu tez çalışması, esas olarak, kanserle ilgili varyantların proteinler üzerindeki fonksiyonel ve yapısal etkilerinin araştırılması ve varyantların patojenite etkilerinin sınıflandırılması için tahmine dayalı bir makine öğrenme modelinin oluşturulmasına yönelik araştırmaların sonuçlarını sunmaktadır. Tez üç ana bölümden oluşmaktadır. İlk olarak, farklı kanser türlerinden kanserle ilgili bir varyant veri seti oluşturulup ve bu veri setinde 13 farklı hesapsal algoritmanın performansı değerlendirilmiştir. İkinci olarak, veri setindeki varyantların özelliklerine dayalı dizi, yapı ve dinamik özellikleri araştırılmıştır. Son olarak, bu özelliklerden tahmine dayalı bir makine öğrenimi modeli oluşturulup, modelimizin performansını mevcut 13 hesapsal patojenite tahmin aracıyla karşılaştırılmıştır. Modelimiz, kapsamlı olarak derlenmiş bir varyant veritabanı olan ClinVar'ın kanserle ilgili varyantları kullanılarak özel olarak eğitilmiştir. Özellikle, bu, kanser varyantları ile özel olarak eğitilmiş ilk model olma özelliği taşımaktadır. Modelimiz geleneksel tahmin yöntemleri ve bunların benzeri algoritmalara kıyasla üstün performans göstermektedir.
dc.description.abstractSingle nucleotide variants (SNVs) refer to alterations where a single base is substituted, which has the potential to impact numerous cellular processes such as gene expression, protein folding, and interactions between proteins, among various other functions. Cancer is a complex and multifactorial disease that arises from genetic alterations leading to an abnormal and uncontrolled proliferation of cells. SNVs have a significant impact on the development of cancer, making them particularly influential in this disease. Precise identification, characterization and prediction of the effects of SNVs play a vital role in comprehending diverse biological mechanisms and their alterations during disease conditions. Variants can result in beneficial, neutral or negative effects on the phenotypic consequences and are defined as benign, neutral or pathogenic, respectively. Benign and neutral variants generally have mild to tolerable or beneficial effects, whereas most pathogenic variants cause damaging effects on individuals. Experimental process of identifying these effects can be time-consuming, inefficient, and inconvenient. Computational methods are becoming increasingly popular for predicting the effects of variants. This thesis work mainly presents results of research on investigating the functional and structural effects of the cancer-related variants on proteins and building a predictive machine learning classifier for the classifying the functional effects of the cancer-related variants. There are three main parts of the thesis. First, we have created a cancer-related variant dataset from different cancer types and assessed the performance 13 different in silico pathogenicity predictors against it. Second, we have investigated and obtained the sequence-, structure- and dynamics-based of the features of the variants in the dataset. Finally, we created and applied a predictive machine learning model from these features and compared the performance of our model with the existing 13 in silico pathogenicity prediction tools. Our model was specifically trained using cancer-related missense variants from ClinVar, an extensively curated germline variant database. Notably, this is the first model specifically trained with cancer germline variants. Moreover, our model demonstrated superior performance compared to conventional prediction methods as well as algorithms similar to those employed by tools.
dc.format.extent185 sayfa : grafik, tablo
dc.identifier.urihttps://katalog.marmara.edu.tr/veriler/yordambt/cokluortam/5B/64c3a48f58486.pdf
dc.identifier.urihttps://hdl.handle.net/11424/292721
dc.language.isoeng
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectBioengineering
dc.subjectbioinformatics
dc.subjectbiyoinformatik
dc.subjectBiyomühendislik
dc.subjectCancer bioinformatics
dc.subjectcancer-related variants
dc.subjectgenomics
dc.subjectgenomiks
dc.subjectKanser biyoenformatiği
dc.subjectkanser ilişkili varyantlar
dc.subjectproteomics
dc.subjectproteomiks
dc.titleComputational investigation of structural and functional effects of cancer related variants
dc.typedoctoralThesis
dspace.entity.typePublication

Files

Collections