Feature selection and discretization for improving classification performance on CAC data set

Loading...
Thumbnail Image

Date

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Kadir Has Üniversitesi

Research Projects

Organizational Units

Journal Issue

Abstract

Data Mining usage in Health Sector increased much in this decade because of the need for efficient treatment. From cost-cutting in medical expenses to acting as a Decision Support System for patient diagnosis, Data Mining nowadays is a strong companion in Health Sector. The dataset used in this thesis belongs to Dr. Nurhan Seyahi. Dr. Nurhan Seyahi and his colleagues made a research about Coronary Artery Calcification in 178 patients having renal transplantation recently. They used conventional statistical methods in their research. By using the power of data mining, this thesis shows the importance of feature selection and discretization used with classification methods for acting as a decision support system in patient diagnosis for CAC Dataset. Just by looking at seven important attributes, which are; age, time of transplantation, diabetes mellitus, phosphor, rose angina test, donor type and patient history, doctors can decide whether the patient has coronary artery calcification or not with approximately 70% accuracy. After the discretization process this accuracy approximately increases to 75% in some algorithms. Thus becoming a strong decision support system for doctors working in this area.
Veri Madenciliği'nin sağlık alanında kullanımı son 10 yılda verimli tedavi ihtiyacı dolayısıyla artmıştır. Veri Madenciliği günümüzde sağlık alanında güçlü bir yardımcıdır. Sağlık harcamalarının kesilmesinden, hasta teşhisinde karar destek sistemi olarak rol almasına kadar uzanır. Bu tezde kullanılan verisetinin sahibi Dr. Nurhan Seyahi'dir. Dr. Nurhan Seyahi ve meslektaşları 178 tane böbrek nakli geçirmiş hastalarda Koroner Arterlerde Kalsifikasyon üzerine araştırma yapmışlardır. Onlar araştırmalarında geleneksel istatistik metodlarını kullanmışlardır. Bu tez, veri madenciliğinin gücünü kullanarak, öznitelik seçme ve ayrıklaştırma metodlarıyla beraber sınıflandırma algoritmalarının kullanılmasıyla Koroner Arterlerde Kalsifikasyon olup olmadığınının incelenmesinin önemini göstermektedir. Sadece yedi özniteliğe bakarak, ki bunlar; yaş, nakil süresi, diabet, fosfor, rose anjina testi, verici tipi ve hastanın hastalık geçmişi olmak üzere, doktorlar hastada koroner arterlerde kalsifikasyon olup olmadığına yaklaşık 70% doğrulukta karar verebilirler. Veri ayrıklaştırma işleminden sonra bu başarı oranı bazı algoritmalarda 75% civarlarına yükselir. Bu nedenle bu alanda çalışan doktorlar için kuvvetli bir karar destek sistemi olur.

Description

Keywords

Turkish CoHE Thesis Center URL

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

Collections