Feature Selection and Discretization for Improving Classification Performance on Cac Data Set

Loading...
Thumbnail Image

Date

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Kadir Has Üniversitesi

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Data Mining usage in Health Sector increased much in this decade because of the need for efficient treatment. From cost-cutting in medical expenses to acting as a Decision Support System for patient diagnosis, Data Mining nowadays is a strong companion in Health Sector. The dataset used in this thesis belongs to Dr. Nurhan Seyahi. Dr. Nurhan Seyahi and his colleagues made a research about Coronary Artery Calcification in 178 patients having renal transplantation recently. They used conventional statistical methods in their research. By using the power of data mining, this thesis shows the importance of feature selection and discretization used with classification methods for acting as a decision support system in patient diagnosis for CAC Dataset. Just by looking at seven important attributes, which are; age, time of transplantation, diabetes mellitus, phosphor, rose angina test, donor type and patient history, doctors can decide whether the patient has coronary artery calcification or not with approximately 70% accuracy. After the discretization process this accuracy approximately increases to 75% in some algorithms. Thus becoming a strong decision support system for doctors working in this area.
Veri Madenciliği'nin sağlık alanında kullanımı son 10 yılda verimli tedavi ihtiyacı dolayısıyla artmıştır. Veri Madenciliği günümüzde sağlık alanında güçlü bir yardımcıdır. Sağlık harcamalarının kesilmesinden, hasta teşhisinde karar destek sistemi olarak rol almasına kadar uzanır. Bu tezde kullanılan verisetinin sahibi Dr. Nurhan Seyahi'dir. Dr. Nurhan Seyahi ve meslektaşları 178 tane böbrek nakli geçirmiş hastalarda Koroner Arterlerde Kalsifikasyon üzerine araştırma yapmışlardır. Onlar araştırmalarında geleneksel istatistik metodlarını kullanmışlardır. Bu tez, veri madenciliğinin gücünü kullanarak, öznitelik seçme ve ayrıklaştırma metodlarıyla beraber sınıflandırma algoritmalarının kullanılmasıyla Koroner Arterlerde Kalsifikasyon olup olmadığınının incelenmesinin önemini göstermektedir. Sadece yedi özniteliğe bakarak, ki bunlar; yaş, nakil süresi, diabet, fosfor, rose anjina testi, verici tipi ve hastanın hastalık geçmişi olmak üzere, doktorlar hastada koroner arterlerde kalsifikasyon olup olmadığına yaklaşık 70% doğrulukta karar verebilirler. Veri ayrıklaştırma işleminden sonra bu başarı oranı bazı algoritmalarda 75% civarlarına yükselir. Bu nedenle bu alanda çalışan doktorlar için kuvvetli bir karar destek sistemi olur.

Description

Keywords

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

Collections

Page Views

1

checked on Nov 07, 2025

Downloads

127

checked on Nov 07, 2025

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

1

NO POVERTY
NO POVERTY Logo

3

GOOD HEALTH AND WELL-BEING
GOOD HEALTH AND WELL-BEING Logo

8

DECENT WORK AND ECONOMIC GROWTH
DECENT WORK AND ECONOMIC GROWTH Logo

11

SUSTAINABLE CITIES AND COMMUNITIES
SUSTAINABLE CITIES AND COMMUNITIES Logo

12

RESPONSIBLE CONSUMPTION AND PRODUCTION
RESPONSIBLE CONSUMPTION AND PRODUCTION Logo

16

PEACE, JUSTICE AND STRONG INSTITUTIONS
PEACE, JUSTICE AND STRONG INSTITUTIONS Logo

17

PARTNERSHIPS FOR THE GOALS
PARTNERSHIPS FOR THE GOALS Logo