基于機器學習心肌梗死患者的心磁信號診斷

2021-10-09 07:31趙永鵬朱俊杰
軟件工程 2021年10期
關鍵詞:機器學習心肌梗死

趙永鵬 朱俊杰

摘? 要:使用機器學習方法對心磁數據樣本有無疾病進行診斷分類。首先從心磁數據中提取除極階段(TT間隔)的數據構建磁場圖,然后求解電流密度圖,從電流密度圖中提取相關的磁場特征。針對非平衡數據分類問題,分別使用樣本加權的SVM、LR、KNN、Adaboost和XGBoost五種學習模型進行訓練,在此基礎上設計了使用加權的LR和KNN為初級學習器、SVM為次級學習器的結合學習模型對樣本數據進行訓練。采用結合學習模型對73 名非患者和47 名心肌梗死患者的36 通道心磁數據進行實驗,結果顯示該模型對樣本不均衡的心磁數據分類有較好的效果。

關鍵詞:心磁數據;電流密度圖;機器學習;心肌梗死;結合學習

中圖分類號:TP391? ? ?文獻標識碼:A

Magnetocardiograph Signal Diagnosis of Patients with Myocardial

Infarction based on Machine Learning

ZHAO Yongpeng, ZHU Junjie

(School of Electrical Engineering and Automation, Henan Polytechnic University, Jiaozuo 454000, China)

2959415512@qq.com; junjiezhu@hpu.edu.cn

Abstract: This paper proposes to classify the presence or absence of diseases in magnetocardiograph data samples using machine learning method. First, magnetic field map, constructed by depolarization phase (TT interval) data, is extracted from the cardiac magnetic data. Then current density map is solved. From the current density map, the relevant magnetic field characteristics are extracted. Aiming at the problem of unbalanced data classification, five learning models of sample-weighted SVM (Support Vector Machine), LR (Logistic Regression), KNN (K-Nearest Neighbors), Adaboost and XGBoost are used for training. On this basis, weighted LR and KNN are designed as the primary learners, and weighted SVM as the secondary. The stacking model of the learners trains the sample data. The stacking learning model is used to conduct experiments on the 36-channel magnetocardiograph data of 73 non-patients and 47 myocardial infarction patients. The results show that the model has a good effect on the classification of unbalanced samples of the cardiogram data.

Keywords: magnetocardiograph data; current density map; machine learning; myocardial infarction; stacking learning

1? ?引言(Introduction)

目前,缺血性心臟病是導致人類死亡的主要原因。缺血性心臟病的發生是由于冠狀動脈狹窄,流向心臟的血流受到限制,從而引起心肌損傷,嚴重的可能導致心肌猝死。所以,早期診斷缺血性心臟病對降低死亡率至關重要。

在早期檢測缺血性心臟病中,心磁圖成為一種很有前景的無創診斷工具。心磁圖攜帶心電活動的信息,能夠在一定程度上反映心臟功能的異常。與需要接觸體表測量電位的心電圖相比,無接觸測量的心磁圖能夠提供更高的時空分辨率的電活動定位,并且已經在臨床試驗中表現出較好的效果[1-7]。盡管心磁圖具有優越的信號質量,但需要對它進行解釋的工作量很大,并且強烈依賴于專業醫生的經驗,限制了臨床的使用度。因此,一種能夠檢測診斷早期缺血性心臟病的方法對臨床醫生來說是非常有幫助的。

近年來,機器學習的進展顯示了其在自動檢測缺血性心臟病方面的優勢。KANGWANARIYAKUL等[8]在缺血性心臟病的檢測中比較了不同的機器學習方法,使用貝葉斯神經網絡(BNN)實現了敏感度為96.65%,特異度為86.36%。TAN等[9]從心磁信號的ST段中提取了12 個形態特征,使用SVM分類器,他們獲得的敏感度為95.20%,特異度為93.29%。

二維電流密度圖是一種廣泛應用于檢測缺血性心臟病的直觀方法。使用不同的方法從電流密度圖中提取相關的特征參數,對早期缺血性心臟病進行診斷檢測,已取得較好的診斷結果[10-12]。我們從二維電流密度圖中提取最大電流密度,并把除極階段(TT間隔)的所有最大電流密度進行平均。從平均之后的最大電流密度中提取四個特征參數。針對非平衡數據,分別使用樣本加權的SVM、LR、KNN、Adaboost和XGBoost五種學習模型對提取的特征進行訓練學習。在此基礎上,提出了使用加權的LR和KNN為初級學習器、SVM為次級學習器的結合學習模型,并在實測的心磁數據上驗證了該分類模型的有效性。

2? ?數據與特征(Data and features)

該實驗的數據是由120 個人的心磁數據組成,其中包含73 名非患者,47 名心肌缺血患者。心磁數據是通過超導量子干涉儀(SQUID)在人體胸部上方的36 個相鄰位置,以1,000 Hz的頻率連續測量而獲取的。根據心磁數據構建出心磁圖(MCG),如圖1所示。在心磁圖上定位出R峰(R-peak)、T波開始(T-onset)、T波結束(T-end)及T波的峰值(T-peak)。由于缺血性心臟病與T波密切相關,因此我們只分析TT間隔(TT-interval)的數據,即T波開始的時刻和T波結束的時刻之間的心磁數據。

二維電流密度圖中的矢量大小和方向是從心臟磁場分量測量得到的,測量平面與分量垂直。因此,可由公式(1)得出二維電流密度圖[13-14]。

(1)

其中,為采樣時間,為測量平面上的任意位置。

把單一時刻的心磁數據經過三次樣條插值的處理,進而得到心磁數據的等磁場圖。在等磁場圖的基礎上求解二維電流密度圖,并提取電流密度圖中最大電流密度,如圖2所示,最大電流密度用粗箭頭表示。

然后,求單周期36 通道心磁圖中TT間隔時間內,所有二維電流密度圖中最大電流密度的平均值,如公式(2)所示:

(2)

其中,為TT間隔的時間長度,為采樣時間,為所有電流密度圖中最大電流密度的平均值。

從最大電流密度的平均值中提取四個參數,分別為:

(1)的長度:;

(2)向量的角度:;

(3)由向量構成矩形的周長:;

(4)由向量構成矩形的面積:。

其中,、是在方向上的分量。由于坐標系和測量系統相對于測量者都處于相同的位置,因此不同的測量者產生的這些參數具有可比性。

3? ?方法(Methods)

3.1? ?基于加權分類的機器學習方法

選擇使用傳統機器學習模型中的SVM、LR、KNN、Adaboost和XGBoost來對提取的特征進行學習分析,因為這五種學習模型應用于中小型數據集,并且能夠處理高維數據。另外,由于試驗的樣本中非患者與患者的人數比不均衡,因此使用帶有加權分類的方法進行機器學習,從而使模型更加注重樣本數量少的類別。如果類別的樣本數量多,那么它的權重就低,反之則權重就高。

(3)

其中,為類別j對應權值,為數據總數,為類別數量,即數據有 個種類,是類別j的數據個數。

使用以上五種帶有樣本加權的學習模型對標準化后的訓練樣本進行交叉驗證,并對預測樣本進行預測。分別繪制五種學習模型測試樣本的接受者操作特征曲線(Receiver Operator Characteristic,ROC),如圖3所示。

ROC曲線是通過敏感度與1-特異度在各種閾值下繪制的。ROC曲線越靠近左上角,說明模型的預測精度越高,通常采用曲線下的面積(Area under Curve, AUC)值表示預測結果的概率。

3.2? ?基于加權的結合(Stacking)學習

從統計方面來看,由于學習任務的假設空間往往很大,可能有多個假設在訓練集上達到同等性能,此時若使用單學習器可能因誤選而導致泛化性能不佳,結合多個學習器則會減小這一風險,這一策略就是結合策略[15]。在Stacking學習中,個體學習器稱為初級學習器,用于結合的學習器稱為次級學習器。在上面的五種機器學習模型中,支持性向量機SVM、LR和KNN的結果較好,所以設計了使用LR和KNN為初級學習器,SVM為次級學習器。其中作為初級學習器的LR和KNN仍然進行樣本加權處理,而SVM不用進行加權處理。Stacking學習具體步驟如下:

第一步初級訓練階段:分別使用加權后的LR和KNN學習器對訓練樣本進行交叉驗證學習,使用每一折中訓練數據訓練模型,對每一折中的驗證數據的標簽進行預測。這樣在交叉驗證后,可以得到全部折中驗證數據標簽的預測值。把這些預測值按照順序進行堆疊,形成訓練數據的新特征。同時,在每一次折中使用訓練數據訓練出模型后,對測試集數據的標簽進行預測。交叉驗證之后得到全部的預測標簽值,并把全部的預測標簽值進行平均,得到每個測試樣本唯一的預測值,用來作為測試集新特征。

第二步次級分類階段:使用核函數為高斯核函數的SVM作為次級學習器,沒有進行樣本加權處理。使用第一步中得出的訓練數據新特征作為次級學習器的訓練數據,訓練出模型后,對第一步得出的測試集新特征的標簽進行預測。不管是第一階段還是第二階段,數據的標簽沒有變化。

繪制Stacking學習模型測試樣本的接受者操作特征曲線(ROC),如圖4所示。

4? ?結果與分析(Results and analysis)

我們使用準確率、敏感度、特異度和AUC值作為主要參考的評價指標。此外,在醫學中敏感度為真陽性率,即實際患者試驗結果為陽性的比例;特異度為真陰性率,即非患者試驗結果為陰性的比例。敏感度和特異度在理論上與疾病患病率無關,僅由診斷試驗本身決定,不受外界因素的影響。

在表1中,記錄了沒有進行樣本加權處理的五種學習模型對應ROC曲線下的面積AUC的值,以及五種學習模型處于最佳閾值時的準確率、敏感度和特異度。

在表2中,記錄了進行樣本加權的五種學習模型對應ROC曲線下的面積AUC的值,以及五種學習模型處于最佳閾值時的準確率、敏感度和特異度。

在表3中,記錄了進行樣本加權處理的Stacking學習模型對應ROC曲線下的面積AUC的值,以及模型處于最佳閾值時的準確率、敏感度和特異度。

從表1至表3可知:

(1)采用樣本加權處理的單個機器學習較沒有進行樣本加權的機器學習的預測效果好。

(2)采用樣本加權后的Stacking學習模型能夠同時提高準確率、特異度和AUC值,相比采用樣本加權處理的單個機器學習和未進行樣本加權處理的單個機器學習預測效果好。

5? ?結論(Conclusion)

本研究中,我們從心磁數據中提取除極階段(TT間隔)的數據,求解電流密度圖,提取磁場特征參數。為了解決非平衡數據分類中易于傾向判別為多數類的問題,本文首先利用進行樣本加權處理的SVM、LR、KNN、Adaboost和XGBoost五種學習模型進行學習分析,進而診斷心肌梗死。在此基礎上,觀察到SVM、KNN和LR這三種學習模型的分類效果較好,所以設計了使用帶有加權屬性的KNN和LR作為初級學習器,使用不帶加權屬性的SVM作為次級學習器進行結合學習,并對樣本不平衡的心磁信號數據進行分類。該算法能夠有效減少數據不平衡對單個分類器分類效果的影響。

本文使用實測MCG數據做了三組實驗的比較,結果顯示:采用樣本加權處理的單個機器學習較沒有進行樣本加權處理的機器學習的預測效果好;采用樣本加權后的Stacking學習模型能夠獲得較好的預測效果。

參考文獻(References)

[1] HAILER B, CHAIKOVSKY I, AUTH-EISERNITZ S, et al. The value of magnetocardiography in patients with and without relevant stenoses of the coronary arteries using an unshielded system[J]. Pacing and Clinical Electrophysiology: PACE, 2005, 28(1):8-16.

[2] HAILER B, LEEUWEN P V, CHAIKOVSKY I, et al. The value of magnetocardiography in the course of coronary intervention[J]. Ann Noninvasive Electrocardiol, 2015, 10(2):188-196.

[3] PARK J W, HILL P M, CHUNG N, et al. Magnetocardiography predicts coronary artery disease in patients with acute chest pain[J]. Annals of Noninvasive Electrocardiology, 2005, 10(3):312-323.

[4] STEINBERG B A, ROGUIN A, WATKINS S P, et al. Magnetocardiogram recordings in a nonshielded environment—reproducibility and ischemia detection[J]. Annals of Noninvasive Electrocardiology, 2005, 10(2):152-160.

[5] TOLSTRUP K, MADSEN B E, RUIZ J A, et al. Non-invasive resting magnetocardiographic imaging for the rapid detection of ischemia in subjects presenting with chest pain[J]. Cardiology, 2006, 106(4):270-276.

[6] PARK J W, LEITH?USER B, HILL P, et al. Resting magnetocardiography predicts 3-year mortality in patients presenting with acute chest pain without ST segment elevation[J]. Annals of Noninvasive Electrocardiology, 2008, 13(2):171-179.

[7] KANDORI A, OGATA K, MIYASHITA T, et al. Subtraction magnetocardiogram for detecting coronary heart disease[J]. Annals of Noninvasive Electrocardiology, 2010, 15(4):360-368.

[8] KANGWANARIYAKUL Y, NANTASENAMAT C, TANTIMONGCOLWAT T, et al. Data mining of magnetocardiograms for prediction on ischemic heart disease[J]. Excli Journal, 2010, 9:82-95.

[9] TAN J H, HAGIWARA Y, PANG W, et al. Application of stacked convolutional and long short-term memory network for accurate identification of CAD ECG signals[J]. Computers in Biology and Medicine, 2018, 94:19-26.

[10] OGATA K, KANDORI A, WATANABE Y, et al. Repolarization spatial-time current abnormalities in patients with coronary heart disease[J]. Pacing and Clinical Electrophysiology, 2009, 32(4):516-524.

[11] KANDORI A, OGATA K, MIYASHITA T, et al. Subtraction magnetocardiogram for detecting coronary heart disease[J]. Annals of Noninvasive Electrocardiology, 2010, 15(4):360-368.

[12] KWON H, KIM K, LEE Y H, et al. Non-invasive magnetocardiography for the early diagnosis of coronary artery disease in patients presenting with acute chest pain[J]. Circulation Journal, 2010, 74(7):1424-1430.

[13] COHEN D, EDELSACK E A, Zimmerman J E. Magnetocardiograms taken inside a shielded room with a superconducting point-contact magnetometer[J]. Appl. Phys. Lett., 1970, 16(7):278-280.

[14] HOSAKA H, COHEN D. Part IV visual determination of generators of the magnetocardiogram[J]. Electrocardiol, 1976, 9(4):426-432.

[15] 周志華.機器學習[M].北京:清華大學出版社,2016:183-185.

作者簡介:

趙永鵬(1994-),男,碩士生.研究領域:信號與信息處理.

朱俊杰(1981-),男,博士,講師.研究領域:信號與信息處理.

猜你喜歡
機器學習心肌梗死
這些疼痛可能預示心肌梗死來臨
心梗突發 牢牢把握兩個“120”
“胸痛991”助你救心梗
基于大數據技術的網絡異常行為分析監測系統
淺談汽車無人駕駛技術
機器學習在大視頻運維中的應用
機器學習技術在民航安全管理中的應用探析
基于LDA模型的文本分類與觀點挖掘
深度學習在城市交通流預測中的實踐研究
乙胺碘呋酮治療急性心肌梗死室性心律失常41例療效觀察
中文天堂最新版在线www-bt天堂网www天堂-电影天堂 宅男电影
许家印为恒大注入超70亿续命资金 速度与激情9 嘉南传 国际人士热议中共十九届六中全会 千与千寻 星际穿越 两个女人 男子写80页PPT拯救爱情却离婚 许家印为恒大注入超70亿续命资金 大连一密接者擅自点外卖聚餐被调查 许家印为恒大注入超70亿续命资金 中国共产党第三个历史决议全文发布 两个女人 我和我的家乡 男子体检血中抽出2升油浆 安娜贝尔 意大利错失直接晋级世界杯资格 国足战澳大利亚大名单:4归化在列 花木兰 林丹世界排名被正式移除 长津湖 意大利错失直接晋级世界杯资格 意大利错失直接晋级世界杯资格 大连现超级传播者26人在同一传播链 蜘蛛侠:英雄归来 俄方回应卫星碎片危及国际空间站 安娜贝尔 两个女人 24岁救人牺牲消防员获批为烈士 突围 怒火·重案 国足战澳大利亚大名单:4归化在列 大连一密接者擅自点外卖聚餐被调查 意大利错失直接晋级世界杯资格 加拿大一枝黄花到底是什么? 花木兰 你好李焕英 斛珠夫人 周冠宇成为中国首位F1车手 房价上涨城市创七年新低 拐点来了? 周冠宇成为中国首位F1车手 加拿大一枝黄花到底是什么? 男子体检血中抽出2升油浆 扬名立万 中国共产党第三个历史决议全文发布 长津湖 加拿大一枝黄花到底是什么? 逆局 峰爆 林丹世界排名被正式移除 北京冬奥火炬宣传片获金花环奖 24岁救人牺牲消防员获批为烈士 大连现超级传播者26人在同一传播链 长津湖 大连现超级传播者26人在同一传播链 速度与激情9 灵媒 国际人士热议中共十九届六中全会 中美元首会谈重点内容 大连一密接者擅自点外卖聚餐被调查 浦发银行回应近3亿存款莫名被质押 加拿大一枝黄花到底是什么? 扫黑风暴 十九届六中全会公报发布 #耿直真香哥黑化卖惨# 国际人士热议中共十九届六中全会 安娜贝尔 我和我的家乡 24岁救人牺牲消防员获批为烈士 国际人士热议中共十九届六中全会 灵媒
拉萨市| 阆中市| 鄂尔多斯市| 唐河县| 交口县| 左权县| 府谷县| 庆安县| 定州市| 余庆县| 霍城县| 奇台县| 同德县| 邛崃市| 上犹县| 健康| 常州市| 永康市| 禹州市| 项城市| 咸丰县| 交城县| 吴桥县| 银川市|