醫(yī)療大數(shù)據(jù)智能分析云平臺(tái)培訓(xùn)
課程介紹:
???
本課程將使用影像數(shù)據(jù)、臨床數(shù)據(jù)、檢測(cè)報(bào)告、數(shù)據(jù)集成層、云端服務(wù)器、應(yīng)用層等數(shù)據(jù),詳細(xì)介紹使用特征值類(lèi)型及特征值類(lèi)型結(jié)合進(jìn)行:一階統(tǒng)計(jì)量、形狀特征量、紋理特征量、高斯-拉普拉斯算子特征量、小波變換特征量、平方根濾波特征量、對(duì)數(shù)濾波特征量,重測(cè)信度分析、主成分分析、相關(guān)性分析、聚類(lèi)分析等分析方法,進(jìn)行全方面系統(tǒng)化講解;機(jī)器學(xué)習(xí)模型主要講解SVM Logistic regression? kNN Decision Tree? Random Forest? XGBoost 。
課程大綱
一、課程內(nèi)容:
大數(shù)據(jù)平臺(tái)整體框架
1、數(shù)據(jù)來(lái)源
影像數(shù)據(jù):包括DR、CT、MR、PET等;一 般為DICOM標(biāo)準(zhǔn)格式;結(jié)構(gòu)圖像和功能圖像;
臨床數(shù)據(jù):包括電子病例、體檢報(bào)告、隨訪 報(bào)告等;一般為非結(jié)構(gòu)化數(shù)據(jù);種類(lèi)繁多,數(shù)據(jù)量大;?
檢測(cè)報(bào)告,包括病理檢測(cè)、分子檢測(cè)和遺傳 檢測(cè);結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);圖片和文字 報(bào)告;快速發(fā)展中?
2、數(shù)據(jù)集成層
根據(jù)客戶需求,實(shí)現(xiàn)對(duì)不同廠商的PACS/HIS/LIS/RIS/EMR的對(duì)接,或者使用Uploader上傳無(wú)接口數(shù)據(jù);實(shí)現(xiàn)高速、無(wú)損、安全、低費(fèi)傳輸?
3、云端服務(wù)器
計(jì)算服務(wù)器,使用Docker/GPU等新的大數(shù)據(jù)處理服務(wù)器;實(shí)現(xiàn)數(shù) 據(jù)檢索、分析和統(tǒng)計(jì);使用云計(jì)算、機(jī)器學(xué)習(xí)、自然語(yǔ)義分析等大數(shù)據(jù)處理技術(shù)?
存儲(chǔ)服務(wù)器,根據(jù)客戶需求,定制公有云/私有云/混合云;結(jié)構(gòu)化數(shù)據(jù)使用MySQL,非結(jié)構(gòu) 話數(shù)據(jù)使用Hadoop/MongoDB;實(shí)現(xiàn)分布式存儲(chǔ),彈性分配存儲(chǔ)空間?
4、應(yīng)用層?
日?qǐng)?bào)/月報(bào)/年報(bào)? 院內(nèi)醫(yī)療信息云檢索? 課題管理云平臺(tái)? 腦功能分析云平臺(tái)??
影像組學(xué)云平臺(tái) 腦梗/腦腫瘤智能分割? 胸片智能診斷
特征值類(lèi)型
1、一階統(tǒng)計(jì)量?
? First Order Statistics,共19個(gè),描述感興趣區(qū)內(nèi)的強(qiáng)度信息?
? 包括mean, standard deviation, variance, maximum, median, range, kurtosis 等?
2、形狀特征量
? Shape, 共13個(gè),描述感興趣區(qū)的形狀和大小特征?
? 包括volume, surface area, compactness, 2D/3D maximum diameter, flatness等??
3、紋理特征量
? Texture, 共60個(gè),描述感興趣區(qū)內(nèi)像素間關(guān)系,即圖像的紋理信息
? 包括28個(gè)Gray Level Co-occurrence Matrix (GLCM),16個(gè)Gray Level Size Zone Matrix (GLSZM),16個(gè)Gray Level Run Length Matrix (GLRLM)??
4、高斯-拉普拉斯算子特征量?
? Laplacian of Gaussian (LoG),共158個(gè)?
? 先用高斯函數(shù)對(duì)圖像進(jìn)行平滑降噪,然后用拉普拉斯算子進(jìn)行梯度運(yùn)算,提取變換 后的圖像特征值
5、小波變換特征量
? Wavelet Transform, 共632個(gè)?
? 將圖像信號(hào)分解成一系列小波函數(shù)的疊加,主要用于圖像不同頻域信息的特征提取
6、平方根濾波特征量
? Square root filter, 共79個(gè)?
? 將圖像進(jìn)行平方根濾波后計(jì)算其一階統(tǒng)計(jì)量和紋理特征量?
7、對(duì)數(shù)濾波特征量
? Logarithm filter, 共79個(gè)?
? 將圖像進(jìn)行對(duì)數(shù)濾波后計(jì)算其一階統(tǒng)計(jì)量和紋理特征量
特征值分析:降低數(shù)據(jù)維度的方法
1、重測(cè)信度分析
? test-retest reliability?
? 用來(lái)測(cè)試特征值的穩(wěn)定性和一致性?
? 對(duì)同一組被試進(jìn)行兩次測(cè)量,然后得到結(jié)果的相關(guān)系數(shù),相關(guān)程度高,
?
表示前后測(cè)量一致性高,穩(wěn)定性好?
2、主成分分析
? Principal Component Analysis (PCA) analysis?
? 通過(guò)正交變換,將可能存在的相關(guān)性變量轉(zhuǎn)換為線性不相關(guān)變量,
?
轉(zhuǎn)換后的這 組變量叫做主成分?
? 根據(jù)累計(jì)貢獻(xiàn)率的大小提取前幾個(gè)大的主成分,既保留了原始的大部分信息,
?
又達(dá)到降維的目的?
3、相關(guān)性分析
? Correlation analysis?
? 對(duì)變量的相關(guān)性進(jìn)行分析,從而衡量變量之間的相關(guān)程度
? 保留相關(guān)性較弱的變量?
4、聚類(lèi)分析
? Clustering analysis?
? 將變量按照相似程度劃分類(lèi)型,使得同類(lèi)變量之間的相似性比其他的更強(qiáng)