數(shù)據(jù)挖掘技術(shù)是指從大量的倍奢、不完全的武骆、有噪聲的莽囤、模糊的详民、隨機(jī)的數(shù)據(jù)中提取隱含在其中的巩恼、人們事先不知道的心爷,但又是潛在有用的信息和知識的過程赞季。數(shù)據(jù)挖掘技術(shù)在醫(yī)保監(jiān)管中具有重要的應(yīng)用價(jià)值愧捕,通過對醫(yī)保大數(shù)據(jù)的處理和分析,可以發(fā)現(xiàn)各種隱蔽性的欺詐騙保行為碟摆,從而提供有效的監(jiān)管手段晃财。此外,數(shù)據(jù)挖掘技術(shù)還可以幫助建立個(gè)體化監(jiān)管模型典蜕,對醫(yī)療服務(wù)方進(jìn)行精準(zhǔn)監(jiān)管断盛,確保醫(yī)保基金的合理合法使用愉舔。因此钢猛,充分應(yīng)用醫(yī)保大數(shù)據(jù)挖掘新技術(shù)實(shí)施全過程智能監(jiān)管是解決醫(yī)保監(jiān)管痛點(diǎn)和難點(diǎn)的關(guān)鍵伙菜,是實(shí)現(xiàn)醫(yī)保高質(zhì)量發(fā)展必不可少的技術(shù)手段。
大數(shù)據(jù)挖掘應(yīng)用下的醫(yī)保監(jiān)管案例分析——上海市醫(yī)保醫(yī)師畫像模型
1.醫(yī)保醫(yī)師畫像模型建立的背景
醫(yī)保醫(yī)師是在執(zhí)業(yè)醫(yī)師的基礎(chǔ)上為規(guī)范與醫(yī)保相關(guān)的執(zhí)業(yè)行為而構(gòu)建的新身份命迈,與醫(yī)保部門簽訂服務(wù)協(xié)議贩绕,能夠?yàn)閰⒈H颂峁┽t(yī)療服務(wù)的執(zhí)業(yè)醫(yī)師。因個(gè)別醫(yī)師的醫(yī)保違規(guī)行為懲罰整個(gè)醫(yī)療機(jī)構(gòu)不盡合理壶愤,加之臨床病種種類繁雜淑倾,使得醫(yī)保監(jiān)管難度增大,建立醫(yī)保醫(yī)師制度是醫(yī)保監(jiān)管的發(fā)展趨勢涮饱。將醫(yī)保監(jiān)管從醫(yī)療機(jī)構(gòu)延伸至醫(yī)師個(gè)人绸廉,診療行為與醫(yī)保支付掛鉤并強(qiáng)化監(jiān)管,有利于實(shí)現(xiàn)醫(yī)背T瘢基金的合理使用姨痊。
上海市以現(xiàn)代化手段推動醫(yī)保基金監(jiān)管笆赤,探索醫(yī)惫罕罚基金監(jiān)管新路徑,與信息公司進(jìn)行合作開發(fā)粮唯,將研究成果轉(zhuǎn)化為實(shí)際的應(yīng)用杂猾。為解決醫(yī)保監(jiān)管中醫(yī)療機(jī)構(gòu)規(guī)避問題的情況,應(yīng)用數(shù)據(jù)挖掘新技術(shù)(如無監(jiān)督機(jī)器學(xué)習(xí)方法)徽捶,聚焦理療痘宋、康復(fù)和中醫(yī)治療中的違規(guī)收費(fèi)、虛構(gòu)服務(wù)等較為普遍的問題淡箱,建立醫(yī)師畫像模型,對醫(yī)師診療行為的不同特征進(jìn)行預(yù)警處理辩块。
2.醫(yī)保醫(yī)師畫像模型應(yīng)用數(shù)據(jù)挖掘新技術(shù)的方法
利用醫(yī)保大數(shù)據(jù)優(yōu)勢蛔六,結(jié)合門診醫(yī)師的基本信息、接診信息以及接診病人的人群特征信息等指標(biāo)废亭,上海市醫(yī)保部門應(yīng)用數(shù)據(jù)挖掘技術(shù)新方法国章,對醫(yī)師畫像進(jìn)行深入分析,篩選出疑點(diǎn)醫(yī)生并建立預(yù)警級別豆村。
該模型主要采用以下方法液兽。
(1)標(biāo)準(zhǔn)化:對數(shù)據(jù)特征進(jìn)行歸一化處理,消除不同指標(biāo)之間的量綱影響掌动,以確保它們具有可比性和可解釋性四啰。
(2)相關(guān)性分析:研究變量間的關(guān)系,消除可能存在的多重共線性粗恢。
(3)K均值聚類:將給定的數(shù)據(jù)集劃分為K個(gè)不重疊的簇柑晒,基于數(shù)據(jù)點(diǎn)之間的距離來確定簇的分配欧瘪,并通過迭代的方式優(yōu)化簇的中心位置。
(4)邏輯回歸:將醫(yī)保醫(yī)師根據(jù)不同特征劃分為多個(gè)不同類別匙赞,且各個(gè)類別之間無明確的次序關(guān)系佛掖。
(5)決策樹模型:自上而下對樣本數(shù)據(jù)進(jìn)行樹形分類。每個(gè)節(jié)點(diǎn)代表一個(gè)屬性或特征季距,每個(gè)分支代表該屬性的不同取值虚蹋,每個(gè)葉節(jié)點(diǎn)代表一個(gè)類別或一個(gè)預(yù)測結(jié)果。
(6)層次分析(analytic hierarchy process, AHP):計(jì)算出變量權(quán)重蒿蛆,并對醫(yī)保醫(yī)師進(jìn)行打分帘缤。可以將主觀判斷量化俏堆,并提供一種系統(tǒng)化的方法進(jìn)行決策憋屑。
3.醫(yī)保醫(yī)師畫像模型的建立步驟
本研究納入11699名醫(yī)保醫(yī)師,通過數(shù)據(jù)分析和專家意見對其進(jìn)行多維度全方位的行為研究篡呆,確定了30個(gè)模型變量汽后,包括接診信息、“治療三費(fèi)”摇龟、專家意見三個(gè)維度的指標(biāo)两胃。其中,接診信息包括當(dāng)月醫(yī)生接診數(shù)量及接診費(fèi)用遮乾、當(dāng)月醫(yī)生日均接診數(shù)量及接診費(fèi)用专肪、當(dāng)月醫(yī)生日接診最多病人數(shù)及最高費(fèi)用;“治療三費(fèi)”即當(dāng)月醫(yī)生康復(fù)治療堪侯、理療嚎尤、中醫(yī)治療費(fèi)用占所有費(fèi)用的比重;專家意見是將中醫(yī)伍宦、康復(fù)專家觀點(diǎn)轉(zhuǎn)化為醫(yī)生開具診療項(xiàng)目的數(shù)量(單次超量)芽死、頻次(頻繁開具)、項(xiàng)目間的關(guān)聯(lián)(組合收費(fèi))次洼。
第一步关贵,采用相關(guān)性分析方法,對各變量進(jìn)行兩兩相關(guān)分析卖毁。相關(guān)性系數(shù)≤0.4表示變量之間不相關(guān)揖曾,選取不相關(guān)變量納入研究,將最初的30個(gè)變量降至10個(gè)變量納入模型亥啦。
第二步炭剪,采用無監(jiān)督機(jī)器學(xué)習(xí)算法,根據(jù)降維得到的10個(gè)指標(biāo)變量對醫(yī)師進(jìn)行分類,得出每一類醫(yī)師的特征念祭。選擇K均值聚類算法將被觀測醫(yī)師分為無重疊的15類沽票,每個(gè)醫(yī)生都有對應(yīng)的類別標(biāo)簽。選用無序多分類邏輯回歸模型對醫(yī)師分類結(jié)果進(jìn)行驗(yàn)證裙系,結(jié)果顯示預(yù)測標(biāo)簽一致率較高憋考。
第三步,使用決策樹模型得到各分類的影響因子眼膊,其系數(shù)越大表示對醫(yī)師分類的影響越大绪樊。系統(tǒng)給出每一行色階分布,顏色偏向紅色表示指標(biāo)數(shù)值越大舆鸿,偏向綠色表示指標(biāo)數(shù)值越小藐篡,指標(biāo)數(shù)值越大越需要重點(diǎn)關(guān)注。利用AHP層次分析法計(jì)算出變量權(quán)重翰发,結(jié)合實(shí)際監(jiān)管經(jīng)驗(yàn)及指標(biāo)意義辑剿,選取疑點(diǎn)醫(yī)生簇。
第四步吮骑,根據(jù)疑點(diǎn)醫(yī)生分?jǐn)?shù)的分布情況坚浩,建立疑點(diǎn)醫(yī)生的紅橙黃三級預(yù)警機(jī)制。從醫(yī)生分值的上四分位數(shù)到最大值為紅色預(yù)警循头,下四分位數(shù)到上四分位數(shù)為橙色預(yù)警绵估,最小值到下四分位數(shù)為黃色預(yù)警。針對疑點(diǎn)醫(yī)生進(jìn)行實(shí)地核驗(yàn)卡骂,反饋的結(jié)果用于優(yōu)化模型国裳。
4.醫(yī)保醫(yī)師畫像模型的應(yīng)用
醫(yī)師畫像模型作為一種評估工具,能夠?yàn)楸O(jiān)管機(jī)構(gòu)提供參考信息全跨,輔助進(jìn)行醫(yī)師違規(guī)行為的判斷缝左。例如,醫(yī)師畫像模型可能會識別醫(yī)師的臨床質(zhì)量螟蒸、醫(yī)療安全記錄盒使、患者滿意度等指標(biāo),這些指標(biāo)與醫(yī)師是否存在違規(guī)行為相關(guān)七嫌。醫(yī)師畫像模型可根據(jù)這些指標(biāo)信息篩選出疑點(diǎn)醫(yī)生,監(jiān)管機(jī)構(gòu)可以根據(jù)這些信息有針對性地進(jìn)行調(diào)查和監(jiān)管苞慢。2021年诵原,上海市對11699名康復(fù)醫(yī)生的基本信息、執(zhí)業(yè)情況挽放、處方偏好狠寒、日均費(fèi)用、監(jiān)管查處計(jì)分等特征進(jìn)行畫像,篩選疑點(diǎn)醫(yī)生伐狼,建立預(yù)警指標(biāo)體系臣塑。識別疑點(diǎn)醫(yī)生1000余人,涉及疑點(diǎn)費(fèi)用超過1400萬元岁十,其中高風(fēng)險(xiǎn)醫(yī)生占到疑點(diǎn)醫(yī)生數(shù)量的20%左右特干,涉及疑點(diǎn)費(fèi)用占疑點(diǎn)費(fèi)用總額的60%以上,實(shí)現(xiàn)了預(yù)警與風(fēng)險(xiǎn)控制前置惦踩,提升了醫(yī)保欺詐管理能力涨剧。
應(yīng)用模型確定疑點(diǎn)醫(yī)師名單,約談疑點(diǎn)醫(yī)師敲骏,對違反醫(yī)保規(guī)定的執(zhí)業(yè)醫(yī)師作出暫停醫(yī)保結(jié)算等行政處理樊淑,對醫(yī)保醫(yī)師能夠起到較好的警示作用。醫(yī)師畫像模型提升了醫(yī)保醫(yī)師信用體系建設(shè)的水平蝇降,為規(guī)范醫(yī)師行為提供幫助铜缠,對保障醫(yī)保基金安全具有重要意義饵骨。
大數(shù)據(jù)挖掘新技術(shù)在醫(yī)保監(jiān)管中的成果與效益
1.醫(yī)保智能監(jiān)管系統(tǒng)
上海市建成了覆蓋各醫(yī)保險(xiǎn)種和監(jiān)管對象的全流程翘悉、全方位、立體化的醫(yī)保智能監(jiān)管系統(tǒng)宏悦。該系統(tǒng)涵蓋了總覽镐确、智能監(jiān)控、行政執(zhí)法饼煞、信用監(jiān)管和綜合評價(jià)五大版塊源葫,貫穿線索發(fā)現(xiàn)、調(diào)查取證砖瞧、違規(guī)處理息堂、結(jié)果應(yīng)用四大環(huán)節(jié),具備事前提醒块促、事中控制荣堰、事后追蹤三大功能。
該系統(tǒng)具備預(yù)警監(jiān)控竭翠、監(jiān)控案件管理振坚、綜合查詢、規(guī)則篩查等功能祠劣,其中最核心的預(yù)警監(jiān)控功能下又分為多卡聚集秤淀、三費(fèi)預(yù)警、人床分離耗萝、人卡分離世荐、異常檢驗(yàn)、一臉多卡、區(qū)塊鏈進(jìn)銷存等十多個(gè)大數(shù)據(jù)主題預(yù)警模型介腻。截至2023年6月榔晃,一臉多卡模型已經(jīng)覆蓋848家藥店,上海市醫(yī)保部門運(yùn)用三費(fèi)預(yù)警模型將預(yù)警醫(yī)生列為約談對象酱滞,區(qū)塊鏈進(jìn)銷存模型已覆蓋297家定點(diǎn)機(jī)構(gòu)招殊,對醫(yī)療機(jī)構(gòu)和藥店進(jìn)行風(fēng)險(xiǎn)排名。這些模型可以通過大數(shù)據(jù)蛀篓、人工智能等技術(shù)卢历,在海量醫(yī)保基金結(jié)算信息中自動抓取疑點(diǎn)丸爵,并進(jìn)行智能研判和快速預(yù)警蜒秤。當(dāng)執(zhí)法人員在監(jiān)管系統(tǒng)中看到預(yù)警后,便會循著線索前往醫(yī)院核查亚斋,在大數(shù)據(jù)的助力下讓違規(guī)行為無處遁形作媚,實(shí)現(xiàn)了對醫(yī)保違規(guī)的精準(zhǔn)定位、定性和定量管理帅刊。
2.醫(yī)保信息智能監(jiān)控知識庫
上海市建立了醫(yī)保智能監(jiān)控知識庫纸泡,包括基識庫、監(jiān)控規(guī)則庫赖瞒、分析指標(biāo)庫和大數(shù)據(jù)主題模型庫女揭,目前已完善優(yōu)化了24萬條監(jiān)控知識庫和6萬條規(guī)則庫。針對長護(hù)險(xiǎn)居家護(hù)理栏饮、“互聯(lián)網(wǎng)+”醫(yī)療吧兔、DRG/DIP付費(fèi)等醫(yī)保新業(yè)態(tài),市醫(yī)保部門探索打造數(shù)字化轉(zhuǎn)型場景新應(yīng)用袍嬉。結(jié)合上海市開展DRG/DIP支付試點(diǎn)境蔼,將1.4萬余個(gè)標(biāo)準(zhǔn)病組、近900個(gè)DRG分組庫納入知識庫統(tǒng)一管理伺通。將實(shí)際檢查工作中運(yùn)用的近200條規(guī)則納入監(jiān)控規(guī)則庫箍土,將對民辦醫(yī)療機(jī)構(gòu)預(yù)警檢查中運(yùn)用的近400條指標(biāo)優(yōu)化后納入分析指標(biāo)庫,并擴(kuò)展使用范圍至全市所有的定點(diǎn)醫(yī)療機(jī)構(gòu)嫌隆。
上海醫(yī)保智能監(jiān)管系統(tǒng)構(gòu)成一張“天網(wǎng)”逸讹,醫(yī)保基金監(jiān)管隊(duì)伍組成一張“地網(wǎng)”荷况,基金安全“防護(hù)網(wǎng)”更加織密扎牢徒妒。醫(yī)保部門應(yīng)用知識圖譜和無監(jiān)督機(jī)器學(xué)習(xí)等方法構(gòu)建基于知識圖譜的規(guī)則邏輯風(fēng)控預(yù)警模型,形成了全市共享和動態(tài)更新機(jī)制旷厨,實(shí)現(xiàn)了數(shù)據(jù)監(jiān)控和疑點(diǎn)排查100%全覆蓋。2021年,通過智能監(jiān)管系統(tǒng)篩查出8900萬余條定點(diǎn)醫(yī)藥機(jī)構(gòu)疑點(diǎn)數(shù)據(jù)腋意、49.2萬就診購藥異常的參保人員容蕉。2019年—2023年,上海市醫(yī)保局對11575家違規(guī)定點(diǎn)機(jī)構(gòu)追款5.5億余元往软,對11696人次違規(guī)參保個(gè)人追款2000余萬元亩当,共追回醫(yī)保基金近6億元哟蝉。
大數(shù)據(jù)挖掘新技術(shù)應(yīng)用于醫(yī)保監(jiān)管的經(jīng)驗(yàn)與思考
上海市醫(yī)保智能監(jiān)管為其他地區(qū)推廣醫(yī)保大數(shù)據(jù)挖掘與應(yīng)用蜓耻、推進(jìn)醫(yī)保信息化建設(shè)提供了參考經(jīng)驗(yàn)。然而也存在一些問題與挑戰(zhàn)械巡,比如當(dāng)?shù)蒯t(yī)保信息平臺與國家醫(yī)保信息平臺對接不及時(shí)刹淌,數(shù)據(jù)挖掘的深度及廣度有限等。因此讥耗,提出以下思考有勾。
1.完善法規(guī)及政策,為醫(yī)保監(jiān)管提供制度保障
上海市制定和完善了一系列醫(yī)保智能監(jiān)管相關(guān)的法律法規(guī)和政策文件古程,明確了醫(yī)保支付行為的監(jiān)管要求和標(biāo)準(zhǔn)蔼卡。法律法規(guī)的有效實(shí)施,不僅可以提升醫(yī)保監(jiān)管的水平和效能挣磨,也可以為其他地區(qū)的基金監(jiān)管智能化提供有益的借鑒和參考雇逞。
2.加強(qiáng)醫(yī)保大數(shù)據(jù)平臺建設(shè),及時(shí)對接國家平臺
目前茁裙,上海市醫(yī)保信息平臺數(shù)據(jù)比較混亂塘砸,未做到數(shù)據(jù)的規(guī)范統(tǒng)一和完整,不能及時(shí)與國家信息平臺對接呜达。醫(yī)保信息平臺的建設(shè)應(yīng)規(guī)范數(shù)據(jù)采集和錄入流程姚垂,建立數(shù)據(jù)清洗和校驗(yàn)機(jī)制,排除數(shù)據(jù)中的錯(cuò)誤和重復(fù)信息等槽脑,提高數(shù)據(jù)可信度和可用性障氛,推進(jìn)醫(yī)保平臺標(biāo)準(zhǔn)化建設(shè)。建議依托全國統(tǒng)一大平臺煌摊,從完整度衫沽、準(zhǔn)確性、標(biāo)準(zhǔn)化资杆、可用性酒吠、安全性等方面持續(xù)對醫(yī)保大數(shù)據(jù)開展動態(tài)治理。
3.強(qiáng)化數(shù)據(jù)挖掘分析方法课陪,加強(qiáng)相關(guān)人員能力培訓(xùn)
上海市設(shè)置了專業(yè)部門開展數(shù)據(jù)挖掘開發(fā)工作唇佳,建立了產(chǎn)骏点、學(xué)、研聯(lián)動機(jī)制杆叛。采用先進(jìn)的數(shù)據(jù)挖掘工具和算法谷芬,對醫(yī)保數(shù)據(jù)進(jìn)行深度挖掘和分析。下一步模聋,醫(yī)保部門可加強(qiáng)相關(guān)人員的培訓(xùn)和能力建設(shè)肩民,提高其在數(shù)據(jù)挖掘和分析方面的專業(yè)知識和技能,從而提高監(jiān)管的準(zhǔn)確性和效能链方。
4.加強(qiáng)多部門協(xié)作持痰,讓有需求的應(yīng)用盡快落地
上海市建立了跨部門、跨地區(qū)的數(shù)據(jù)共享機(jī)制祟蚀,與高校及科研機(jī)構(gòu)開展課題研究工窍,與信息公司進(jìn)行合作并轉(zhuǎn)化為實(shí)際的應(yīng)用。建議繼續(xù)加強(qiáng)與相關(guān)企業(yè)和科研機(jī)構(gòu)的合作暂题,促進(jìn)醫(yī)保數(shù)據(jù)的共享和交流移剪,提高數(shù)據(jù)的價(jià)值和應(yīng)用效果,共同推動大數(shù)據(jù)挖掘技術(shù)在醫(yī)保監(jiān)管中的應(yīng)用研究和創(chuàng)新薪者。同時(shí)纵苛,還應(yīng)加強(qiáng)與國家醫(yī)保信息平臺、衛(wèi)生健康言津、藥監(jiān)攻人、民政、人社署氏、公安等部門的對接腋殃,建立聯(lián)合管理和綜合治理機(jī)制,進(jìn)一步做好行刑銜接晓够,提高監(jiān)管的專業(yè)性和精準(zhǔn)性燕党。
醫(yī)保監(jiān)管保障了醫(yī)保基金的安全性和可持續(xù)性擅锚,同時(shí)對于優(yōu)化醫(yī)療資源配置悉宿、提升醫(yī)療服務(wù)質(zhì)量以及保障患者權(quán)益等具有重要的意義。通過應(yīng)用大數(shù)據(jù)分析技術(shù)和智能監(jiān)管手段赊真,提高了監(jiān)管效率和精細(xì)化水平涝睁,推動了醫(yī)保管理的現(xiàn)代化進(jìn)程。上海市醫(yī)保智能監(jiān)管的建設(shè)與發(fā)展提供了成功的范例盒蚁,通過充分應(yīng)用醫(yī)保大數(shù)據(jù)挖掘技術(shù)示祭,建立醫(yī)保安全和數(shù)據(jù)模型,實(shí)現(xiàn)了醫(yī)保數(shù)據(jù)質(zhì)量的提升和監(jiān)管水平的精細(xì)化陋晒。下一步咽蚣,上海市應(yīng)繼續(xù)強(qiáng)化監(jiān)管力度化焕,豐富智能化監(jiān)管手段,進(jìn)一步深化部門協(xié)作计寇,不斷提高醫(yī)保監(jiān)管效能锣杂,推動醫(yī)保事業(yè)高質(zhì)量可持續(xù)發(fā)展。(ZGYB-2023.10)