為落實《生成式人工智能服務管理辦法》(國家互聯(lián)網(wǎng)信息辦公室等令 第15號)、《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》(國家互聯(lián)網(wǎng)信息辦公等令 第12號)等文件要求,加快推進大模型與醫(yī)療健康行業(yè)深度、規(guī)范融合。中國信息通信研究院(以下簡稱“中國信通院”)基于通用大模型評價重點,結(jié)合醫(yī)療健康行業(yè)屬性,搭建醫(yī)療健康行業(yè)大模型標準與評測體系,聯(lián)合國家衛(wèi)生健康委醫(yī)療服務指導管理中心、北京協(xié)和醫(yī)院、中國科學技術(shù)大學附屬第一醫(yī)院、華中科技大學同濟醫(yī)學院、訊飛醫(yī)療等20余家單位,共同推進標準制定、評估測試及生態(tài)建設工作,促進醫(yī)療健康行業(yè)大模型有序、健康發(fā)展。
2023年10月24日,中國信通院云大所副所長閔棟在第六屆世界聲博會智慧醫(yī)療論壇進行《醫(yī)療健康行業(yè)大模型應用服務能力評價實踐》主題演講,對已研制形成的《醫(yī)療健康行業(yè)大模型應用技術(shù)要求 第1部分:醫(yī)院側(cè)醫(yī)療服務》等四項標準內(nèi)容做了詳細介紹,同時首次提出全面多維的醫(yī)療健康行業(yè)大模型應用服務能力評價方法(以下簡稱評價方法)。
評價方法旨在對醫(yī)療健康行業(yè)大模型應用服務能力進行全方位、多角度的綜合評定。重點關(guān)注大模型的場景應用能力、基礎模型能力、模型服務能力、性能要求、安全性要求等方面,通過構(gòu)建全面多層的測試問題集,探查醫(yī)療健康行業(yè)大模型的知識豐富度和臨床溝通能力;構(gòu)建具備綜合評測能力的數(shù)據(jù)集,評價基礎模型能力;設計符合性清單,評定性能、安全性及模型服務能力。
更多精彩,敬請閱讀現(xiàn)場發(fā)布PPT