中国实验方剂学杂志
    主页 > 期刊导读 >

关联规则在方剂数据挖掘中的应用述评

关联规则作为数据挖掘技术的方法之一,最早由Agrawal等[1]于一次国际会议上提出。该方法早先用于经济领域,用作发现大型超市购物清单数据中有趣的关联,故又称之为“购物篮分析”,近年来该方法受到各领域学者的广泛关注,并在中医方剂数据集中得到一定的探索与应用。

1 关联规则在方剂数据挖掘中的应用

方剂,是在辨证的基础上,选择合适的药物,酌定用量,按照组方的要求配伍而成的中药组合。几千年来,中医学积累了极其丰富的中医方剂资料,历代的医学实践表明,这些方剂具有良好的临床疗效,其中必然蕴藏了大量的中医学知识。然而,传统的统计学方法难以有效的发现这些隐藏的知识,而数据挖掘恰恰适合处理这种非线性的模糊资料。关联规则便是其方法之一。可以将每一个方剂视为一个集合,而方中的每味药物是其一个子集,同时可以有不同脉证、不同剂量、不同给药途径等多个维度,由是便将方剂知识发现的问题转换为关联规则频繁模式挖掘问题,从而发现方剂中的多重规律。目前,运用关联规则对方剂进行数据挖掘主要从以下几个方面展开:

1.1 药对、药组配伍规律的挖掘

近年来,众多学者运用关联规则对中医常见疾病的治疗方剂进行了数据挖掘,探讨了其用药规律。名医医案是方剂资料的重要来源,蕴含着海量的名老中医的宝贵经验,值得深入发掘和继承。吴荣等[2]对7位名老中医治疗冠心病的经典医案进行整理,运用Weka 3.4软件对其方剂的配伍规律进行关联规则挖掘,发现活血药、化痰药、补虚药是其常用配伍组合,同时瓜蒌薤白类方、活血通脉剂、生脉散是名老中医治疗冠心病时的常用方剂。李秀娟等[3]以《当代名老中医典型医案》为数据源,运用关联规则探索了治疗胃脘痛方剂的用药规律,发现白术、半夏、甘草所组成的药对是当代名中医治疗胃脘痛的常用药对。余俊英等[4]运用关联规则分析了名医姚荷生治咳嗽医案,总结了其遣方用药规律。吴嘉瑞等[5]借助中医传承辅助系统软件,挖掘了颜正华教授治疗胃脘痛的方剂用药规律,发现了49个核心药物组合与29个新处方。此后,该作者使用相同的方法对该教授治疗胸痹的方剂进行了挖掘,总结了用药规律[6]。以上学者的研究显示了关联规则挖掘方法在名医经验传承上的优势,用规则的形式快速总结出隐藏于医案之中的名医组方配伍规律,使名医经验的表述更加客观、准确。

刘娟等[7]检索到《中医大辞典·方剂分册》中治疗脾胃的方剂1046首,运用关联规则挖掘方法进行研究,该学者对挖掘结果的分析较为全面,将挖掘出的规则分为已知知识和未知知识进行分别处理,证实了茯苓—白术、木香—黄连等已知药对,并发现一些未知药对。宿树兰等[8]通过检索《中医方剂大辞典》中治疗痛经的方剂,运用关联规则Apriori算法对使用频次较高的药物进行了关联分析,发现活血化瘀、温经散寒为古方治疗痛经的主要治法。李建等[9]采用关联规则Apriori算法与熵方法分析了《中医方剂大辞典》中治疗肺痿方剂的用药规律。张欢等[10]检索了该方剂辞典中治疗哮喘的方剂,运用关联规则进行了古今方剂对比研究,探讨了古今治疗哮喘病的用药异同,此后,该学者[11]又运用关联规则探讨了其中十八反药对的应用,分别从朝代、反药组合、性味、剂型等方面进行了分析,发现在治疗哮喘中,乌头—半夏为最常见的反药配伍。这种古今对比的研究方法,能够更加清晰的发现所产生规则的特点,在涉及古方的关联规则研究中值得借鉴。刘岩等[12]使用SAS软件的数据挖掘功能对古今治疗水气病的1521个方剂进行关联规则挖掘,最后筛选出符合中医理论的关联方75个。此外,有学者将关联规则方法与其他数据挖掘方法综合运用,对中医方剂的数据挖掘进行了有益的探索。袁楠等[13]将聚类分析与关联规则相结合,进行了药对与剂量关系的分析,该方法为方剂量效关系的研究提供了一种新方法。运用关联规则对方书进行挖掘,能够较好的总结中医疾病的遣方用药规律,为方剂学的研究提供了新的工具。

1.2 方—药—症—证规律研究

方剂是辨证论治的集中体现,挖掘方剂数据库中的知识,可以发现医家对辨证审因的认识、对临床表现与证候关系的认识、对治法治则与药物配伍的认识,是中医药现代化、标准化、诊断量化的必要手段。因此,运用关联规则进行方—药—症—证规律的研究已经成为近年来该领域的研究热点。尚景盛[14]运用关联规则、因子分析等方法对历代半夏泻心方剂资料进行了挖掘,发现该方除治疗寒热错杂证外还常用于湿热证和肝胃不和证,并挖掘出常用的药物加减变化规律。该学者运用模糊数学方法对不同剂量组合进行了推理预测,具有较高的临床指导价值。时丽莎等[15]借助个体化诊疗系统对381位冠心病病人的数据进行了关联分析,发现基于提升率的挖掘方法可提高效率。龚燕冰等[16]以2501例2型糖尿病病历为数据源,运用关联规则分析了方—症—证直接的关联关系,发现了与生脉饮、六味地黄汤、四君子汤相关联的症状,并生成了可视化的网状图,使得挖掘的结果更加直观。李靖等[17]运用SQL Server 2005软件对201例IgA肾病临床病例进行关联分析,发现了中医证候与现代病理学的相关性,为临床辨证提供了指导,这一研究扩展了关联规则在中医学的研究范围。刘广等[18]收集了1032例胃炎病案,通过关联分析研究了症状之间、处方之间以及症状与处方之间的关联关系,是对中医证候诊断的标准化有益的探索。刘云涛等[19]采用聚类分析、关联规则等数据挖掘方法,对名老中医防治病毒性肝炎的医案进行了挖掘,发现湿热蕴结、肝气郁滞是病毒性肝炎的常见证候,并挖掘出与黄疸、胁痛、疲乏、纳差、腹胀、肢肿等症状相关的药物,症—证—药相结合,使得对名医经验的继承更加系统化。喻玲等[20]检索到《中华医典》中以“怒”为主证的方剂229个,运用Clementine数据挖掘软件进行关联规则挖掘,探讨了怒型与药物选择的关联关系。此外,通过对方剂数据的关联分析,能发现许多隐藏在方剂背后的中医基础理论知识。莫芳芳[21]运用关联规则分析了“肺与大肠相表里”相关的方剂资料,发现了两条基本的辨证论治模式:(1)肺热多导致大肠热盛而出现多种大肠症状,其中泄泻相对较多,治疗以清热润肺为主,常配伍应用黄芩、生地、麦冬等。(2)肺气壅滞多导致大肠气滞而出现大便秘结症,治疗用宣肺降气以调畅肺肠气机,常配伍应用杏仁、紫菀、瓜蒌、郁金、桔梗等。关联规则挖掘方法为中医理论的研究开辟了新的路径,关联规则有望成为中医基础理论与临床用药新的连接点。