中医作为一门传统医学,其医学理论和观念主要建立在几千年前。1912年以前,中医有大量以中国古典装本形式编写或印刷的高价值古籍,这些古籍为中医诊治疾病提供了重要的理论、概念和临床准则。

医学智能研究所在《Evidence-Based Complementary and Alternative Medicine》杂志发表了题为“Topological Analysis of the Language Networks of Ancient Traditional Chinese Medicine Books”的文章。文章利用计算机语言学和复杂网络方法探索这些古籍中关键中医概念(如”阴“、”阳“、”气“)的语言规律性。

1. 目的

探讨中医古籍语言网络的拓扑规律性。

2. 方法

2.1. 古籍网络构建

我们将古籍按句拆分,然后利用2-gram模型提取中医古籍内字的前后关系。给定一个句子,我们将生成一个以字为节点、以字之间的前后关系为边的有向网络图(图1.a)。

图1.a:中医古籍网络实例;b:《黄帝内经》的语言网络。

2.2. 古籍网络特性

中医古籍网络中每个节点所连接的边数,也就是节点度。我们统计了网络中每个节点的节点度,并计算出具有相同节点度的节点数,试图验证古籍网络的节点度分布是否符合幂律分布。然后,通过计算网络的平均路径长度和集聚系数,我们判断这些网络是否具有小世界特性。

其中,是图的平均路径长度,是节点个数。表示之间的最短路径长度,当没有连接时,。此外,集聚系数被表示为:

是节点的集聚系数,是节点的节点度,是与节点直接相连的节点集合。表示图内边的集合,是节点的边。于是,平均集聚系数就是每个节点的的平均值。

2.3. 中医概念的中心同质性

中医里有很多重要的基本概念,这些概念通常以一个字的形式出现(如阴阳五行五脏等),对中医理论和临床诊断至关重要。我们认为这些同类的中医概念彼此之间的相似性能够通过有向语言网络中节点的向量表示来捕捉。古籍网络中每个节点的向量表示通过Node2Vec方法计算得到。为了证明相似概念的同质性现象,我们提出以下方法来区分相似概念与随机对照:

其中,是节点的低维向量表示,是向量中的元素,是向量的维度。定义是相似概念的集合,是随机节点的集合。组内概念的相似性用表示,组内概念与组外概念的相似性用表示,

2.4. 中医概念集识别

语言网络通常具有社区结构,其子网内有密集的边,而子网外的边较为稀疏。这些被认为是社区的子网将为进一步的研究提供有意义的领域知识。为了检测中医语言网络中的概念簇,我们采用Fast Unfolding算法(FUA,一种著名的基于模块化的社区检测方法)来检测网络中的社区。

考虑是整个网络的模块度,代表网络中边的权重和,是节点之间边的权重。是与节点相连的所有边的权重和。的值是0或1,当时,则表示节点在同一个社区中。然后不停迭代使模块性达到最大值,得到最终的聚类结果。

3. 结果

3.1. 中医古籍网络的基本特性

通过图2可以看出中医古籍中节点的度分布符合幂律分布,意味着尽管绝大多数的字很少与其他字一起使用,但还是有一些"hub"节点连接大量的字,如“气“、“阴“和“阳“。对30本经典中医古籍的基本网络特征进行统计。发现这些古籍的幂指数接近1,最大的是《备急千金要方》的1.3246,最小的是《古今医统大全》的0.9499。

式中,为节点度,是节点度为的节点数与节点总数的比值。

此外,古籍网络的平均路径长度约为3,其中最大的为3.819,最小的为2.727。聚集系数分布在0.1~0.3之间,将古籍网络与相同尺度的随机网络进行对比,发现其平均路径长度小于随机网络,聚集系数大于随机网络。说明中医古籍网络具有小世界特性。

图2.a:《黄帝内经》的度分布;b:《伤寒论》的度分布;c:组内比较和组间比较的余弦相似度。

3.2. 中医基本概念簇的拓扑同质性

我们认为中医基本概念簇(如“五行”)的节点中心性相似,拓扑测度上反映出它们在古籍网络中的相似语义重要性。基本理论书籍(如《黄帝内经》)中的大多数基本中医概念组比随机对照者之间的相似性更高,这表明这些基本中医概念组表现出一种拓扑同质性,反映了它们的语义相似性。例如,五行包括金,木,水,火和土作为密切相关的成员。我们发现在《黄帝内经》中(图2.c),这五个元素的余弦相似度相对较高。这证明了这五个概念在中医里的绝对同质性。另外,由于类别相似的概念在网络中的连接模式相似,因此可以通过社区检测方法进行识别。例如,在《黄帝内经》网络中,使用FUA,我们可以将概念组标识为相同的社区,例如来自以下类别的“阴阳”,“五行”,“五音”和“五色”。

然而,临床书籍(如伤寒论)的结果是不同的。中医基本概念组的余弦相似度并不呈现同质模式。这可能是由于这些书关注的主题不同。伤寒论主要关注六类证候的表现及其中草药治疗的规律。

图3:《黄帝内经》的中医概念簇

3.3. 中医语言网络的多样性

为了进一步研究不同中医古籍网络中涉及的不同拓扑模式,我们筛选了《黄帝内经》和《伤寒论》中权重大于10的边,并将相关节点(汉字)作为这两本书的关键概念(图4)。发现《黄帝内经》中的关键概念主要包括中医的基本理论特征,例如“阴阳”,“五行”及其相关概念,量词,情感和脉搏(图4B)。相比之下,尽管《伤寒论》仍将几个基本理论概念(如“阴阳”)作为关键概念,但其他大多数与草药处方和症状有关(图4B)。这些结果表明这两本书提供了不同的知识类别。众所周知,《黄帝内经》融合了中医的基本理论,而《伤寒论》是公认的代表临床书,着重于疾病表现,病理学及其相应的草药处方。

图4. a:《黄帝内经》中医关键概念;B:《伤寒论》中医关键概念。

4. 不足与展望

首先,我们仅构建了数十种语言网络,缺乏更大规模的古籍语言网络。此外,基于字的2-gram建模还限制了语言网络对语义问题的探究能力。其次,尽管大多数中医基本概念都可以用单个字(例如“气”)掌握,但仍然存在许多关键概念,例如穴位,草药和病症等,这些必须以词的形式来表示以进一步探索其语义规律。此外,值得注意的是,网络方法擅长研究给定域的全局模式,可以将其与其他数据分析方法(例如关联规则)结合使用,以生成更具体的结果来传递中医有意义的知识。

[1] Qunsheng Zou, Yinyan Wang, et al. Topological Analysis of the Language Networks of Ancient Traditional Chinese Medicine Books [J]. Evidence-Based Complementary and Alternative Medicine, 2020, 2020(8810016).

八字命理六爻奇门遁甲六壬太乙术数中医:Iam医学智能


延伸资源下载(中医疗法理论,中医文献古籍、中医经方学、麻衣神相、太乙神数、七政四余大六壬奇门遁甲梅花数、皇极经世四柱、六爻、风水、铁板神数、、六壬史上最全版古今秘籍汇总|儒释古本民间术数大全超强版持续更新中......)

版权声明:本站部分内容由互联网用户自发贡献,文章观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请拨打网站电话或发送邮件至1330763388@qq.com 反馈举报,一经查实,本站将立刻删除。

文章标题:北交大医学智能研究所:中医古籍语言网络的拓扑学分析发布于2021-05-05 20:23:23

相关推荐