如何让计算机学会周易取象—兼谈对人工智能研究的一些认识

如何让计算机学会周易取象—兼谈对人工智能研究的一些认识

对很多人来说,让计算机也学会取象,这个听起来很玄,其实这事一点也不难,明白了原理也就简单了。

易学中的类象,从抽象的角度来说,其实就是一种对于万事万物的归类,由于圣人观阴阳之开阖以命物的缘故,人类在对客观世界中所感知的事物进行起名的时候,总会依照某种直觉性的规律。

而这种规律是超越语言性的,在近代来的研究的语言翻译模型,也能够能够发现类似的有趣情况,针对两种语言之间的翻译的模型,可以迁移到另外两种语言之间进行一些调整然后加以使用。

这意味着其实人类的语种,在语法及结构上,看起来似乎很大的差别,但背后超越了符号的直觉是一致的,因此对于符号之间的组织方式都会暗合某种统一的规律。

还有使用如GPT之类的模型进行人类语言的文本生成的时候,能够进一步发现,语言模仿一个作家的风格行文是一种很容易的事,所谓的不同风格,其实就是语句偏爱于使用哪些词语来进行语句的组织,另外就是给事物加上多少个维度的描述,这也符合某种分布,一旦捕捉到了这些,可以很容易地对语言进行模仿。

甚至包括人的世界观、价值观、人生观,所塑造出来的思想而反映出来的说话模型,从数理角度上看,也只是一种概率分布形式。

一个典型的例子便是有人对红楼梦里面的人物对话进行了训练,然后模型能够推断对话是由什么人物所说,正确率极高。

相应的,对于红楼梦非常熟悉的人,尽管背不出红楼梦,但是看到某些对话时,也能凭感觉猜出来是谁说的。

因此反过来,对于人来说,语言风格是一种“感觉”,而这种“感觉”能够让人在写与读时共同得到“感受”,人类的这种感觉,本质上是对特定概率分布的感知。

这是一种非常奇妙的情况,这意味着,人类通常在阅读一两句话时,往往能够迅速从感觉上捕捉到这种分布,然后进行判断,这个过程很有可能不是通过物理运算进行的,而是通过生化机制进行的。

有时候说婴儿出生下来是一片白纸,这种说法不够正确的,从模型思维上来看,婴儿更像是事先拥有了一个巨大的可进行调整的模型,对于这种模型的训练,因此能够快速地进行学习。

但这种学习得越多, 模型就会变得越加定型化,因此人会产生各种思维定势,并被限制在某些看不见的桎梏中,因此在道家会要求,修道都需要像婴儿一样进行学习,这其实就是力图摆脱后天迁移的影响,回归到天然的模型上去,从而能够拥有更强的学习能力。

无论是八卦类象,还是十天干类象,或是各门术数中独有的符号名称的类象,都可以理解为一种归类的方法。

易学中最神奇的是这类归类方法具有很强的相通性,比如只要是按十天干命命的,无论它在什么样的易学模型中进行组织与运算,它本身的类象仍然是相同的,这意味着在不同的术数模型中,类象的划分仍然会是一致的,有极强的通用性。

人类的语言背后既然有一种统一的规律,那么类象的划分必然也可以与这种规律相互对应。

但另外还有一个问题是,类象的归类也要考虑到不同的场景下词语发生变化的可能,如现代网络时代出现的很多新网络词汇,例如像抨击社会现象的“时间管理大师”,这便有多重含义,另外还有一些情况,比如有时候谐音字也可以用取象,虽然应用颇多,但这是否足够合理,还需要进行验证。

因此这只是一个初步的测试,方便比较简单,直接加载Bert的词向量模型后,然后进行文本分类,例如类象这样的描述:

    君,乾父,乾大人,乾老人,乾长者,乾名人,乾公门人,乾金玉,乾宝珠,乾圆物,乾木果,乾刚物,乾冠,乾镜,乾公堂,乾楼台,乾高堂,乾大厦,乾

    简单来说就是将将卦名视作类象的分类名称,通过整理好的训练集在经过6000次训练,在训练到1500次的时候,训练集的正确率已到达近75%

    道家阴符派博客--如何让计算机学会周易取象—兼谈对人工智能研究的一些认识-- 1

    对于会不会产生过拟合的现象,如果训练数据中存在有不正确的数据,或是给出来的关键词有不准确的情况下,过拟合才会产生问题,如果有一份足够好的基础数据用于训练,则不需要太过于担心过拟合问题。

    道家阴符派博客--如何让计算机学会周易取象—兼谈对人工智能研究的一些认识-- 2

    错误率仅有0.046,这意味着约有94.4%的准确率,虽然还并不够高,但可以将就用了。

    道家阴符派博客--如何让计算机学会周易取象—兼谈对人工智能研究的一些认识-- 3

    用一组词组进行实验,可以看到,确实能够对事物起到归类的效果,比如能够正确辨认出“黄河”、”长江”属于水的。

    再随便测试几个:

    道家阴符派博客--如何让计算机学会周易取象—兼谈对人工智能研究的一些认识-- 4

    归类的效果还是令人满意的。

    这个有什么用?比如说,有时候不知道某个现实的事物属于哪个卦时,便可以使用这样的系统帮助进行推断,甚至配上一个文本生成器,设计好句式的话,它甚至能描述出断语出来,当然,这个事会更加复杂一些,目前并不容易实现。

    值得一提的是,在提出来做这个时,有人提出可以用焦氏易林的象来做,然而经过测试,发现效果极差,模型最多只能收敛到百分之六十几。

    后来找了一下这份类象的出处,再翻了一下尚秉和著的《焦氏易林注》,发现这份类象表有严重的问题。

    首先尚秉和著的《焦氏易林注》中提炼象时,并不是针对单个卦进行提炼的,因为《焦氏易林》中的每一组都是两上六十四卦,而在解构时,并非是单纯的采用单个卦的解析关系,因为两个六十四卦,除了可以拆分为四个卦外,还可以进行互卦拆分、错卦拆分,然后形成至少八个卦之间的关系进行相互运算,因此它是一个整体的关系来进行的取象。

    如果简单的视作单个卦来进行解读的话,必然会出现难以挖掘的情况,而当初提炼这份类象表的人,只是用计算机代码去扫描了一下《焦氏易林注》中的词语,然后进行了分词提取,因此得到的归类的卦象本身会有极多的冲突,因此放在模型上,结果便不能很好地进行收敛。

    这也给了一个更加可靠的验证的反向验证,那就是并非是所有的词组可以随意地放在一起随便归类,背后依然会依照一些原则,也可以说,传统的基本归类方法是确实有效的。

    之来又实验一下十天干的类象,效果依然不错,这里便不一一贴图了,回头会考虑再做下相对更加丰富的地支类象。

    这只是一时兴起所做的研究,如果大家有什么想法,欢迎在评论中指出。

    三符风云涌

    发表评论