image288.gif (9722 bytes)

lst2.jpg (3691 bytes)

关于早期论文中的一些问题的补充说明和解释

  前面4篇论文中大约有6部分的内容在我以后正式发表论文时没有写入,它们是:1、正交投影和多维信息空间构造;2、特征信息的因式结构和多项式表达;3、信息阵列变换中的矩阵形式;4、应用方面的内容;5、关于对信息组合爆炸理论的剖析和评述;6、关于哥德尔定理的一个扩充;7、全息软件系统。另外,关于非正交投影和非线性结构问题,在这些论文中根本不敢写出来,只敢捎带提一下。实际上,那里面的变化和枝节问题太多,挂一漏万,没办法说清楚写完整。下面,分几部分评述和解释这些内容:
 1、正交投影和多维信息空间构造(第1篇论文 第14-15页)
  这是在第二章一开始就讨论的,信息空间是通过正交投影或非正交的投影和信息元素的密度测度来表述它的内部结构的。后来考虑到用正交投影来表述,可能有许多人难以理解,产生不了那样的抽象空间构思和空间概念,就逐渐改成了用存储器单元来表述,这样就比较形象化了。而空间内部元素的相对位置就成了一种拓扑结构,这种结构在空间中是连续分布的,形成了一种等位线的构造。而空间中的维数成了划分特征类的工具,连通复盖就成了一种拓扑关系。实际上,只要把握住元素、空间、结构、关系、正交投影、测度等几点,是很容易理解的。特别地,空间的维数在这里实际上是指特征信息所属的类,维数越多,空间中所含有的特征类别就越多,结构就越复杂,而特征信息在其坐标轴上的投影是信息特征矢量的在这个类中的有效值。公式:
                E k = [ e (i)] -1. (m* E k )
  是指一个k维的特征信息子集,是由元素e在第i维中的单位向量e (i)的维数阵列[ e (i)]的逆变换分离后形成的在第i维空间中的单因素元素特征与它的密度测度的点积构成的,其中i是其指定维数的序号(i∈k),密度测度实际上是元素e在第i维空间中的权值或有效值。

  这个公式实际上与二个方面有关:一个是相当于几年以后的数据库的数学表达模型,翻译过来就是:一个事物=所有有关的特征信息元素的集合=[在分类i中的特征信息元素名的阵列表]与(事物E在分类i中的对应的权值或有效值)之对应链接后形成的表达方式,当然,在大类中还可以再分细类。看看,这像不像数据库中的数据结构形式,但在当时不好直说。我在工厂里一说这个,那些成天与计算机打交道的技术人员都说是唯心主义,那我只好用公式来比喻了。另一个方面是可以描述局部神经网络的构造,可以形成一种矩阵算法,不过这个公式从现在看来用在这个方面有点简陋了。
 2、特征信息的因式结构和多项式表达(第1篇论文 第57-58页,第63-65页)
  这个表达方式是由三个方面的因素促成的。第一个方面的因素是在研究信息结构中,我考虑到要用集合论的方法来表述信息的特性和互相关系,这里,构造一个连通区或复盖成为一个基本要点,通过连通复盖产生一个连通表或复盖链,就是所谓的延拓群。在构造延拓群时,由于构造了一个复盖,于是产生了一个乘积空间,再通过集合的并集表示将这两个乘积空间连接起来。这个公式表述了两方面的内容,一方面是延拓群中的信息元素之间的互相关系,另一方面是从延拓群方面进行的特征分类和分解,这时这个延拓群就有点像是一张多维的纵横关系表。这样,整体的和精细的结构都有了,这就是我在85年正式发表的论文引言中所述的整体结构和精细结构的互相关系问题。
  第二个方面因素是由于需要寻找一种能够为特征信息进行编码的方法,因为当时的计算机能认得的只有数字,其他的一概不认识,而我需要寻找一个计算机能够辨认的编码方式。同时,由于当时哥德巴赫猜想中的素数问题正炒得火热,而素数正好又符合我需要的编码条件,具有唯一性和不可分解性,当然就选择了它。用素数来代表不可分解的最简特征信息元素,但我在论文中又不能这么写,要不玩到数论中,跨的学科更多,牵涉的东西也更多,就又节外生枝了。所以,我用素命题或元素性质的互素的概念来表征它;这样,合数就成了复合命题的表达方式了。
  下一步就是要用计算机进行复盖、并、交的运算。由于这些都是底层的编码方式,要求算法不能太复杂,越简单越好,否则,到了上层,随着信息构造级数的增加,算法的复杂度将会成几何级数地增长,那当时的计算机是根本没有办法去运算的。我将几个素数一写出来,一看,嗨!这不就是最大公约数、最小公倍数的计算吗,求复盖只不过是求个公倍数而已。这是第二个方面。
  第三个方面是我在特征分解/分类过程中发现它与因式分解有些共性,你看那个公式像不像两个因式,于是就利用了这种方式,推广到高维空间和信息的相关关系构造上去。从因式分解形成两个东西,一个是多项式的表达和算法,只要你把数字代进去,计算机就很容易辨认和计算,正算反算都不会有问题,这就形成了第一个东西,就是信息在计算机中的多项式数据结构。由于有素数在那儿摆着,决不会产生二义性。第二个是用因式分解的方法将特征类别嵌入到多项式中去,一分解因式,类的特征就提取出来了。但是计算时不是代数中的加和乘,而是集合论中的连通、并和乘积空间的概念。否则,真的一做加法,素数就没有了,特征信息也没有了。
  特征信息的多项式结构表达,基本上可以通用于所有的由人来定义的信息类型。但是这个问题范围太大了,所涉及的因素也多,一个人一时应付不过来,也就到此为止了。

  下一步就是利用这个多项式结构,真正地构造一个信息群试一试,结果试排了一下,作了个二维二阶关系表(其中第二阶内容实际上应该算是第三维的东西)。表一作出来,就发现在信息的分类方面有个特性,用这个特性能够推导并生成编码结构,还能够产生出信息的层级构造。从层级结构上看,信息在高层结构上根本不用素数来编码和表达,任意的形式,数字的、模拟的都能够形成编码方式,只不过需要有一个辨识的标记而已。有了这个途径,许多问题就迎刃而解了。
  这个分类特性,就是等价类。有了等价类,就有了商集、商空间等概念。就这样,通过这个多项式结构找到了一个自然界独特的编码方法,就是用等价类来编码。这个方法一直没有合适的名字,几年以后(84年吧),我正式给它起名叫自然编码方法,因为它是自然界中特有的、自然产生出来的。有了这个更好的编码方法以后,原来的因式结构、多项式结构表达和素数编码就不再需要了。
  当然,上述的东西是很有意思的,真正放弃了我心里也有点那个,但这一桌酒席不可能我一个人能够全吃了,吃坏了肚子不就更加得不偿失吗。
 3、信息空间阵列变换中的矩阵形式;(第1篇论文 第44-46页)
  这部分内容是由几方面因素促成的。第一点是当时我想把全息空间模型转化为可应用的形式,当然,自动化设计是首当之选。那时的设计工作大部分是查表,就是设计人员要把用户的要求或者自己的构思投影到那几本设计手册上去,否则是没办法进行的。我也是从这方面开始的。我将设计手册当成一张多维的大表,现在叫数据库了,先进行分类处理,然后对大表中的数据信息进行排列组合和筛选,找出自己最需要的东西来。表可以排成矩阵,矩阵在计算机中可以用数组来表示,我考虑到用这两个名词都不太合适,容易造成误会,干脆自己起个名字叫阵列,实际上,它就是一个矩阵。而且它里面也不主要是数据计算,而是一个子阵列对另一个的映射、链接和对应过程。而这种映射又不是一对一的保形映射,那干脆叫变换吧,是在某个条件下的变换。因此,空间阵列变换就是这么来的。
  从矩阵我想到复空间,当时我在这个基础上搞了一个:“特征信息的复空间特征相平面状态滤波法”,试用复空间的场来解决这一个问题。起头是我将集群效应改成全息效应后不久,因为分析信息的存储方式,想到了“全息存储”这个名词,也考虑了几种全息存储方式,其中一种是一种线性相关的特征值存储方式,另一种是多维空间复平面正交方式,还有一种是简化后的特征标记方式。结果,从全息存储又派生出全息运算,看!越来越复杂了。这个我曾经在《全息拓扑学发展史》中提到过。
  这个特征信息的复空间特征相平面状态滤波法,有点像个四不像,主要是从信息的空间结构和它的频谱、谱系特征的角度来探讨问题。它将特征信息集合构成一个多维的复空间,复空间的实部是可以直接获取到的特征信息,可以根据特征的属性分类分成多个维数坐标或者向量,形成一个多维的实空间,其中的每一类构成一个维——即自由度。而虚部也是一个多维空间,并且增加了“相”这个东西,复空间中的相有点像金相学中的相的概念,也有点含有高层次结构和虚的结构的意思,又有点相位的意思。但是这个相是从实部中生成出来的,可以说是一种高层次的虚拟结构。后来我发表的论文[1]中所谓的虚拟机、虚拟层次,就是从这儿引伸过来的,正好与现在的现代计算机理论中的虚拟机概念蒙上了。
  特征信息在这个复空间中有一个连续的坐标区域,如果假设特征相近的特征信息之间能够产生共振,在整个复空间的作用下,它们会相互接近,形成一种正态分布的特征连续区,并且具有连通性,那么它们的频谱就很靠近。因此就形成了特征频谱、谱系等东西。进一步,由于假设特征信息之间可能会有共振,有共振就有能量交换、波的出现,检索提取特征信息就成了滤波。最后,将特征信息和它们的结构转化为多维复空间中的波和相位,再转化为函数,就可以对信息进行处理了。因此,特征信息的复空间特征相平面状态滤波法就是这么来的。
  用这个方法我探索了一段时间之后,感觉到由于太超前了,不知道怎样去下手,只好放弃了。放弃后,我将其中的有些方法运用到思维过程的信息空间结构的研究中去,最后逐渐地形成了现在这些东西。
  第二个方面的因素是算法问题,当时一看这个变换是一种并行的多级的带条件的映射过程,不是当时计算机的串行的顺序的过程所能处理的了的。考虑了一段时间后,从全息空间的构思中想出了一个并行处理的过程模型,有同步并行和异步并行两种,同步是没有后效应的,异步有后效应和侧效应,相当于一个神经元的突触与附近其他神经元的连接,当然,并行处理装置与计算机是有区别的。我在后来发表的论文中关于智能系统的三大层次结构和层次性拓扑结构中,就含有这个并行处理过程的痕迹,当然,肯定升了级了。由于当时的计算机肯定是没办法进行这个处理过程的,这才想到大脑神经细胞群的结构(那时还不叫神经网络),看!转了一大圈,又回到我70年最初始起步的地方了。
  在85年正式发表的论文中,在这方面的内容中,只有阵列筛选被我保留下来,并且返回到全息空间理论构思中,形成了一种数学上的东西,因为它的证明可以说明全息空间的结构的连通性、连续性、相关性等几个概念,有理论上的价值。
 4、应用方面的内容
  应用方面的东西有一个时间限制,拖到了一定的时间发表不了,或者做不出来,别人就做出来了。毕竟世界上不是光你一个人在考虑这些问题,谁的条件好,谁就走在前面。在大学毕业前后吧,这方面的内容迫不得已被我放弃了。
  当然,大家从前面这4篇论文的论述中,还可以看到当年我在应用方面所做的考虑的影子,只不过这些在现在已经是一个历史记载了。大家可以看到,到了九十年代以后,论文中提及的这些东西有不少都逐步实现了,

 5、关于对信息组合爆炸理论的剖析和评述(第4篇 第98-100页)
  这个问题我在全息拓扑发展史中已经谈过了,本人从七十年代起就一直认为黑箱和组合爆炸问题是根本不存在的,我在该篇论文中主要是利用全息拓扑学理论中的整体与部分相关理论和系统内部结构相关的概念,通过构造一个全息空间模型,对信息组合爆炸理论所描述的对象进行分析,并对这个问题作了剖析和评述。和所谓的黑箱模型一样,信息组合爆炸理论实际上也是利用了错误的观点、错误的模型、作出了错误的推理,产生出错误的结论。这在现在年轻一代的软件编程人员看来可能都不屑一顾,然而在上个世纪的七、八十年代里,在人工智能研究领域中,在经典的论著中它们还是有坚固的基础的。
 6、关于哥德尔定理的一个扩充(第4篇论文 第101-110页)
  这个问题我也在全息拓扑发展史中谈过了,有兴趣者可以看一看。
 7、全息软件系统(第4篇论文 第72-100页,第6篇论文 第8-15页)
  全息软件系统类似于软件自动生成技术,然而功能要比自动生成强得多,主要是由于它有一个多层次相关结构的库构造,相当于人类大脑中的概念系统。在我刚提出来的时候(79-80年吧),如果当时能够发表和引起重视,可能会发展成为一个很不错的软件产业。然而现在说什么都晚了,别人早就走到前面去了。
  当时的软件自动生成主要是指程序自动扩展、翻译和链接,那还是要人来操作的。如果谁那时要是说软件自身能够拷贝一个新的自我,并进行扩展和产生新的构造,那专家们都会认为是天方夜潭,想象力太丰富了。现在,大家可以看看病毒玩的那些把戏,全部没有用在正道上。
  在我刚写出来这部分的时候,发现它的存在过程与一个生命的过程有点相似,曾经自嘲它为“电子生命”,“生命的电子存在”。做到了这一步,对生命的本质也应当有所感悟了。在第4篇论文中最后阐述的,实际上也隐含了那个意思,就看各人的理解程度了。
 结束语
  这些具体的说明和解释,本来我不想写出来,但是考虑到写出来可能会对理解论文有所帮助,也可以开阔一下思路,所以就略微介绍一下。

[1] 毕家祥,人工智能模型与智能系统,中国人工智能进展(2001),p71-74

相关链接

抽象信息与信息空间的延拓(思维规律和信息处理)
2.抽象信息的全息构成和全息域的延拓
3.全息空间结构与自动机
4.全息空间的拓扑结构与人工智能模型
5.全息空间的拓扑结构与人工智能模型(Ⅰ)(第Ⅰ部分:全息空间的拓扑结构)
6.全息空间的拓扑结构与人工智能模型(Ⅱ)(第Ⅱ部分:脑、计算机与全息软件系统)

 

image367.gif (4540 bytes)

www.holotopology.com

Copyright © 2000-2002-2006
All rights reserved
E-mail: bjxsz@vip.sina.com