Hello world!

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!

发表在 Uncategorized | 一条评论

答水泡泡:陈立功是谁教出来的?

 
发信人: TNEGIETNI (lovewisdom), 信区: Statistics

  : 答水泡泡:陈立功是谁教出来的?(终版for Mitbbs统计版)

发信站: BBS 未名空间站 (Wed Sep 29 09:37:47 2010, 美东)

 

    在mitbbs的统计版上,网名waterpaopao(水泡泡)很轻视地问我是谁教出来的。让我告诉他/她你以及所有的人。

 

我的老师有很多。本科时教我统计学的老师有好几个,他们是同济医科大学公共卫生学院原卫生统计教研室的老师们。他们是周有尚教授、余松林教授、刘筱娴教授、董时富教授、王增珍教授等。他们全都毕业于老同济医学院(也就是后来的武汉医学院、同济医科大学)的卫生系。我认为他们对统计学的理解绝对不比任何一个美国大学的统计学教授差!其中的余松林教授成为了我后来读硕士时的导师。余在国内的前辈中是很有名望的。他在中国刚刚开始面向世界开放并依然处于非常困难的时期,借用卫生统计这个领域不遗余力地引入国外先进的分析方法,由此获得了国内同行高度的尊敬。我也一直非常敬重他,他教给我的东西使我终身受益匪浅。尽管这些人只教了我最基本的东西,但对于我初入统计学却极其重要。令我感到荣幸的是,我以及我的太太陈咏梅女士最终也都成了其中的一员,我们俩在那里服务了大约11年。

 

我在统计学领域的其他老师,应该是培根(请允许我将哲学家培根单独列在这里。他是统计学家真真的的鼻祖,他理应享有这一尊号)、阿亨瓦尔、佩第、格朗特、凯特勒、高尔顿、皮尔逊以及戈塞特和费舍尔等(这仅是我自己妄称的,没人会承认),这些人是统计学史上的顶级人物。他们中的每一个都开创了一个时代,并最终奠定了现有的完整的统计思维的逻辑体系,其后的一切方法论的发展均(应)遵循这个逻辑系统。

 

如果大家允许的话,我也愿意把陈希孺和严士健列为我的老师。原因是,1998年三月底的某一天,我在武汉大学数学系聆听过陈院士根据Peter J. Huber1997年在中国科学院数理统计研究所作的关于统计学的历史、现状和未来的演讲所作的演讲,基本上是Dr. Huber的演讲的中文转述。我在他讲完后请求上台讲了自己的新思想。事后我们还进行了一场两人间大约10分钟的对话和讨论。他没有反对我的新思想,而是鼓励我好好地做下去。由于他的演讲是基于Dr. Huber的演讲,所以,我更愿意以Dr. Huber为师。

Dr. Huber在其演讲中引述了一个我当时没能记住直到两个月前才查到的名叫Tukey的人于60年代发表的一部长篇大论(当时也没能记住文章的标题和期刊名称),题目是“The Future of Data Analysis”。这篇文章被认为是后来的Data Mining的精神先导。我是直到大约两个月前才找到这篇文章的,从而得知他在这篇划时代的文章里已经警告了在统计学中要慎用最优化。然而,遗憾的是,他没能从数学上严格地论证为何要如此。现在,我认为我已经完成了这个工作,或至少为这个命题的论证提供了坚实的理论基础。

Dr. Huber在他的演讲中说道,数学家们很瞧不起统计学家们,认为他们不过是把数学家搞出来的理论找个实际例子检验一下而已。而很多数学背景出生的统计学家则习惯于按照确定性数学的思维模式来解决非确定性领域的问题,从而导致了很多混乱。他说,事实上,在非确定性领域,很多事情我们是无法搞确定的。他并就此现象表达了个人对统计学以及数学的未来的深深的忧虑。他希望能有一股来自数学以外的力量来推动整个体系的发展,因为他知道,单纯从数学内部是无法看到前途的,因为我们不可能推翻现有的数学公理体系而重建一个新的。陈院士的这个演讲,特别是其中的Dr. Huber的思想对我产生了无法估量的影响。我由此发现,Dr. Huber是我们这个时代统计学领域里最伟大的思想家之一,而Dr. Tukey则早在大约半个世纪前就将他的脚步踏入了我们这个时代。

我之所以依然希望做陈院士的学生,是因为整整13年前(199711月)开始思考分段回归方法论时,我读了他的《数理统计学引论》中的前六页,从而得知卡方分布的广义定义。这个定义使我明白了如何构造一个理论卡方分布,从而为检验分段模型与全域模型之间的差异显著性找到了可靠的概率推断基础。

也是在大约13年前的那段时间里,我还试着读了严士健等人写的《概率论基础》,不过,仅读了前一百页,至今也没读完。尽管如此,我还是从中知道了概率论中的几个基础概念。这些为数不多的几个基本概念成为后来帮助我思考我的方法论乃至最终思考整个统计学的理论基础时最为重要的概念。由于它们是被伟大的俄国数学家柯尔莫戈洛夫发现和定义的,因此,我更愿意在此把柯尔莫戈洛夫尊称为我的老师。然而,我不知道他是否愿意接受我作为他的学生之一,因为我至今也没有完全读懂他伟大的思想和杰出的理论,而且我还涉嫌试图修正甚至篡改他的理论。这些修正或篡改在严谨的概率论专家看来应该是错误的,而在我看来是必要的和正确的。因此,它们可能错误,但也有可能正确或部分正确。

 

由于我的研究领域是分段回归(piecewise regression or segmented regression),最近的几年里接触到了这个领域中的一些开路先锋,他们在统计学的理论基础还不够坚实的情况下,以自己卓越的智慧、深刻的哲学思考和严谨的数学技能提出了一整套解决方案。他们是

Quandt, R. E. (1958)

Sprent, P. (1961)

Robison, D. E. (1964)

Hudson, D. J. (1966)

Hinkley, D. V. (1969, 1971)

McGee, V.E. (1970)

Bacon, D. W. and Watts, D. G. (1971)

Feder, P. I. (1975)

Cleveland, WS. (1979, 1988, 1991)

以及    Bradley Efron (1979)

我之所以把Dr. Efron列在这里,是由于他提出的Bootstrap作为一个通用解决方案为分段回归分析中估计临界点的可信区间提供了一个可行(但不是最好)的手段。我从他们中的每一个人身上学到了整个方法论中需要解决的问题,并因此而提出了自己的完整的分析逻辑。没有他们的开创性研究,我将不可能找到这个新的分析逻辑。他们的目光是锐利的,因为他们看到了这个领域需要解决的全部问题;他们的思想是伟大的,因为他们在困难的环境里为此付出了艰巨的努力;他们的遗产是辉煌的,因为它们帮助成就了这个领域中崭新的方法论。没有他们的艰难探索,我们至今可能依然不得不继续在黑暗中苦苦挣扎。他们值得我高度敬仰,因为发现问题远比解决问题更重要。我不过是为被他们发现的问题找到了一个可行的、更加符合统计学的逻辑系统因而也就是更好的解决方案。因此,我愿意说我是他们的学生。

 

由于我试图提出的解决方案引入了随机权重测量,所以,我试图找到在这个领域作出过开创性工作的先辈们。然而,我暂时失败了。我只能从一篇发表于1824年的关于天文学观察的文章里发现在那之前就已经有人在使用加权均数了。加权统计量是统计学历史上一个伟大的发现。它在我们对世界的认识中引入了可变重要性的概念,从而使得基于此上的估计更加稳定和可靠。看来,我暂时只能以此无名氏为师。

 

我的另外的老师就完全不是搞统计的。一个是高中哲学老师彭本智;一个是大学哲学老师和西方古典音乐的启蒙人袁建国以及研究生课程中的科学哲学老师王健。同济医科大学社科部著名的哲学老师王智平先生(笔名王蛇。这个笔名源于圣经创世纪,意思是愿做一个启迪智慧的人。他在同济多年的实践活动表明他当之无愧)以及中国当代著名的历史学者、社会批判家和政治异见人士陈敏先生(笔名笑蜀。20002001年间曾被中共宣传部长丁关根点名被关注。2007年二月曾应美国国务院主管东亚事务的部门邀请来美国访问游历了一个月)也都可以算进来。尽管这两位没给我上过课,但我们曾有过很多次机会在一起讨论哲学以及其它问题,我从他们两位那里收获很多。同济医科大学拥有过这四位同时代杰出的青年教师是其历史上的福分和荣耀。他们四位思想深邃而开放,见解精辟,对学生平易近人,乐于交流。他们的身体力行向我传递了一个简单的信息:什么是以及如何独立思考。

另外就是罗素以及他所尊崇的同僚们。这些人都是人类史上的顶级人物(注明一下,这个群体里没有中国人),其中的亚里士多德、培根和黑格尔以及他的后继人之一的马克思是对帮助我完成这个研究起了最大作用的四个哲学天才,因为他们为我制定了一整套逻辑思维的方法,包括演绎法、归纳法和辩证法。这三大方法是人类一切知识的逻辑来源。它们对于完整准确地理解随机世界以及统计学中包括三分回归法在内的全部方法缺一不可,尤其是辩证法,它是三分法的直接逻辑来源。没有上述三个方法,我将与一头猪相比没有差别;而若缺少其中的任何一个,我都不可能完成这个工作。然而,我遍寻《数学大百科辞典》,却无处发现辩证法的踪影!是的,数学不需要它,因为前者是以确定性为导向的学科;而后者却教导人们要从不同的角度看问题、要以发展的眼光看世界以及要用普遍联系的假设来思考,而这很可能会破坏数学的严谨性。例如,当我们站在总体的角度看样本,会说样本是关于总体的一个最小测量,一个样本统计量是关于相应总体参数的一个随机的点测量;但若站在样本的角度,我们就会发现,它是关于总体的一个最大测量,而样本统计量对于一个给定的样本本身来说是一个常量。这两种根本对立的认识会使人们感到无所适从,因为它们会使得我们对世界的认识具有某种不确定性。而这恰恰是数学竭力要避免的。然而,不幸的是,上述两种对立的认知结果都是事实!因为我们所面对的是随机而非确定性的世界,而统计学要做的就是要帮助人们认识随机世界而非确定性世界。因此,面对随机世界,我们需要辩证法。只有这样才不会引起误会和混淆。由于西方社会特别是学术界对黑格尔尤其是马克思的偏见,辩证法长期以来处于被轻视和遗忘的境地。这是一个悲剧!

 

还有就是贝多芬和其同僚们。这些人个个都是超人(注明一下,这个群体里也没有中国人)。他们享受到了神(我实在无法找到另一个更恰当的词来代替这个词)的恩典,说的是神的语言。人间仅极少数的人能听懂他们的思想。他们的音乐里充满了无法用文字语言准确表达的内涵、丰富多彩的动机、千变万化的递进、无穷无尽的变异、无法预见的结局、完美和谐的秩序以及震撼心灵的力量。它们是比一切哲学、一切智慧更高的启示。尽管我聆听他们的语言已经大约26年了,但我依然不能说我听懂了他们的语言。不过,我可以说的是,我在听,且常听并试图听懂他们的思维方式、逻辑法则以及他们的思想。在这群人中,对我影响最大、帮助最多的是贝多芬、柴科夫斯基和拉赫马尼诺夫。他们以及其他几位音乐家的音乐帮助我在那个思考分段回归问题时几乎无眠的六天六夜里战胜了极度的艰难、痛苦、恐惧和疯狂,并带给我不可计数的灵感,从而帮助我战胜了自我,超越了时代。没有他们的音乐,我将丧失理性,且不复存在!

 

最后,如果把我自己也算上一个的话,也说得过去,因为我常常从自己的错误中学习什么是正确的东西。

 

没有上面提到的全部老师,我将一事无成。

 

我不为名、不逐利,因为名利于我如浮云。我只追求唯一的东西:(全部的真真理 + 全部的真谬误=)全部的真理,因为我是一个统计学家,肩负着认知未知世界,包括统计学本身的使命。我只希望向外界展示我对世界的认识。我有权这样做,因为,任何新的认识、新的思想、新的发现都意味着人类新的机会。即使我的认识是一个错误,也是有益的,因为它会帮助人们避开这条错误的道路而不是徒劳地重复。对于我来说,真理已经被发现,我的使命也已完成。人们是否接受和认可,那是他们的事情,与我无关。人们可以继续拥抱真谬误而拒绝真真理,也可以丢弃真谬误而重拾真真理。那是他们的自由。我只陈述我的结论。如果人们对此有惑,我愿尽自己最大的努力作出解释。

 

我说出的话已经在那里,这里当然也是其中的一部分,历史因此而记住了它,从而没有人敢于忽视它。它将向芒刺一样扎在肆意诋毁它的人的背上,它会成为一个未知的存在横亘在无法发现它的人们前进的道路上,但它也会像一堆被埋没的真金一样被富有探索精神的人们所发掘,从而助他们登上更高的峰顶。

 

正如伟大的Fisher在半个多世纪前就指出的那样,统计学是一门认识世界的通用方法论。这明确地、且唯一正确地阐明了统计学的学科属性!它原本是属于哲学认识论的范畴,不过是在特定的方面采用了数学的形式。任何一个统计方法起源于一个简单的分析逻辑,而这个分析逻辑在形成之时是没有任何具体的数学计算形式的。只有当我们将数学函数、统计函数以及其它一切可用的手段按照分析逻辑组织成为一个整体时,方法论才能得以诞生。因此,如果分析逻辑发生错误,则方法论必然发生错误,并由此导致重大的悲剧,因为我们对世界的认识是依据我们所拥有的方法论。因此,一旦方法论发生错误,将必然导致结论出错,从而最终将我们引向歧途。一个良好的数学头脑若没有哲学来武装,那么,它将很容易在分析逻辑上犯错误;而一个训练有素的哲学头脑若没有数学来武装,那么,它在统计学里将一事无成。由此可知,统计学是人类通向未来的崭新的哲学!这门新哲学形成的最高标志就是一个以Student为笔名的人,借用一个在统计学中被称为t-test的方法论实现了人类认识世界的逻辑系统的革命性突破。这是一个人类科学史上最伟大的发现,它导致了人类史上最伟大的精神革命。他的名字不应该被埋没。他,就是英国一个小酿酒厂的配料员兼小会计,名叫戈塞特!这是科学史上的一个奇迹(This is a miracle in the history of science)!

 

让统计学的归统计学,让数学的归数学!它们当各司其职。

 

流言与蜚语属于出口者,那是出口它们的人做人的象征。

 

(注:本文在mitbbs统计版上直接书写,始于2010929日,完成于2010104日,历经多次反复修改。)

 

 

思想出自心灵,又复归心灵。

(Thoughts come from mind then return to mind.)

 

修改:·TNEGIETNI Oct 4 13:59:54 2010 修改本文·[FROM: 69.139.]

来源:·WWW 未名空间站 海外: mitbbs.com 中国: mitbbs.cn·[FROM: 69.139.]

 

 

原文及相关评论和讨论在此:

http://www.mitbbs.com/article_t/Statistics/31247245.html

文学城个人博客转贴在此:

http://blog.wenxuecity.com/blogview.php?date=201010&postID=402

发表在 统计学=Statistics | 一条评论

智慧生命的自我认知能力——镜像试验

    两个著名的镜像试验中的任何一个既可以区别猪类等非灵长类与灵长类,也可以区别灵长类中的猴子、狒狒和猩猩与人类的婴儿。试验是这样的:

 

试验一

 

在上述动物面前各树立一面镜子,让它们各自看看自己,然后看他们看到镜中的自己时的反应。猪没有任何反应;猴子和狒狒会吓得转身逃离,猩猩可能会到镜子后面找一个和自己一样的同类;唯有人类从婴儿时期起就知道对着镜中的自己微笑。这是人类从婴儿时期起就有了自我认知能力的一个重要标志。这个标志甚至不需要任何知识为先导,因为那个照镜子的婴儿连一个字都不认识。

 

试验二

 

在上述动物面前各树立一面镜子,然后在其后方悬挂一个它们各自喜欢的食物并让这个食物映照在镜子中。猪见到镜子中的食物没有任何反应;猴子、狒狒和猩猩则都会到镜子后面去找食物;唯有人类从婴儿时期起就知道转过身来到后面找食物。

 

上述试验的拓展:

 

试验三

 

    现在,让我们在我们自己的人文历史面前树立一面镜子,即西方的人文历史。我们能在这面镜子中发现自己并对着自己微笑吗?我们会到镜子的后面去找自己吗?我们会逃离这面镜子吗?拟或是面对这面镜子无动于衷呢?

发表在 科学=Science | 留下评论

大学是生产反叛者的精神工厂

 复旦大学校长杨玉良在接受中国青年报记者采访时发表感慨:“中国大学精神虚脱,才子流氓贻害社会。

(原文在此:http://news.wenxuecity.com/BBSView.php?SubID=news&MsgID=1109866

   我以笔名TNEGI//ETNI在文学城上的评论是:大学从来不是生产顺从的奴才良民的地方,而是制造有自由和独立意志的反叛者的精神工厂。而所谓的反叛者就是对现实永远不满的人。

发表在 思想火花=ThoughtSparks | 留下评论

为西方辩护

[写在前面:以下可能是一个巨型汉奸的言论,请慎入慎读。既然是一个辩护,作者当然是希望说给自己和大家听。至于听者(或读者)听完(或读完)后形成怎样的结论,完全是他/她个人的事情,与本人无关,因为我无意也无权将自己的思想强加于人。最后,如果你是一个强烈的民族主义者,本文的言论可能会令你脑门喷血、心气梗塞、甚至……,所以,作者在此提前预告你注意身心健康;否则,后果自负。]

 

现在是公元20106月,距离18406月爆发的第一次鸦片战争(Sino-British Opium War)正好170周年整。中国的历史学家一致称这次战争为中国近代史的开端。185610月爆发了第二次鸦片战争,这次战争基本上使得大清帝国从此失去了反抗西方的能力。

“……。

……,两次鸦片战争最终使中国从一个独立的封建国家逐渐变成半殖民地半封建国家,中华民族由此开始了一百多年屈辱、苦难、探索、斗争的历程。

……

鸦片战争的结果是使中华帝国关闭自守的古老大门被英殖民主义的尖兵利炮打开,从此再也不能复合。

……

1842724日,清政府在英军的炮口下,被迫签定了丧权辱国的《南京条约》。这是清政府第一份不平等条约,严重损害了中国的主权。

……

五千年来,中华民族从未受过如此巨大的屈辱。

……。”

以上引号以内的内容来自百度百科的“鸦片战争”词条。本词条在内容结构上对战争爆发前的国际国内形势作了简单分析。我在此借用这个基本结构并略作拓展和改述如下:

 

一、鸦片战争前的国际国内形势

(一)国际

1、西方世界:这里仅仅是一个文化而非地理的概念,因此,这里所说的西方世界包括欧洲、美洲和大洋洲以及俄国属下的亚洲部分。当时的西方世界在整体上已经迈入了现代文明,在政治、经济、科学、文化、教育、军事等各方面都取得了巨大的进步,引领着从那个时代以前就开始了的人类现代化的方向和步伐。由于这一崭新的文明形态所拥有的巨大能量及其所能迈出的前进步伐的幅度大大超越了那个时代一切其它文明形态所拥有的能量和所能迈出的幅度,因此,它超越自身的时空局限以走向世界、改造世界和创造新的人类文明的意志和能力无可阻挡,而率先完成第一次工业革命的大英帝国以骄人的成就引领着西方世界前进的方向和脚步。

2、非洲:这是一个单纯的地理概念。这是一片由于西方贩奴先驱者的到来刚刚开始进入现代文明启蒙的荒蝥之地。为了追逐充满着血腥和残酷的贩奴利润,西方先驱者在此开始了一些带有殖民性质但又富有开拓性质的工作,由此带给该地区的是现代文明的曙光和家破人亡妻离子散被迫为奴的苦难的并存。

3、亚洲:

1)近东和中东:这是一片由伊斯兰教文明主宰的区域,基本上没有现代国家的形态。以大英帝国为首的西方势力来到这里后,开始向这片对西方人来说充满了数百年爱恨情仇的地域输入崭新的世界观和科学精神。

2)南亚印度次大陆:大英帝国在此经营着东印度公司,使得古老的东方印度文明最先接触到了以科学为主导力量的现代工业文明和种植业,并因此成为了大英帝国经济体系的一个重要组成部分,从此,以宗教信仰和科学精神为核心的西方文明也开始沐浴着这个深褐色原著民的脑海。

3)中亚:此时尚在沙皇俄国的卵翼下缓慢而沉重地发展着农奴制的畜牧业和农耕文明。尽管如此,由于沙皇俄国的欧洲部分一直跟进着西方文明前进的步伐,这里也因此而逐渐领略到了这个文明的魅力。

4)东南亚:这里也是一片饱经文明冲突的地区,伊斯兰教势力以刀剑、烈火和诱惑传播着信仰真主的价值,而佛教势力则以隐忍退让和宿命论顽强地坚守着一部分领地。这两种文明的交织和争斗最终导致了本地区原著民在信仰和文化上的分道扬镳。然而,西方势力的入侵则逐渐地改变着这种冲突的方向,一部分原著民开始转而接受基督教信仰和科学文明。

5)远东(日本):此时的日本尚未在美国海军的炮舰威胁和美国军官的政治诱惑下打开国门,但与西方的交往已经开始并从中获益。

总的来说,亚洲的上述五个部分在西方势力的入侵面前采取的基本上都是被动合作的态度和方式,鲜有暴力对抗和流血牺牲,在它们的文明发展史上几乎找不到“西方帝国主义者带来的屈辱”这类词汇和用语。

6)远东(中国):此时的中国还是大清帝国的时代,它囊括了远东绝大部分领地和附庸,包括东北、中原和华南等整个大陆上的汉民族聚居区以及西藏、青海、新疆、蒙古、台湾和高丽等,除了后来高丽和外蒙的完全独立以及内战导致的台湾的部分独立外,其它部分构成了现今的中华人民共和国的国际法主体,即俗称的中国。

(二)中国

此时的中国社会与西方文明相比存在着以下几个显著的历史特征:

1、尚未开启现代的科学思维和文明创造。这样的文明形态注定要在科学精神蓬勃发展的时代受到启蒙。

2、由孔孟的儒家礼教衍生的奴颜卑膝的政治和人生哲学充斥着官僚阶层的日常事务并毒害着中下底层部分民众的心智,而佛教的善恶有报的宿命论以及道家的遁世主张也大行其道。这三大哲学体系主导着整个社会的精神世界,从而最终形成了男人缠辫女人裹脚、男人奴才女人无知、浑然不知内外已是两重天的自给自足、盲目自大和畸形自尊的社会心理和文明形态。这样的精神文明注定要被西方的精神文明击败,从而注定要产生自我悲情,注定要产生仇外情绪,注定要产生狭隘的妒嫉心理。

3、腐败而又残暴的世袭专制政权。(参见百度百科词条:鸦片战争)

4、相对巨大的经济产出与绝对落后的经济形态。这样的经济结构注定经受不了新型工业文明的冲击而崩溃。

5、固步自封的四书五经教育。这个沿袭了近两千年的教育模式和内容培养了一代又一代的奴才式官僚阶层。对于进入这个系统的每个人来说,孔子的“学而优则仕”是他们的最高信条,因而读书的唯一目的只是为了捞取一官半职,非此没有任何意义。这种对待知识和教育的认知与实践导致了一个令人叹为观止的结果:在如此漫长的中华文明历史时期内,这个教育系统没有为本地区培养出哪怕是一个有科学创造精神和能力的个体,更没有培养出一个勇于揭示真理、敢于反叛时政潮流或有能力预见未来世界的思想家,因而完全是一个落后和失败的系统。

6、外强中干的军事。(参见百度百科词条:鸦片战争)

7、闭关自守的对外关系。(参见百度百科词条:鸦片战争)

综上分析可知,当时的中国社会已经处于西方新型文明的包围之下。这个新的文明风暴必将以势不可挡的力量从各个方向横扫中华大地,而无论其方式、方法和后果如何。

 

二、西方对中国的征服、尊重和贡献

主要关注早期西方列强对大清帝国的经济和军事征服,以及后期英、苏(俄)、美、德、法、日等对中华民国和中华人民共和国的现代化进程的历史性贡献。(略)

 

三、中西方交往和冲突的后果

 

早在第一次鸦片战争前的数百年里,西方就开始了与中国的交往。马可波罗和利马窦的到来在中西方之间牵上了一条细细的历史纽带。但是,对中国近现代历史进程产生决定性的重大影响的莫过于鸦片战争及其后续的政治经济文化交流和冲突。因此,整整170年里,西方“帝”国主义为中国带来了基督教信仰、现代科学文明和社会发展学说,使得以崇孔科举为社会和人生最高准则和目标的中国人走进了现代科学和文明的殿堂,使得今天的中国社会有了迈向现代化的精神和物质基础以及基于此上的可能性,从而在最大程度上改变甚至颠覆了鸦片战争时期中国社会所具有的历史特征。反之,如果没有西方开拓者的无畏和胆识,如果没有西方先辈致力于文明碰撞和社会变革,那么,现代的中国人将很难想象自己的命运。我们完全可以预见,男人的辫子和女人的小脚,男人的奴性和女人的无知等等,都将会继续存在。

 

四、结论

 

因此,中国应该感谢和尊敬西方,并且要因此而虚心向西方学习,而学习的目的只有一个:增进自我创造的能力以实现人类的共同进步。

如果有人坚持要说这170年来中国受尽了西方帝国主义的压迫和凌辱,那是站在自己狭隘的立场上睁眼说瞎话!那是站在大清帝国的龙旗下为失去的世袭专制皇权鸣冤叫屈招魂鼓魄!那是跪在孔孟的坟墓前乞令国人自动回归170年前的儒家礼教和奴才哲学!

这就是我在为西方辩护!这个为西方的辩护实质上是在为我等现代中国人的辩护!而我等现代中国人是我们的后代即未来中国人的前辈,因此,为我们的辩护就是为我们的后代的辩护!如果有人因此而要咒骂我的这个巨型“汉奸”的历史哲学观,就请他/她先回家拆除自己家里的全部照明卫生保健系统、砸烂电脑电视手机电话、焚烧所有内含西方科学知识的课本和毕业证书、……。总之,去除掉一切与西方科学和文明有关的东西,然后再来此开口咒骂或辩论。

本人在此敬候。

 

(原文在此:http://blog.wenxuecity.com/blogview.php?date=201006&postID=17359

 

发表在 纵横历史=History | 留下评论

一个统计学家眼里的人生爱情婚姻观

一个统计学家眼里的人生爱情婚姻观 
               
                                                                 [ 海边拾贝 ] 
                                                                        海水是苦涩的,却是孕育生命的摇篮。
                                                                                                           1988-05-18 
                                                                  大爱生大痛苦,大痛苦出大智慧。
                                                                                                           2010-03-06

        在这个世界上有一种需求,它源自生命的本能,却时常遭遇不可预知的困境。面对这种本能和困境,作为一个人,你不可放弃,而应该去找寻超越自我的意志和力量,因为这个世界将永远只有一个你,而你只有一次生的机会。
        在这个世界上有一种爱,它发自心灵的深处,有一个特定的归属。面对这一感动你的灵魂和肉体的情愫,作为一个人,你不可抗拒,因为那是你愿意用在此之前的童年的苦难和屈辱以及天真和梦想去换取,用青春年华的热血和激情来浇灌,且渴望着以“从此以后,即使到了生之终点也要和他 / 她一起微笑着走进我们共同的坟墓”为期待的生之苦痛和命之乐泉。
        在这个世界上有一种责任,它来自上帝的律令,有一个特殊的范畴。面对这一惠及个人、家庭和社会的崇高使命,作为一个人,你不可违避,因为你的生命是上帝赋予的,你来到这个世界只是为了完成他交托给你的使命。
        上述三个要素构成了一个婚姻成立的内部条件。当需求、爱和责任三者合并为一个整体时,就会演绎出一幕感天动地的戏剧,一个美丽惊人的童话,一段旷世难觅的人生。
        当需求、爱和责任三者相互分离且构成一个稳定的三角形(即三个边都足够长,且从每个顶点引垂直线到其相对的底边时,垂直线与底边的交点都在该底边的长度之内)时,需求就是本能的底线,爱就成为心灵的砝码,而责任则是来自外部世界的约束,此时的婚姻就是基本稳定的,因而你的故事也就显得平淡无奇。当三者相互分离而其中任意两个相互靠拢时,三角形的稳定性将发生变化,例如当垂直线与其相对底边的交点落在该底边长度之外时,这个三角形将会自己倒下或在受到外部作用力的条件下倒下,除非该底边向垂直线落下的方向延伸以使得该三角形重新变得稳定,否则就意味着婚姻的不稳定或即将破裂,该延伸部分是以实线还是虚线方式延伸,将意味着被延伸部分是从婚姻内部改善还是向婚姻外部寻求补偿。
        让我们在基本稳定的三角形情形下考虑其不同边长的改变结果。当三条边的任意一条开始变短,以该边为底的三角形的重心就开始相对于该底边升高,从而该三角形在该底边上变得不稳定。而当其它两边变得不等长时,三角形就有可能会倒下。当我们假设上述三个因素中的任意一个为底边时,根据上述稳定性变化的方向性分析,就可以演绎出万世万代千奇百怪异彩纷呈的人生悲喜剧或以下模型化的人间故事。
        例如,当需求为底且开始变短时:1)如果爱变短,则三角形就会向爱的方向倾倒。此时要想改善婚姻状况以维持婚姻的稳定,就需要双方在婚姻内部从两个方向上同时或分别做出努力,即要么增加对对方的“需求”,要么增加相互间的“爱”的份量。如果这两个方向上的努力失败,婚姻破裂的可能性就会很大。2)如果责任变短,则三角形将向责任方向倾倒。此时要想改善婚姻状况以维持婚姻的稳定,也需要双方在婚姻内部从两个方向上同时或分别做出努力。以此类推,我们可以对以爱为底和责任为底的情形做出分析以找出导致婚姻状况出现不稳定的原因并进而找到改善的途径。
        除了上述影响婚姻状况的三个主要内部因素外,还可能存在其它影响个人和家庭命运的外部因素,例如战争、疾病和意外死亡等,由这类因素导演的模型我称之为不可预测的模型。

(原文在此:http://blog.wenxuecity.com/blogview.php?date=201003&postID=7626

 

发表在 统计学=Statistics | 留下评论

人种色度对黑色的差异性与文明创造能力之间的相关性

人种色度对黑色的差异性与文明创造能力之间的相关性

                                    —— 一个统计学家眼里的“种族差异”

         首先声明一下,本人不是“种族主义”者,也反对现有定义下的“种族主义”。但作为一个观察者,我不能不注意到种族之间的差异,且这种差异可以从统计学上得到证实。以下就是我的观察方法与结论。 

        一、观察对象

        1)灵长类动物(主要是黑猩猩)以及全体人类的皮肤、眼睛和体毛的颜色;

        2)文明创造能力,包括政治、经济、文化、军事、体育、教育等一切人类社会活动能力及其迄今为止的创造结果。

        二、观察与测量方法

        1) 以黑猩猩为参照,并设其皮肤、眼睛和体毛的色度为0,而其自身的文明创造能力为0

        2)将人类种族分为黑色、棕色、茶色、黄色、亚白(皮肤为白、但眼睛和体毛为黑)、白色(皮肤为白、但眼睛和体毛对黑色差异最大化);

        3)对人类迄今为止的文明成果的总和进行种族创造来源作简单归类。

        三、结果

        1)观察数据

        灵长类   皮肤 眼睛 体毛 主要地域分布          对黑猩猩的差异性 文明创造能力

        黑猩猩   黑色 黑黄 黑色 非洲                        0              0

                  黑色 黑黄 黑色 非洲、美洲(非洲源性)        1              1

                  棕色 黑黄 黑色 印度、巴基斯坦、            2              2
                                                      孟加拉国、斯里兰卡

                  茶色 黑黄 黑色 东南亚、美洲(白黑土杂交)    3              3

                  黄色 黑黄 黑色 中亚、东北亚                4              5

                  亚白 黑灰 黑色 中东、北非、除犹太人以外的

                                                       西亚以及阿拉伯半岛      5              4

                  白色 蓝灰 金褐 含犹太人在内的欧洲
                               和美洲(欧洲源性)        6              6

        2)相关与回归模型

  在“对黑猩猩的差异性”和“文明创造能力”之间建立相关关系,由Pearson线性相关系数和Spearman等级相关系数都可以得到一个统计结论,即种族肤色与其文明创造能力之间存在高度显著的相关性,两种相关系数都是0.9643,显著性检验的概率是0.0005
    在统计学中,我们一般都会对有相关关系的随机变量建立回归模型以便用自变量对因变量做出预测。回归模型的意思是说,如果某个自变量(例如这里的“对黑猩猩的差异性”)每改变一个单位(如这里改变一个等级),因变量(例如这里的文明创造能力)将改变多少。本文不打算建这类的预测模型,其中的原因见下文的讨论。

  四、结论

  上述相关系数的性质表明,人类各种族中与黑猩猩的差异性越大,其文明创造能力越强,相应地,社会的文明化程度越高。

  五、评价

  本观察法存在一定的问题。由于相关系数的计算基于对“对黑猩猩的差异性”和“文明创造能力”的量化,因此,主要的是问题是这种量化还远不够精确。本人认为,对“对黑猩猩的差异性”的量化可以采用色度差异进行量化,而对“文明创造能力”的量化则可以计算各种族中对人类文明进步做出过公认的贡献的个体数量及其占其种族人口的比例。如果这两个更精确的测量数据能得到的话,我相信其相关系数将会更高。正是由于这个原因,试图用本文提供的量化方法建立预测回归模型的努力是徒劳的,或者至少是不准确的。

  最后,权且当这个分析报告是一个笑话。如果整个世界真的是上帝创造的结果,我们不知道上帝为什么要造出不同颜色的人种,以及为什么还会有黑猩猩这类与人类很相似的物种存在?莫非黑猩猩的存在就是为了提供一个比较智慧生命系统的参照系?谁能解释这个现象?

(原文在此:http://blog.wenxuecity.com/blogview.php?date=201006&postID=5889)

 

发表在 统计学=Statistics | 留下评论

民主与专制各有其绝对标准(终极版兼告别政论版)

 

民主与专制各有其绝对标准

                                                  ——兼谈何新的错误

(终极版兼告别政论版)

 

(作者注:由于本人认识能力极其有限,本文初贴时反映的观点特别是对何新的评价有误。愿在此纠正。关于何新,他是中国数千年历史上难遇的一个极富智慧、才华超群的思想家和哲学家。他在认识论领域做出了非常杰出的贡献,从而为他思考中国乃至世界的命运奠定了一个强有力的思想体系和方法论。目前关于民主和专制在民主派与"何新派(姑且让我给出这么一个术语)"之间的论战中,何新派具有较大的优势,其主要原因就是何新派拥有一个强有力的思想和方法论作为武器,而民主派要想以其人之道还制其人之身,无异于用人家的武器攻击自己。因此,本人愿在此予以澄清,然而鉴于文章已经贴上网络几个小时了,可能很多人已经阅读过,所以,我还是保持原样。除了对何新本人的评价有变外,我仍然坚持民主与专制各有其绝对标准这一基本主张。特此做出澄清。请大家见谅。本人要进一步申明的是,本人对民主与专制的理解从词语学上取其中性的含义,它们之间的差别可以形象地用陶器与瓷器之间的差别来比喻,两者都是特定历史时期出现的且在特定历史时期拥有各自最好的功能和价值。最后,这是本人告别政论类的一贴,它意味着我将在相当长的时期内将不再涉足这个领域,因为从目前来看,我认为我在这个领域的基本使命已经完成了,因为我的使命不是要就事论事,而是试图提供一个尽可能正确的认识事物的方法。)

 

网友 laonuo (laonuo) mitbbs Military 论坛发表了题为民主不是绝对的,是在发展和前进的的帖子 (Sat Feb 27 16:41:48 2010, 美东 ) ,请参见:

http://www.mitbbs.com/mitbbs_article_t.php?board=Military&gid=33406099

在他看来,就连欧美各国的民主模式都不是一摸一样的。所以只有傻逼才认为中国人不能够创造属于自己的民主模式。

对于此种言论,网友 tcpcs00 (nobody) 反问他说:“ really( 真的吗 )? ”而网友 lovemmit ( 西环 ) 则一杆子打到水底地说:管它什么民主,保障人权利的就是好民主。大家快点创造一个出来,千万不要说现在已经是了。至少我不同意。网友 jiangtun ( 江豚 ) 则要求不高,他只关心能否自由上网:先别管民主不民主了。拆掉 GFW ,保证国人自由上网的权利才是王道。

为了从理论上反驳网友 laonuo 的观点,网友 TNEGIETNI (lovewisdom) 说道:民主与专制是政治学中的两个基本的对立的概念。它们之间的差别是鸡与鸭的差别,马和鹿的不同。

各民主国家之间在其特定的民主制度上的差别就如同美国鸡、山鸡、麻花鸡、中国土鸡、公鸡、母鸡、小鸡、鸡蛋、老鸡, …… ,甚至死鸡和活鸡等等鸡之间的差别,显然,一只鸭是肯定不能被归入鸡类的。即使是一个鸡蛋,也比一只鸭更接近于鸡类,尽管它没有头、没有脖子、没有翅膀没有腿,更没有鸟一样的身体。这就是民主的绝对性。无论鸡类和鸭类怎么发展和进化,鸡永远是鸡,鸭永远是鸭,除非你搞出个鸡与鸭的杂交种,但杂交种只能被称为鸡鸭或鸭鸡或任何其它你能赋予它的名字,但绝对不是纯正的鸡或鸭。

当你试图牵着自己的鹿到人家举行赛马会场的登记处登记说你的参赛动物也是马的时候,登记处的工作人员以及周围可能的围观者一定会以为你发了疯,因为你显然心智不正常。当然啦,你不会承认自己心智不正常,而且进一步提出自己的建议要求修改赛制和规则,以便让所有类似的大型四蹄动物们都来参加比赛,你会耐心地向比赛组委会解释说这样的比赛更加富有多样性和娱乐性,有什么不好呢?如果比赛组委会被你说动了且改变了原来的主意,那么,你的鹿,还有骆驼、牛、驴、骡等也就都可以来参加比赛了,而比赛的名称也就从赛马变成了大型四蹄动物竞赛。至于你的鹿能否赢得比赛,就看它的能力和运气。如果所有人都对此没有意见,人们无疑将有机会看到一场史无前例的、打破传统的僵化比赛形式的新型竞赛。这是好事而不是坏事。同时,你也没必要硬要说自己的是马了,而大家也就会承认并尊重你的独特的身份和地位。这对所有的人都是好事啊。

由此可见,民主有其绝对标准,这个标准就是民主这个政治概念或政治制度的政治基因,恰如鸡和鸭或马和鹿各有其生物基因一样。这个标准或政治基因就是在宪法上承认并且在各个具体法律上保障人人权利平等,从而形成一个可以用民主或任何其它可以使用的与民主内涵一致的术语来定义的政治制度。

网友 cynic (cynic@mitbbs 1998->2010->?) 对上述论述不以为然地说道:什么制度不关键,按照温 + 饱的话,关键是让人民群众有尊严地活着。只要人民群众都普遍活得有尊严,管它什么民主还是集中的。

对此,网友 TNEGIETNI (lovewisdom) 批驳道:人类的尊严意味着每个人的权利的平等。没有平等权利的人是不能被认为有尊严的。这是(关于民主的)一个绝对的且唯一的标准。因此,一旦这个唯一的标准被破坏,民主也就不复存在,尊严也就必然荡然无存。

与此标准相对立的就是人人权利不平等,它意味着一部分人对另一部分人的权利优势或弱势,因而具有权利优势的一部分人就有可能奴役权利弱势的群体。当这一标准被确认在宪法中且以各个具体法律加以保障时,就会导致某种形式或一定程度上的专制或任何其它可以使用的术语,从而形成与专制或那个术语相对应的政治制度。因此,人人权利不平等就是专制或那个被定义的术语的代名词。

因此,人人权利平等人人权利不平等民主专制之间存在着绝对差异,恰如鹿真理谬误之间存在绝对差异一样。由于民主与专制的政治基因都是唯一的,两者不可杂交,只能是同时并存或相互替代。

那么,在众多个人权利(例如宗教信仰的权利,说话或言论自由的权利,受教育的权利,工作的权利,服务社会的权利,追求爱与被爱的权利,寻求法律公正的权利,自由迁徙的权利,参军保卫国家的权利,……)的定义中,哪一个才是最根本的权利呢?在我看来,唯有言论自由才是唯一根本的权利(当然,任何人都可以否认我的这个观点)。为什么这样说呢?这是因为人类历史进步的原始动力是人类精神世界的进步或思想的突破。如果没有思想的突破,人类便没有任何进步的可能性。任何个人的思想或精神世界原本是个自由的世界,它无拘无束,自由驰骋,充分想象且逻辑地关联一切他所观察和感知的外部事物。他之所以这样做的唯一目的就是要告诉其同类什么是真理或谬误,以便帮助人类走上正确和健康而不是荒谬和毁灭的道路。一个人可以拥有足够的金钱或其它任何形式的财富(例如比尔.盖茨),也可能仅够日常开支(例如我自己);他可能拥有博士学位(例如你们当中的许多人),也可能大学肄业(例如何新);他可能身居高位(例如胡锦涛),也可能一官半职(例如薄熙来),也可能无官有职(例如我自己),甚至无官无职(例如许多的城镇下岗工人和农村的贫困农民),但是,无论是谁,都有自由思想的能力,而言论是思想由其发生场所(一个个体的大脑)借用人类共同的语言和逻辑形式向该场所的外部自然延伸以达至同类脑海的必由之路。由于思想是自由的,言论也应该是自由的,例如,何新终身追求的与刘晓波竭力捍卫的完全一致:自由地思想且自由地向公众表达出来。

由此可知,宪法与法律是否承认并保护言论自由是衡量民主与专制的唯一且根本的标准。至于民主制度与专制制度的其它方面的表现形式和基本特征,都是由它们各自的唯一政治基因演化出来的。要理解上述观点,请参考何新的《泛演化逻辑引论》一书以及陈立功的《论智慧的递进结构与认知的逻辑流程》一文(《医学与哲学》1999年第9)

这里,我不妨从自己的理解的角度提出一个问题问每一个人:

什么是千恶之首和万谬之极?

任何人可以从他/她自己的理解角度给出自己的答案,且那个答案只属于他/她自己,与我无关,因为我无权将自己的意念加给任何除我之外的其他人。这一逻辑适用于本文每一个有着公认的定义和内涵的文字可以延伸的全部人类语言的范畴。

顺便指出,何新本人对民主与专制没有明确的是非观念,这表明他没有准确地找到(或出于个人政治价值观而不愿意承认)导致两种社会政治形态存在根本区别的政治基因(political gene),从而以一个错误的立场或角度去阐述其政治理念。在他看来,历史没有绝对的正确与错误,因为可以从不同的角度去评价历史。这是一个可悲的错误认识,因为这个错误认识的广义化将必然带给他这样的结论:世界上万事万物都没有绝对的差别,从而真理与谬误之间也没有绝对的差异。如果他要阐述其政治理念,他应该从唯一的正确角度出发,这个唯一正确的角度就是每个人作为社会行为人时所具有的权利,从而也就只有两个最基本的进一步的演化方向:专制或民主。

这里,我们不得不承认,何新是一个极富智慧的思想家和哲学家,然而,他的思想体系或方法论存在着严重的错误(准确地说应该是缺陷)。这个缺陷就是他在使用辩证法时没有发现或不愿承认存在着唯一一个正确的观察与思考的角度,从而这个缺陷也就必然导致他的观察与思考的结果存在着缺陷,且很有可能会导致一个致命的缺陷,如果他偏离了那个唯一正确的角度。由此可知,这可能是导致他意识到自己处于孤独和自我矛盾状态的思想或方法论的根源。

发表在 政治=Politics | 2条评论

The Fundamentals of Statistics for Rebuilding the Methodology of Piecewise Regression Analysis Based on a Functionalized General Trichotomy (Part 1)

====================================================================

      This paper can be found in the public resources of the JSM 2007 Proceedings and the JSM 2009  Proceedings. It can be cited in:

 

Chen, L., Zhang, Y., Chen, Y., and Cullen, J. (2007). A Realization of Functionalized General Trichotomy in Logistic Regression. 2007 Proceedings of the American Statistical Association, Statistical Computing Section, JSM 2007 [CD-ROM], Alexandria, VA: American Statistical Association: 1865-1872.

 

Chen, L., Chen, Y., (2009). The Fundamentals of Statistics for Rebuilding the Methodology of Piecewise Regression Analysis Based on a Functionalized General Trichotomy. In JSM Proceedings, Section of Miscellaneous Methodology III sponsored by IMS. Alexandria, VA: American Statistical Association. 501-515.

 

Please Note: The JSM 2009 Proceedings is published online and the following is the link to my paper:

           http://www.meetingproceedings.us/2009/jsm/contents/papers/303243.pdf

 

 

     There is still another old version in this room published in March 2008. I would like to keep it in its original status. Although this version published in May 2009 is not the best one of the author, it will be never revised from today so that you may find differences between the two versions and how I improved it. Maybe you can find a better way to improve it just like what Pearson did on the work done by Galton.

 

If you have any question, please don’t hesitate to give me an email.

My personal permanent email address is: chenlgyq@hotmail.com

 

Thank you very much for your visiting!

Have a good journey with my most sincerely blessing!

 

2009/08/23 / 陈立功 (Chen  Ligong)=========================================================

 

The Fundamentals of Statistics for Rebuilding the Methodology of

Piecewise Regression Analysis

Based on a Functionalized General Trichotomy

 

Ligong Chen1, 2, 3 *, Yongmei Chen3

 

1. Department of Epidemiology and Health Statistics, Tongji Medical College,

School of Public Health, Huazhong University of Science & Technology,

13 Hangkong Road, Wuhan, Hubei 430030, China

 

2. Center for Prostate Disease Research (CPDR), Department of Surgery,

Uniformed Services University of the Health Sciences,

1530 East Jefferson Street, Rockville, MD 20852, USA

 

3. Department of Preventive Medicine and Biometrics

 Uniformed Services University of the Health Sciences,

4301 Jones Bridge Road, Bethesda, MD 20814

 

E-mail: * chenlgyq@hotmail.com

 

Please Note: If you meet "Insert FGTR_pic_xx here" in the text, please go to the album "FGTR_2009_5" in the "Photos" at the left side of the main page of this website (http://cotglti.spaces.live.com) to find them.

Of course, you can download the pictures if you would like. 

   

Abstract

       We discussed the fundamentals of Statistics and point out that the optimizations and the enforced continuity assumption in the current methods of piecewise regresion analysis violate the fundamentals. Based on constructing a random threshold variable (RTV) and a convergence rate (CRR) in data iterations in regression for searching thresholds, we introduced a functionalized general trichotomic regression (FGTR) as the most general segmentation in either symmetric or asymmetric with full parametric estimates and hypothesis. We proved that the probability for establishing a trichotmic model is sufficiently large as long as the sample size is satisfied. According to the properties of sample size n in all regular statistics, we used the RTV and the CRR per iteration to estimate two basic thresholds in weighted means and weighted confidence intervals (WCI), which may be adjusted by a discrete coefficient. We used weighted tests to infer differences between any two adjacent thresholds; an asymptotic Chi-square statistic to infer differences among full and piecewise models; several probabilistic statistic to infer continuity; and a statistic to evaluate the goodness-of-fit or similarity of the piecewise models. In our opinion, the current smoothing techniques may be applied based on the weighted mean threshold and the continuity test, while an improved bootstrap method is limited for large samples to decreas overwhelming computation works. A 500-time simulation strongly supported our idea. A sample and logistic regresison were used to illustrate the methodology.

KeywordsProperties of Random Variable, Axioms in Statistics,
                  Piecewise Regression Analysis, Weighted Mean Threshold,
                  Dichotomy, Trichotomy, Convergence Rate of Residuals,  
                  Weighted Confidence Interval, Weighted t-test,
                  Discrete Coefficient, Continuity Test,
                  Goodness-of-fit, Differentiality-Similarity Coefficient,
                  Full-range Analysis, Piecewise Analysis 

发表在 统计学=Statistics | 3条评论

The Fundamentals of Statistics for Rebuilding the Methodology of Piecewise Regression Analysis Based on a Functionalized General Trichotomy (Part 2-1)

 

1. Motivation and Ideology

 

      1.1 The Fundamentals of Statistics and Its Roots in Epistemology

      Intuitively, according to the Theory of Set, everything X I (I = 1, 2, …, N  ) in a specific field constitutes a set  written as:

                 X I  Î A                                                                                                           (1.1)

According to whether we already have some knowledge on X I or not, the set A can be divided into three subsets as follows:

       Definition 1: Knowable Subset (marked in A  ), in which we have some knowledge on some aspects of each element X I A ( IA   = 1, 2, …, NA ); for example, we know an attribute A  (for instance, sex or height), with which the IA  th kind of elements X I A  is different from the others, and we know the attribute A  randomly, independently and differently expresses within individuals, which constitute a full distribution of the attribute. Generally the full distribution is unknown, thus it is an uncertainty or random variability (marked in Ω) for us, and can be considered as a probability space (marked in P). Therefore, a probability space is a random space and can be written in a form of (A , Ω, P). This subset is what we have to consider in order to obtain new and relative complete knowledge about it.

       Definition 2: Known Subset, in which we have full knowledge on all aspects for each element. This subset no longer needs to be considered.

       Definition 3: Unknowable Subset, in which we do not have any knowledge on any aspect for any element. We cannot discuss this subset until we have some new findings or knowledge on at least some of them.

   As we know, for the subset A  , the triple elements A , Ω, and P can be used to describe a probability space. In Statistics, a probability space is a population, and the triple elements are three basic population parameters that we try to obtain. Obviously, if we obtain all individuals in a population, we will definitely have the parameters. However, there are two radical obstacles for us on this matter. One is that there is no possibility for us to obtain all individuals because generally they are infinite. The other is that if we do obtain all individuals, an ultimate description on the population has been completed; thus, the space (A , Ω, P) or population is no longer significant for us to describe.

  Therefore, for any uncertainty, we have to take a random and independent sample in a certain amount of individuals in a population in order to obtain a sampling description. With this sample, one or more attributes are measured within n individuals, thus we have one or more random variables Xj ( j = 1, 2, …, p) with xij ( i = 1, 2, …, n) observations. Without losing generality, let us consider the situation of only one random variable X. We believe that a mathematical expectation E(X) can determine the center of distribution of the X; a standard deviation SD can describe its sampling variability; and a probability distribution P can describe its sampling distribution. Obviously, a sampling description is an approximate description for a population. Thus, we have a concept of statistics (marked in s). They are an approximate estimate for a relevant parameter (marked in P  ). Therefore, a statistic s defined on random variable X (written as s(X)) corresponds to a parameter P defined on the same random variable in a population (written as P (X)); for example, sampling E(X) is an approximation of the population expectation E  (X).

   According to the definition of random variable [3], it is a real measurable function defined on a probability space (A , Ω, P). In another words, it is a known and measurable attribute defined on a probability space (A , Ω, P). A random sample with n observations  (i = 1, 2, …, n) of random variable X is a random mapping from the space (A , Ω, P). It is a measurable subset {xi} for a set of parameters {P k(X)} (k = 1,2,…m). There is a following relationship among the X, the subset {xi},  a set of statistics {sk(X)}, the space (A , Ω, P), and the {P k(X)}:

Insert FGTR_pic_01 here

Since any attribute of anything is unique, and a random variable is a variable attribute that randomly, independently and differently expresses on individuals, any random variable has basic properties as follows:

Property 1.1: Uniqueness, any random variable in a population is unique and differs from others. This property is the first and the most important one, which means that a set of parameters Pk (X) certainly corresponds to a unique random variable X rather than anything else. It is the base for interpretation with statistics to the parameters. This is an only one linkage between the two sets.

Property 1.2: Variability or Differentiality, any random variable is a variable attribute expressed on different individuals in a population. This property means that the existence of a variability is certain.

Property 1.3: Randomness, the change in quality and/or quantity of a variability on an individual in a population is uncertain or random. This property means that the magnitude of a variability is uncertain.

Property 1.4: Independence, the variability of an individual in a population should be independent to others. If it is doubtful, we must be careful to distinct. For example, if a random sample is recorded in “family unit”, although each member is an independent individual, many random variables may not be independent.

Property 1.5: Convergence, the variabilities of a variable attribute within all individuals in a population constitute a distribution and converge to an expected location. Generally, this property can be called localization. If the expected location is the center of a distribution, the property can be called centralization. An antonym of the convergence is divergence, which is saying the same thing from an opposite angle.

Property 1.6: Boundness, the variability of any random variable should be bounded in a measurable range or in a knowable subset. It is hard to image that a random variability could be boundless with an unknown expectation or location except in the case that it has a known certain location and can be probabilized to 1 in the range of (, +). If a random variable is measurable in the range of (, +) and can be probabilized, its theoretic expectation is 0 forever. This means that we no longer need to estimate its location parameter because it is a certainty rather than an expectation. Why something is an expectation to us is because we don’t know it. Therefore, what we need to work on such a distribution is just to estimate its variability to the 0 and describe its distribution in a probability. This is the philosophical and mathematical base for the distributions of all testing statistics. Therefore, a good testing statistic should be convergent, bounded and probabilized in the range of (, +)with a certain location 0; thus it is measurable in a full probability on the space of (, +). Thus it can be seen a testing statistic is our powerful tool to know the infinity with our finites. It is the greatest progress in the history and the highest intelligence of the human beings can reach and has ever reached.

Property 1.7: Relationality, one or more random variables may have a relationship with one or more others. It may be linkages of continuous random variables to discrete random variables, or associations among discrete random variables, or correlations among continuous random varaibles. Such kinds of relationships may be a cause-effect relationship or other explainable or unexplainable (within the existing knowledge system) relationships. Any random world is a mutually related system internally. Nothing in it can be isolated to all of the others.

Property 1.8: Measurability, any random variable is measurable. If it is immeasurable, it is unknowable with Statistics or unstatisticable.

Property 1.9: Probabilisticity, any variability of individuals in a population occurs in an expected possibility or probability, and the probability itself is a special random variable, which is measurable in a bounded range of [0, 1].

If a variable is not random, convergent, bounded and measurable, it is not what Statistics can treat in our knowledge system. Because of these properties, a random variable as well as the whole random world is knowable to us. With these properties, we will have at least following six axiomatic statements in Statistics:

       Axiom 1.1: any unbiased statistic s(X) for a parameter P  (Xcan be obtained through its random variable X.

       Axiom 1.2: a set of parameters { i(X)} (i = 1, 2, …, n) defined on random variable X is not equal to a set of parameters { j(Y)(j = 1, 2, …, m) defined on random variable Y, even n = m, if the two random variables are not defined on a same probability space.

       Axiom 1.3: all observations of random variable X defined on a random space (A , Ω, P) constitute a single distribution which has only one expectation E (X).

       Axiom 1.4: any single observation xi (i = 1, 2, …, n) of random variable X is not the estimate of the population expectation. The median is an exception.

       Axiom 1.5 if two random variables X and Y constitute a joint distribution, an observation xi (i = 1, 2, …, n) on X, which randomly corresponds to an observation yj (j = 1, 2, …, m) on Y, cannot determine the E(Y) except in the case that only one observation x and y can be observed for the both.  This axiom can be written as:

Insert FGTR_pic_02 here

According to Axiom 1.5, we will have two deductions as follows:

        Deduction 1.1 The extreme value (maximum or minimum) of X, ext(X), can not be taken to determine the expectation of Y, written as

Insert FGTR_pic_03 here

This means that we cannot take the ext(X) to make a statistical decision on Y.

        Because both E (X) and E (Y) in a population, as well as E(X) and E(Y) in a random sample, are unique, we have another deduction.

        Deduction 1.2 The relationship between E (X) and E (Y), as well as E(X) and E(Y), is a certain unique correspondence, written as

Insert FGTR_pic_04 here

This means that E (X) and E (Y) or E(X) and E(Y) are determined mutually and uniquely.

        Axiom 1.6: There is a scale or criterion in measuring a random variable, and the scale or criterion must be the same for every individual in a population. This is the so-called measurement consistency. Only when based on the measurement consistency can the differences among individuals be called random error, which is the only one objective that Statistics will and can treat.

发表在 统计学=Statistics | 留下评论