用汉语能开发出计算机软、硬件吗?
原创

用汉语能开发出计算机软、硬件吗?

好文

热门回答:

我觉得提问者对汉语和英语有着浅浅的误解。计算机的语言是建立在二进制上的。和汉语与英语半毛钱关系都没有。编译语言所有的助记符只是标记。最终都是0或1。

首先。计算机语言首要的是简洁。能够表达程序的逻辑。主要的三种。也就是:顺序、选择、循环三种基本结构。和它们结合起来变成复杂的嵌套程序。看起来。总觉得汉语是很简洁。是分析语。逻辑表达对于每一种语言都是可行的。但是。我想说的是汉语的简洁是建立在很多习惯用法。传统文化。以及不胜枚举的典故上。对于计算机这种不太“智能”的工具。让他积累那么多先验再开始工作是不太可能的。所以说。汉语究竟能不能发明计算机软硬件呢?当然可以。只是没有必要。

接下来。我们从分析角度简要回顾一下。汉语以及英语的进化过程。先是汉语。汉语是为数不多的分析程度很高的语言。也就是掌握很少的字就可以听说读写了。复杂的意思是靠这些字排列组合形成的。但是。谁还没有个历史。很久很久之前。也许没有文字的时候。汉语是有格这类东西的。首先是生产生活祭祀活动很简单。没有那么多需要描述的东西。这个时候主要是扩充词汇量。恨不得每种马都是单另不同的物种。比如:

骠:黄毛白点马  骢:青白马  骓:青白杂色马  骐:青黑格子纹马  骥:好马  骏:好马  骕:一种良马  駃:另一种骏马  驵:骏马;壮马  驹:少壮马  骟:已阉割的马  骝:黑鬣黑尾红马  骖:车前两侧的马  騑:即骖马  騧:黑咀黄马  骙:壮马貌  骎:状马疾驰貌  骋:马驰貌  骒:雌马  骀:劣马  驽:劣马,走不快的马  驷:一车四马  驸:一车数马  駹:a)暗色面额白马;b)青马;c)杂色牲口  骍:赤马(也指赤牛)  骃:浅黑带白杂毛马

当时。你可能想不到的是。每一个汉字你也许要发好几个音节。并不像现在每个字只对应一个音节。而且还有大舌音和闭音节。也就是舌头振半天。以及字的尾音是k。t。p这种之类的辅音。但是由于表意汉字的出现。汉字和汉语相互作用。使得语法上汉语变成贴近分析语。构词发音上变成每个字对应单音节。闭音节消失。大舌音变成少数方言里才有的。汉语为什么会是这样?应该主要是由于汉字的作用。

英语就简单很多。和大多数日耳曼语族和拉丁语族的语言有着相似进程。迦太基人发明字母之后。当时的西方流行用字母文字。而弃用了埃及祭祀阶级的那种象形文字。其实原因很简单。学习象形文字要记的东西太多了。埃及象形文字的结构比甲骨文要复杂。表音文字。使得变格。时态语态的表达变得简单。所以他们的语言多为屈折语。从大航海时代以后渐渐分析化。尤其是英语。从莎士比亚时期。英语作为一个日耳曼语族的语言。大量引入了拉丁语族的单词扩充词汇量。莎士比亚就几乎创造了快三分之二的单词(记单词痛苦的同学们。尽情责备莎士比亚吧!)。我们明显可以看出来英语的各种词根来源于拉丁语。各种专业词汇来源于希腊语。举个简单的例子:

英语 太阳 sun 太阳的 solar 公历 the solar calendar 拉丁语太阳的词根 sol 其他拉丁语族语言的太阳 法语le soleil 如著名的太阳马戏团 Cirque Du Soleil 西班牙语 el sol

英语 月亮 moon 月亮的 lunar 农历 the lunar calendar 拉丁语月亮的词根 lun 其他拉丁语族语言的月亮 法语la lune 西班牙语 la luna

来自希腊语的 英语单词 。首先是archive。著名的网站arXiv其实发音应该是archive。意思是文献。来自于希腊语的Αρχεία。然后一个著名的单词apologize。是苏格拉底发明的。另外的就是比如galaxy是希腊语的奶。乳。银河是大力神赫拉克勒斯喝天后赫拉的奶的时候撒到了天上变成的。

好了。说了这么多的基础。我们可以开始推理 了。肢解三种语言。汉语。英语。计算机语言。

汉语的最基本的构成是笔画。笔画的种类呢。1965年1月30日中华人民共和国文化部和中国文字改革委员会发布的《印刷通用汉字字形表》和1988年国家语言文字工作委员会、中华人民共和国新闻出版署发布的《现代汉语通用字表》规定了5种基本笔画:横(一)、竖(丨)、撇(丿)、点(丶)、折(乛)。又称为“札字法”。学书法的都应该知道永字八法。把各种折都但拆出来算。应该大致有28种笔画。跨过汉语的偏傍部首。或是形声字的形旁和声旁的统计。然后。是字。作为一个普通的学生。我大概能用到的字在3000左右。不会超过4000。由于汉语字的表意性完备。我们就不算词了。这个我不好统计。不过在肢解英语的时候会说一下我的推测。接下来就是能够完整表意的句子了。

英语的最基本结构是字母。26个。应该没有异议。古英语在末端时间可能缺几个字母。比如q。基本上是用k代替的。而且为了节省羊胳肢窝。当时采用了很复杂的缩写体系。恨不能三五个字母让你能念十秒钟(夸张的修辞)。这个时期遗留下来的遗迹在西班牙语里的ñ发的音其实比较像nie。是为了缩写得到的产物。举个例子El Niño。男孩子。或是我们说的厄尔尼诺现象的厄尔尼诺;La Niña。女孩子。或者我们说的拉尼娜现象的拉尼娜。如果抛弃这些。我们就简单认为英语的字母是26个。然后我们跨过类似于汉语的偏傍部首的词根词缀的统计直接来到单词的等级。我大概会20。000多个单词吧。绝对不会到30。000万。好了。现在可以说我对汉语词的推测了。大概我常用的大概50。000左右吧。原因就是英语的单词基本上对应的就是汉语词组。有的时候是英语词组对应于汉语词组。但大多数情况下。英语还是单词单打独斗。不会拉帮结派。我认为我英语词汇量和汉语词汇量都应该不算贫瘠。中等水平吧。

先插一段。我对比汉语和英语的构成。大家应该发现了个问题。汉语和英语从微观到宏观不是对等的。也就是说。也许在某个层面。我们抛开传统文化。先验典故等等的干扰。对比某一个层面的汉语和英语。汉语未必比英语简洁。比如编程要用到的这些:if 如果;else 否则;for 对于在;while 当。等等等等。这些词从输入上来讲。英语更方便一点。在现有的键盘中。如果仅仅从简洁角度。英语至少和汉语打个平手吧。

再插一段。因为每种语言对于数字的表示都是比较特例的。这点汉语其实还好。虽然古人计数用了很多种简便方法。但是最后我们使用了阿拉伯数字。只用于表示的时候。我们也常常使用汉字版的。一、二、三、四、五、六、七、八、九、〇和壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、陌、阡这两种体系。但是诞生阿拉伯数字的印度。来对比一下阿拉伯数字的画风:

0。1。2。3。4。5。6。7。8。9

以及天城体梵语字母(印地语使用的字母)的画风

是不是差很远。罗马数字和罗马字母还是比较像的。

泰语字母

ก ข ค ฆ ง จ ฉ ช ซ ธ ฌ ญ ฎ ฏ ฐ ฑ ฒ ณ ด ต ถ ท ธ น บ ป ผ พ ฝ ฟ ภ ม ย ร ฤ ฦ ล ว ศ ษ ส ห ฬ อ ฮ อะ อัอา อิ อี อึ อื อุ อู เอะ เอ แอะ แอ เอาะ เอา เอิ เอีะ เอืะ เอื โอ ไอ ใอ อำ

泰语数字

画风差异没那么大。但是也有一点点。

为什么呢?因为梵语字母或是泰语字母或是汉字以及阿拉伯字母。相比于他们的数字都稍微复杂一点。而拉丁字母的简单程度和罗马数字是差不多的。这说明:1。数字要比一般语言文字简单才更好使用;2。拉丁字母在字母中算是简单的了。不论从构造。还是可连写的属性。可区分的属性上来说。(从发音上来说吧。为什么英语没有乘法口诀。因为英语数字不是单音节的。相对于不好写;而汉语的数字都是单音节。且都是开音节。相对于好写)拉丁字母和罗马数字的复杂程度算是一个等级。但是英语的数字念起来还是 one two three four 而不是i ii iii iv !!!

为什么拎出啦数字呢?因为计算机只认0和1。如果给我抬杠说生物计算机可以是AGCT或AGCU。那也不就是 00 01 10 11么。我们键盘对应的是ASCII码。输入其实都是一串0和1。

所以。那些关于表意汉字还是表音字母的纠结都会化成一缕轻轻的ASCII码进入计算机。什么意思。什么发音都见鬼吧。

计算机语言可以大致分成: 汇编语言。面向过程的计算机语言。面向对象的计算机语言。可能近来还有脚本语言。从上面的顺序从前到后。语言越来越高级或是说贴近人们使用的语言;编译速度或是程序运行的速度越来越慢;编译越来越复杂。但是编译都是从助记符变成0和1只不过复杂程度不同。助记符可以是任何可能的符号。

假设。世界上没有字母语言。只有埃及象形文字和中国汉字走到了现代。中国人开始发明计算机。根据我在上面的对比。有没有发现。笔画和字母在一个数量级上?我们可以设计一个形声旁的键盘。或是字的键盘。结果被放弃。因为按键过多;然后我们设计了一个笔画的键盘。然后横竖撇捺几个按键早早被按坏。但是几种不常用的勾对于某些人来说还从来没用过;结果我们就折中了方案使用了五笔。输入汉字是没什么问题了。编程中的变量命名就成了个不太方便的问题。在那种情况下应该是会使用汉字串来命名变量。由于汉语是分析语。那么很有可能出现这种情况

字母代码 tf.contrib.layers.max_pool2d(r3,[2,2],[2,2],padding='VALID')

可能的汉字代码 : 张量流.非官方函数库.层函数.最大化_二维集中化(第三残差层输出。[2,2],[2,2], 是否补边缘=“否”)

咱们算一下。每个字用五笔打的化。需要敲四下按键。那么。上面那行代码需要按键60次。下面需要22+33*4=220次。其实已经在可以接受的范围内了。编译语言的助记符可能就是单个的汉字。也许是另造出来的单个汉字。这样记忆比较方便。而且打字也不难。五笔就四下按键解决。

这种情况下人们为了简便化。很有可能像发明逻辑符号一样发明另一种表示方式(比如像几何学的那种)。然后发明了类字母。因为类字母的出现得给每个字母一个称呼。字母就有了。然后我们社会会极度分化。先是文盲和知识分子有个鸿沟就是汉字认识的数量(因为汉字确实不好普及。但是对于上高中的中国学生就不用华太多时间记专有名词。对于英语国家。小学的学生掌握26个字母和日常使用的单词相当容易。不用大量练习写之类的。但是到了高中。我勒个去比如医院里的老年科geriatrics和老old。变体老auld。年长的senior。半毛钱关系都没有。都要记。而我们的小朋友经历了惨不忍睹的小学。来到高中看到了老年科这个词。一看就知道是老人看病的地方。老年科三个字就说明了一切)。理想是丰满的。现实我就不说了。中国的文盲率很难降低。至少比用字母的国家。小朋友忍受不了要写50遍汉字来记住。结果抄了50遍。听写又写错了。这种事情对于我(本人还算是学霸)小时候都是家常便饭。我们的小朋友要多花近十倍的时间用于学习自己的母语。这简直是资源时间的过度使用。但是也是必要的。所以我对学汉语这件事是爱恨交加啊!!!我可以肯定社会鸿沟会先这么拉开。认字很多的知识分子和几乎只认识常用字的普通人。然后是第二个鸿沟。会字母的程序员和不会字母的普通知识分子。尤其是现在的人工资能的编程。可能会导致人的分化。掌握控制人工智能的人类可以无形奴役普通人。

好了。我的意yin可以结束了。我认为不是人们先发明英语再发明计算机软硬件。而很可能在发明计算机软硬件的同时诞生新的语言。我很钦佩提问者的脑洞。我并不赞成不学外语。即使arXiv上的所有学术论文都是用我的母语写的。因为外语是不同的一种思维体系。语言也许用不到。思维可以帮助你解决问题。或许有一天。我们真的不计消耗的非要用汉语编程。和我想的肯定不一样。因为现在大家用拼音打字。或许有一天。我们还用画来编程。只要有相应的智能编译器。况且现在神经网络结构用图模型表示更为简练。没有绝对的不可能和不合适。就像也许刚开始方块字和带格的古汉语也不合适。但是最后两者磨合成立成熟的汉语。汉语编程是可能的。但是目前来看没有必要。我觉得用字母语言编程挺好的。像汉语和汉字的作用一样。编程的汉语是不是和计算机相互影响和现在我们使用的汉语不一样呢?

您还感兴趣的文章推荐

以上就是由互联网推广工程师 桔子生活网 整理编辑的,如果觉得有帮助欢迎收藏转发~

分享到 :
相关推荐

回复 意中人 取消回复

登录... 后才能评论

评论(2)

  • 初心未变 永久VIP 2022年12月27日 16:40:08

    汉语,英语,汉字,字母,都是,语言,音节,语族,希腊语,计算机

  • 夜深时 永久VIP 2022年12月27日 16:40:08

    没想到大家都对用汉语能开发出计算机软、硬件吗?感兴趣,不过这这篇解答确实也是太好了

  • 意中人 永久VIP 2022年12月27日 16:40:08

    我觉得提问者对汉语和英语有着浅浅的误解。计算机的语言是建立在二进制上的。和汉语与英语半毛钱关系都没有。编译语言所有的助记