人类语言中的“知其然而不知其所以然”
人类语言中的“知其然而不知其所以然”
观前提醒
注:本文讨论的话题在网络上可查询的资料较少,所以本文主要为主观推断,一家之言不可全信,务必辩证看待,读者应该保持怀疑态度,自行思考对错
人类是怎么知道一个词的意思的?
在理解这个问题之前,我们首先要了解人类是如何理解一种语言的
如果直接从中文理解困难的话,不妨用学习英语的思维来思考这个问题
Hello! How are you?
I'm fine, thank you, and you?
语境理解
比如你不知道Fine这个单词是什么意思,但是你认识Hello,哪怕你把How are you直译为怎么是你,也可以轻松推测出Fine的意思
你好!怎么是你?
我__,谢谢,你呢?
在我们的脑子里面,会尝试修正这句话为正常中文(或者母语)的语序,也就是改病句,变为:
你好!真巧,怎么遇到你了?
我__,谢谢,你呢?
所以我们可以推测这里肯定是个形容词,我怎么怎么样那必然是形容状态的,故Fine必然是一个表示自身状态的词
根据语境推断出这句话应该出现在俩熟人见面的时候,开头的一些客套话,那根据中文的习惯,应该得回答最近过得不错之类的,所以我们推测Fine的意思是不错
经验主义
在我们推测时,不知不觉地运用了我们以往在中文与生活上的经验,我们猜测这里应该是个形容词,那是因为在中文的语境和语序中这里是形容词。我们判断这里是客套话并认为这里应该回答不错是因为在生活中我们就是这么干的
不难发现,我们学习新词汇的时候总是会先尝试迁移旧知识。好的,那么问题来了:第一个知识从何而来?
答案是:观察、联系
比如一个人没见过苹果,他问你什么是苹果,你那个苹果给他看,告诉他这就是苹果,他通过观察发现苹果是个球体并且皮是红色的,那么他会将球体、红色与苹果建立一个联系。这样在他下次见到苹果的时候,他就可以脱口而出:“这是苹果!”
那,青苹果呢?麻烦大了,我们没告诉他苹果也可能是绿色的,这个知识还没有在他脑内建立联系,所以这时候他可能会犹豫不决,出于性格不同,可能会描述为“类似苹果的东西”,“绿色的苹果”或者干脆否认
这就是在语言中的经验主义,我们时常通过对旧知识的迁移和对概念和现实建立联系来学习一门语言
人工智能
在人工智能中,与我们人类的理解方式不太相同,差在哪呢?
机器学习像是在词语接龙,比如说:
你有这么高速运转的机械进入中__
机器学习通过大量的语料训练发现,“机械”“进入”和“中国”这个词的概率很高,所以这句话应该是
你有这么告诉运转的机械进入中国
Tips:笔者使用 Claude 1.2 Instant 测试了一下,给出的答案是“中心”,此处仅仅是为了举例,使用 AI 时请以实际结果为准
统计学
但这又和我们人类一样,人类有个名词叫“语感”,从字面意思分析就是“对语言的感觉”,事实上,人类学习语法的时候下意识地会去运用到统计学的知识,为什么你可以准确判断“我”后面在这个语境下一定跟形容词?因为你看过类似的情景
本质上,统计学也是经验主义,所以总的来说,人类的语言可以视为先在语境中理解,后期在经验中强化
俚语的特殊性
Tips:本文所指的“俚语”包含“网络流行语”
俚语的特点
俚语是指民间非正式且较口语的词句。《新五代史·卷三十二·死节传·王彦章传》中记载,“彦章武人不知书,常为俚语谓人曰:豹死留皮,人死留名!”。
俚语亦作里语、俚言。又叫方言,土话,民间非官方的腔调和语言习惯;俚语可以代表地方语言教导的水准因素,亦可在演员拍摄电影时,作为描绘角色真实感的做法。
也就是说,俚语存在一定的隐喻,存在变化快,传播广的特点
经验主义不再适用
请你丢弃你对网络流行语的所有知识,然后运用生活经验,推测996是什么意思?
你能推测出来吗?不能,为什么?因为他就是一个被胡诌出来的一个词语
三个数字,你连他到底读作“九九六”还是“九百九十六”都不知道,何谈理解?
俚语变化快的特点,致使了俚语注定无法基于经验主义去理解,因为通常情况下你接受的信息是滞后的
你完全很有可能先知道这个俚语,然后一知半解,根本不知道其底层意思
回到我们的主题,这是为什么会出现这个现象的原因之一
专业名词的特殊性
Q:法律是什么?
A:法国的律师
专业名词为何不能完全依赖语境理解
专业名词往往已经有了一个非常精确的定义,而依赖语境理解,和瞎猜没有本质区别,因为这些词的背后,往往涉及一系列复杂的理论知识,而你没有这方面的经验,所以你自然要么猜不出来,要么就是猜错,然后引起误解
经验主义效力减弱
如我所说,在非你所学专业的领域下的专业名词,你无法通过对旧知识的迁移来完成对新知识的推测
专业名词必须被严格定义,用的时候也必须严谨。如果不这么做,那和滥用没有区别,或者说不懂装懂
这是产生本现象的第二个原因
专业名词和俚语并行
Q:我的电脑中病毒了怎么办?
A:去医院开抗病毒的药
同词不同意的冲突
病毒这个词,在医学领域指一种个体微小,结构简单,只含一种核酸(DNA或RNA),必须在活细胞内寄生并以复制方式增殖的非细胞型生物。
而在计算机领域,表示一种具有破坏性的应用程序
那你说,这俩领域跨度那么大,我还分不清?
你还真分不清
如果我说,GPT 这个词,你会想到什么?
ChatGPT?大模型?
事实上,在计算机领域里,GPT 可以是一个语言模型,也可以是硬盘的分区格式
一个领域也能出现两个意思,然而如果不深入到某个领域,那你终将一知半解
而有些俚语和专业名词也存在冲突,所以需要仔细区分当前语境和应该使用的词义
专业名词在俚语中的“敏感词汇”
事实上,许多看似敏感的词汇,放到语境里,甚至可能只是个很普通的科学问题
理解偏差
在中国地区尤为明显的是,大家都会刻意避开有关性的词汇
所以大家就对这些词汇形成了一个刻板印象:这些词是低俗、肮脏、下流、不可触及、违背道德的
那么你如果一本正经说出这些词,就会被别人认为是“不正常的”
事实上,当别人一本正经讨论这些东西的时候,可能只是因为这个问题其实是一个实打实的科学问题
科学问题不应该带有情感,更不应该因此取笑
对这些词提高警惕是好的,但过于警惕则只会造成反效果
事实上,在我们的经验中是如此,但当你真正去深入了解这些词的定义、起源、历史、发展、社会观点,他会为你打开一个不一样的视角
换言之,其实你的经验很有可能会出错
词汇的演变
你知道吗?——Hacker 一词的演变
Hacker 一词,中文译为“黑客”
在我们印象当中,“黑客”往往指对计算机系统发起攻击的攻击者
然而,在以前,这个词表示高级的计算机爱好者
两词义反差可谓巨大,是一个典型的语义上的引申
纠正还是接受?这是个问题
简单来说:一般词汇如果一个引申义被普遍接受,那就是得接受,语言的变迁是不可避免的;如果是一个俚语,因为俚语本身就存在变化快的特点,再出现变化后,我们应该去接受。
但类似“哈基米”这样的俚语,我们需要警惕其在日常语境和特殊语境下的意思。这个词原本意思是日语中“蜂蜜”的音译,而后来被传播为“猫”,在网络用语或者平时开的玩笑中,我们当然可以采用后者,但是在日常语境中,我们必须采用前者,必要时可以给对方适当科普
对于专业名词,我们的态度要坚定,无论如何,必须纠正
事实上,对原意、俚语、专业名词和不同语境下不同意思的理解和认知,就是导致这个现象的罪魁祸首
当我们学习到新的词,在似乎用之前,了解是必不可少的步骤,不能用经验代替查阅
观点总结
词语滥用和误解的本质是没有去深入了解,不会用的词别瞎用,除非你很确定你已经深入了解过这个词,更不要在一知半解的情况下嘲笑他人,你的经验主义很可能是错误的。
经验主义可以让我们快速推断一个词的意思,有时也可以快速将我们导向一个错误的地方。