(贝云网络科技)

世界人工智能大会(WAIC)于2024年12月正式推出首份刊物《WAIC UP!》,这是一部「AI时代进化指南」。我们邀请全球AI及跨领域的先锋力量,借由他们的独特视角,针对AI争议问题,带来一些反直觉、非共识的思辨观点。
本期围绕“超越:迫在眉睫的进程”这一主题,我们有幸邀请到人工智能研究者何伟杰,一起探讨汉语如何助力AI突破语言模型的局限性。
多年来,他跨学科且多维度地探索AI的可能性与局限。通过《汉字之美》一文深入阐述了语言的本质,以及汉语在“达意、传情、承道、启慧”层面的精妙之处,并指出汉语是一门充满智慧、吻合人工智能的语言。作为知行合一的人工智能研究者,他持续输出300余篇前瞻文章,对外输出了许多在当时还鲜有人知的有关人工智能的见解及相关知识。
语言作为人类思维的工具,与人工智能存在着密切的关联,而汉语作为一种结构化的构造语言,一种带有“意境”之美的语言,她的加入将为人工智能的语言模型树立新的范式——让AI生成的智慧如汉字般简洁、如成语般深邃、如书法般优雅。当西方人工智能陷入“算力狂欢”时,中国的“意象”文化更展现出一种富有韧性的智慧。真正的抽象不应是现实的逃脱,而是对本质的提纯;不是概念的囚笼,而是意义的升腾。就像汉语诗词中的意象,“长风破浪会有时,直挂云帆济沧海” 既超越了文字的束缚,抒发了心中对未来的创想憧憬,又源于自然现实的真实图景,这种 思维的发散与纪实相结合的意象,或许才是让人工智能超越语言局限、达成真正智能的关键。
以下为何伟杰独家观点的部分摘录:
“最优语言”?
汉语语法是孤立语法。汉字每一个字都是单独一个词元(token),且没有词尾变化,这样就不会出现一个单词多种形态的问题。 汉语的时态、语态、数量已经被抽象成一定的“副词”来表达,这种上下文无关的孤立语法,是完全吻合计算机易于处理的正则表达的语法。
汉语是构造性的语言。我们语言的含义是通过每一个文字符号的不断组合构造涌现而来的, 汉语是由“文”组成为“字”,由“字”合成为“词”,由“词”链成为“语”,这也完全吻合由讯息构成概念,由概念构成知识,由知识构成智慧的智慧构造形式。非常有利于人工智能神经网络通过链接,将词元的所携带的负熵构成为机器智慧。
以上这一些汉语特征,使得人工智能在处理汉语时,构建起的神经网络的节点数就会大大地小于其他语言。
幻觉困境?
汉字的起始点都是与自然万物相联系的,都是带有“意义”(信息)的符号,这样的符号之间的链接,是对自然世界万物的归纳与提炼,呈现出原本事物“意义”的规律性及可预见性
当前大语言模型出现的“幻觉”现象,根源就在于机器语言大模型未能将语言与自然现实相链接。
而要超越这个局限,唯有让模型与真实世界相链接。因此, 未来语言模型的发展方向,应着眼于语言与自然存在之物的联系。此外,我国在人工智能实际应用场景中的落地优势,也是促成人工智能与人类生活相链接的有效手段,这种链接能够打破语言模型在封闭形式世界中的概念逻辑转换的局限,帮助模型获取人类尚未知晓的自然智慧。
中国人的思维方式
更适合研发AI
“ 汉语对人工智能的帮助不仅体现在神经网络对汉语处理的高效性上,更体现在长期浸润于汉文化的这类人群的思维方式上。”
神经网络并非是预制的机械网络,而是在学习中自我调节、生长的构造性网络。这种特性对于使用构造性语言——汉语的人来说,是轻车熟路的。此外,汉语的“意象”特质也极为重要。西方思维要么具象,要么抽象,而汉语融合了象形实物的具象特征和会意概念的抽象特征,形成了 中华文化独特的“意象”性的审美文化和思维方式。这种特征与神经网络算法的编制有着高度的契合,因为神经网络算法是兼具数学算法的抽象性和对人类“神经网络”的仿真具象性,同时还需要加入“变异”“涌现”等超越具象与抽象的“意象”成分。汉文化圈人群的思维方式,恰好与之契合。