AI:阅读与写作的全新视野
金振邦
AI的兴起已经成为一种不可阻挡的历史潮流。它现在正在全方位地渗透进几乎所有的领域,催生着一个全新的社会形态。我想从多学科角度,谈谈我的一些看法,以及思考框架和探讨问题,把它放到我的“博客中国• 雷峰专栏”上。以后还会单独就AI阅读和AI写作两个方面,进行更加深入的探讨。
下面就四个方面谈谈我的具体观点和思考:
一、什么是AI人工智能?
现在全世界都正在迎接AI时代的到来。它的涌现表明我们已进入了人工智能高速发展的社会。AI是英文Artificial Intelligence的首字母缩写。它是一个以计算机科学为基础,由计算机、心理学、哲学等多学科交叉融合的新兴学科,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它试图了解智能实质,并制造出一种新的能以人类智能相似的方式做出反应的智能机器。这个概念的内涵极其深广,包括机器人、语言识别、图像识别、自然语言处理、专家系统、机器学习、计算机视觉等。各种AI平台信息的数据处理,主要是建立在浩瀚的大数据库基础之上,以及特定的计算机算法系统。它是现代第六媒介数据库的典型代表。
人工智能在以比特为传播媒介的电脑网络兴起以后,就已经开始孕育和发展。至今仍充满活力的各种网站上的搜索引擎,如百度、360、中文搜索引擎、 图片搜索引擎、 电影搜索引擎、 图书搜索引擎、 化学搜索引擎、 网盘搜索引擎 、 免费论文查重、 学术搜索引擎等,以及被誉为全球四大英文搜索引擎的Ask、Google、Yahoo和Bing。这些搜索引擎都是人工智能的萌芽、简化形态。还有手机自动推送使用者感兴趣的相关信息等,都属于人工智能的范畴。
人类的传播媒介的发展主要可以划分为两大时期,传统的原子媒介时期,包括报刊、广播、电视,以及现代的比特媒介时期,包括第四媒介网络、第五媒介流媒体和第六媒介数据库。它们之间并不是泾渭分明,而是具有一定的叠加和跨界。AI人工智能的发展,是比特媒介的高级阶段。
那么AI和人类智能究竟有什么区别,其分界线在哪里?AI是基于计算机程序和算法,通过数学模型和数据处理实现智能行为,缺乏生物学过程的复杂性和多样性。依靠预设算法和逻辑进行决策,处理问题线性、可预测,受限于编程指令。AI系统能够学习、适应,因为其学习能力,可在需要大量数据处理的复杂领域发挥作用,比如金融分析、语言翻译、图像识别等。AI的学习、适应能力在众多领域大放异彩,比如自动驾驶汽车和飞机、无人机的侦查和作战,甚至包括医疗诊断和手术施行。AI的核心在于它能够从数据中学习,不断优化自己的性能,可以在不断与环境交互中变得更加智能。
但AI系统也有其明显的局限性。它的运行效率和科学性,需要宏大的海量数据库来支撑,以及特定的计算机算法程序来提供指令。同时会耗费巨大的电能。由于数据流的浩瀚,在多数情况下其决策过程难以透明呈现,这在某些领域可能会引起担忧。通过大量数据训练学习,依赖特定算法,处理复杂、创造性任务时力不从心。创新力有限,缺乏原创性和情感深度。目前无法体验情感和意识,只能模拟简单情感反应。在模糊或不确定信息下表现较差,需清晰数据和规则。没有自主的目标和动机,行为由程序和人类设定。它作为辅助工具,可以大大提高效率,但缺乏道德意识和责任感。
人类智能根植于生物学和神经科学,是自然进化或外星生命移植的结果,涵盖认知、情感、道德等丰富维度。人的生命体就是一个微观宇宙,其内在的编码奥秘不亚于宏观宇宙,至今难以破解,甚至可以说永无解密的可能。其具体表现为:思维复杂灵活,能运用直觉、创造力进行非线性思考,具备抽象思维能力。能从少量样本快速学习,适应新环境,具备泛化和创新思维能力。具有高度创造力和自主性,能进行艺术创作、科学发现等突破性创新。拥有丰富情感体验和同理心,能深刻感受并理解情感。能基于直觉和经验判断,擅长处理模糊性和不确定性。具有自主目标、动机和价值观,能主动追求目标。作为社会主体,具有道德观念和责任感,能主动参与社会建设和管理。
现代AI系统和人类智力差异,其分界线在于心灵世界的有无。人类的灵性、情感、直觉、顿悟等是计算机所不具备的。人是AI系统的控制者,能够创造性开发计算机系统所需要的算法、模型、方法及特定数据库。判断的形成是意识的标志。意识思维具有非算法的性质。人的思维和精神,AI则难以取代。可见,AI与人类智能在生命本质、思维方式、学习方法、创造潜力、情感丰度和社会角色等方面存在显著差异,它们在各自领域发挥着独特作用。
计算机可弥补人类生理上的一些缺陷,如记忆量有限,数据计算速度低下,空间、色彩精密定位能力弱小,无法数亿次的计算、求解繁杂的微分方程和方程组、描绘多维图像、模拟无法实现或耗资巨大的实验过程等。控制论创始人维纳《人有人的用处——控制论和社会》一书告诫我们:“让我们记住,不管我们对于自动机之有无感情问题采取什么样的想法,它在经济上完全和奴隶的劳动相当。”计算机从本质上并没有摆脱作为机器的命运。计算机的基本功能是拓展人的感觉和思维器官。目前高水平计算机,虽然向着模糊思维和情感化方面迈进了一步,但眼下还不可能有想象、直觉、灵感等创造性思维能力。人机互动的本质仍是人-人互动。
AI所覆盖的领域极其广阔,这里很难进行深入、全面的介绍和探讨。我们试图通过阅读与写作的角度来以小见大,体会一下AI在特殊领域的实际应用。
二、AI阅读的独特功能
AI阅读。它将大大拓展读者传统的阅读视野,极大地提高信息的处理能力。它突破了传统图书馆纸质文本的浏览,甚至一般搜索引擎的检索功能。我们常用的百度、搜狗、谷歌等搜索引擎,可以说是AI人工智能的初级形态。只要有联网的浩瀚数据库群的支撑,以及某种计算机算法,我们可瞬间获取想要的各种文本资源,甚至可以进一步整理出每一个文本的摘要和提纲。这种可以洞察无限大的文本信息能力,是人类大脑根本无法企及的。
我们举一个典型例子来加以说明。在文体学研究领域中,其中一个重要问题就是古人在著述中对“文体”这一术语的使用频率及内涵意义。在传统媒介时代,我们只能去大学文科的古书库,对上千种古籍进行查阅。有时半天只能查阅几种,效率十分低下。现在,我们可以通过特定的AI人工智能,选择《四部丛刊》这部大型书库来进行检索,情况就截然不同了。张元济主编的《四部丛刊》是我国最佳版本的文学著作。它是“经史子集”中各方面必读的经典书籍,可谓浓缩的《四库全书》。2015年中央编译出版社编辑出版,收录古籍469种,9000余万字,420000页。其中还收录了一批非常有用的工具书,如最负盛名的宋刻《太平御览》。这一大型工具书,为今天科学研究提供了宝贵资料。现已制作出光盘检索系统,也可在网上通过AI来访问这个宏大资源库。比如输入“文体”这一术语进行检索,几秒钟就迅速反馈回来250条信息。每条信息是一句话,其中包含“文体”这一术语。你再进一步点击这句话,就可以通过超文本链接进入这句话所在的文本全文。过去需要若干年辛苦的工作,现在几个小时就能完美解决。又如,要探讨“文学”的元概念,写一篇“文学元概念研究综述”。如果离开了AI阅读的浩瀚视野,就难以完成这个课题。可见,人工智能在某种程度上可以压缩读者的阅读时间,大大延伸我们学习和研究的生命长度。
我们再看看几个宏大的数据库。1.《诗词总汇》(52.5M)。收集了10万首中国古代诗词作品。它自带的搜索引擎,只要提供主题词,比如李白,软件界面就会瞬间排列出所有他的作品。输入“菩萨蛮”,就会自动排列出所有这个词牌的全部作品。2.《四库全书》(1.39G)。3万6千余册,约8亿字。大学图书馆能够收藏这部鸿篇巨制都极为罕见。你在电脑界面就可以搜索其中任何一篇文献。3.《中国历代笔记全集》(48.6M)。分为汉魏晋南北朝、唐五代、宋辽夏金元、明、清等五卷。共收入从两汉到清末笔记1150种、5300卷,1.5亿字。我们也可以调用其中的任何一篇作品。
但是AI阅读的局限性也十分明显。它虽然为我们提供了浩瀚的信息资源背景,但对具体文本的深层解读和审美取向,还要取决于特定读者。读者的家庭环境、文化程度、社会经历、专业背景等,会给文本阅读涂抹上独一无二的色彩。尤其是文学作品欣赏和解读,威廉•莎士比亚说过:“有一千个读者就有一千个哈姆雷特。”它强调了文学作品在读者眼光中的多样性和独特性。可见,AI阅读无法完全取代每一个读者的个性化和创造性的解读。任何阅读的核心任务,都必须由活生生的读者来完成。比如庞德的《地铁车站》就两句诗:“人群中这些脸庞的隐现;湿漉漉、黑黝黝的树枝上的花瓣。”(裘小龙译)作者意欲表达一种在时间节奏日益加快的现代都市中那种时空体验的易逝感。其他解读可以说是五花八门、不可穷尽。AI由于没有独特的个性背景,无法提供多元化、细腻的情感和思考,至多汇集一下网上已有的解读思考。
AI阅读还涉及文献资料的使用权争议。作为网络来说,共享是其核心理念。网上的查阅内容读者理应可免费共享,但和传统出版物的稿酬制发生了冲突。其实不同的传播媒介会影响版权的具体含义。传统媒介的版权法能否适用于网络比特文本,中外传播界还存在着不同的理解和争议。目前网上资源有相当部分不允许下载和复制,除非读者缴纳一定的费用。这种现象和网络的共享核心理念背道而驰,应该受到读者的严厉抨击。其实传统作者写作的文本在网络上共享,其潜在回报会源源不断,其价值要远远超越传统的稿费。现在通行的做法是,只要作者提出异议,网站会及时撤除这个作品。
三、AI写作的全新挑战
AI写作。它将延伸出广阔的应用领域,爆发出令人惊异的巨大能量。现在它特别适合写作的初级阶段。我们想写各种类型的实用文档,AI人工智能都会提供相应的写作文体、框架和提示。如要写一篇论文开题报告,它立即会列出基本框架:①选题背景与意义;②国内外研究现状;③研究目的与内容;④研究方法与技术线路。⑤预期结果与创新点;研究进度与安排;⑥参考文献;⑦致谢。其中具体内容需要作者根据实际情况进行充填。
但并不是所有的文本类型都需要AI平台的介入。我认为一般需要强调作者的情感、思绪、激情、理念、心灵、创新等复杂因素的作品,不主张使用AI平台来写作,而是需要作者自己的智能进行干预和介入,必须全身心地投入。比如写作演讲稿、论辩词、学术论文等。前段时间网传两所重点大学在给一个单位的贺词,相当部分出现雷同现象。人们推测可能是AI起草的文本所致。传递情感和祝愿的文辞,决不能依赖AI制作,作者应该全身心地干预,甚至亲笔手书,这是对别人的诚意和礼貌。而涉及使用频率较高的大批量程序性和实用性文本,则可借用AI平台来化繁为简、提高写作效率。换句话说,AI写作的目的是提高效率,让写作者摆脱杂务缠身,能够腾出精力和思考,来写作更有创新力、有价值的作品。
而在文学创作领域,20多年前国内外就已涌现出许多AI创作软件。只要你输入特定的主题词语,就会呈现出有血有肉的诗歌、小说、散文和戏剧作品。但这只是文学创作的一种探索,甚至可以说是一种游戏的尝试。如诗歌网站的诗词创作,给予一个主题词,就会产出一首具体作品。小说的自动创作。1998年3月13日英国《卫报》以《计算机写就的阴险情节》为题报道,计算机软件写出情节小说,理性机器进入感性世界。在这篇震惊文坛的新作《背叛》中,草地碧绿,钟楼上爬满了常春藤,博士学位证书是预先安排的圈套。这篇小说是由一个新型的高级软件所撰写。但AI写作除了文学作品,目前还大都无法提供最终的文本结果,它将面临着作者个性的全面干预。目前,还只能成为写作的辅助工具。
AI写作将对传统文学理论提出挑战。如果计算机模拟人脑,创作出了小说、诗歌等艺术作品,算不算文学?如果是的话,那么关于“文学是人学”的权威理论就要重新定义。而且不仅文学的理论需要修改,恐怕人类整个意识形态都将被计算机颠覆和重构。对于自动写作软件的正确态度,应既不排斥也不依赖。它的存在不是为了扼杀人的情感、智慧、审美,而是帮助人们登上更高的写作平台。“自动写作”充满了挑战和诱惑,世界上任何产品都可以标准化,惟有艺术创作和论文需要个性和创意才有生命!真正的创作,文章所有细节都必须体现作者的意志和思想,这样的作品才是真正的原创。AI写作是一个极为复杂的课题,它涉及计算机、文学、医学、社会学、数学、逻辑学等众多的学科领域。计算机写作本质上缺乏人的个性灵魂,至多或多或少折射出计算机算法设计者的个性色彩。但AI写作的功绩不容小觑,它在处理浩瀚规范化文档方面,以及在有些方面如记忆和存储功能,已远远超越了人脑的限度。
同时, AI写作也受到版权挑战。AI创作的作品还有没有版权?署名的归属权是属于操作自动写作平台的作者,还是贴上AI写作软件的标签?AI创作的作品,缺乏具体作者的独创性,没有情感温度和心灵激情,是特定AI平台所依赖的数据库规模和特定算法制作的产物,不存在网络版权问题,任何读者都可以转载和引用。版权问题的明确,会直接影响每个单位的工作和学术绩效的评价和认定。
AI平台介入到写作领域已发生并不可逆转。其研究和开发才方兴未艾。在这一领域内,有可能潜藏着惊人发现和巨大成就。人机互动一定会出现类似“核聚变”的能量释放。
四、AI读写的若干思考
1. 关注专业数据库建设,拓展全新专业视野。这是AI读写运作的基础和根基。没有海量的数据库,就会严重削弱AI运作的实际功能。大数据体现了全新的思维模式。传统媒介思维的维度和走向,往往强调由点及面、以小见大、从个别到一般、由特殊到普遍等等。而大数据则完全相反,即由面及点、以大见小、从一般到个别、由普遍到特殊。凡是着眼于宏观数据背景来透视微观事物特性的,都属于大数据思维范畴。它极大开阔了我们的认知视野,提供了透视、观照认知对象的全息背景辐射。
数据库是网络时代的第六媒介,蕴含着全新的思想理念。它对拓宽专业学科视野、唤醒主体学习意识、推动中文学科跨界融合,有着重要意义。在一个海量的云存储空间里,能否实现使用者需求的特殊信息变形排列和有序呈现?许多大型数据库能否对搜索引擎全面开放,可能会涉及到许多理念和技术因素,甚至包括版权争议。
这里要强调的是如何逐步地构建单位或个人需求的专业数据库。现在一些教材的书后常常提供一些参考文献和重要资料,就是在不涉及版权情况下和有限空间里,尽可能向学生提供一些十分重要的阅读资源和作品库。但从长远来看,可考虑在自己电脑和移动硬盘上,构建个性化专业数据库。因为目前网络上的某些云库,常常只支持单个小型文件下载,而较大的资料集合则难以提供,或者需要收费购买。如需要全唐诗、全宋词、全元曲,以及大型工具书,则有一定的难度。如果遇到断网,就会手足无措。这些年来,我在尝试建设中文专业大数据库,初步规模已达20T左右。目前的技术和做法是,少量重要资源可使用U盘拷贝,宏大的数据则应使用硬盘拷贝技术来加以实现。我可以帮助需要的单位和个人,来实现重要专业资源的免费共享。
数据库的一个重要思想,网络的核心理念,就是信息资源免费共享。现在由于种种原因暂时还难以做到,但发展趋势谁也阻挡不了。网络共享理念,将会给学习和研究拓展出全新的空间,大大加快时代发展的步伐。过去需要跑图书馆进行日积月累收集的资料,现在则可轻松存储到自己硬盘之中。个人数据库的资源容量甚至可以轻易超越若干个大型图书馆。信息存储有着巨大能量,它本身就是一种强大生产力。如果任何资源都能唾手可得,那么人的潜能就能充分释放出来。它将极大地改变传统的学习和研究模式,引爆教育和科技的革命性转型,加速社会的发展节奏和进程。
2.需要探讨AI阅读的具体运用和实践操作。它运用什么方法来拓展读者的专业视野?比如我想了解国内外学术界对“文学”这个元概念的研究现状,那么AI能否依据世界上开放的数据库,来提供古今中外是第一手资源和研究成果呢?这个课题目前AI还无法做到。我只能通过自己的数据库来写作“文学元概念研究综述”。
3.需要探讨AI非文学创作的具体运用和实践操作。比如学术论文、学位论文的写作,哪些方面可以运用AI的特定功能。AI方法怎么能帮助突出作者的独创性?AI论文写作能否获得学术界的认可?它能够成为特定作者的学术成果吗?
4.关于AI阅读写作的计算机算法编程,这是一个极为复杂的艰巨任务。因为阅读写作的结果由于读写者的复杂性,算法编程也几乎是无限的,这注定是永远不可能完成的工程。在这方面算法编程的跨界合作,是一个全新的课题。AI阅读写作的发展,需要多学科专业人员的协作攻关。其复杂程度要远远超越自动驾驶、无人机操纵、导弹的轨迹控制、医疗的远程手术控制等。
2025年7月23日
红包分享
钱包管理

