【视频】专访中央音乐学院教授李小兵：AI来了，人类的审美与价值判断更不可替代

原创 2026-07-03 14:43:57

打开App听新闻

2026-07-03 14:43:57

全文个字阅读约需分钟

生成式人工智能正在以前所未有的速度重塑音乐创作的边界。6月28日，第十四期岭南大讲堂特邀中央音乐学院教授、博导、音乐人工智能系主任李小兵带来《AI 来了，音乐的未来在哪里？》主题分享，并接受了羊城晚报记者的专访。

参照“人文主义”，李小兵提出“机文主义”这一面向未来的理论设想——艺术不再仅仅是“人表达自我”，而逐步演变为一种由人机协同、乃至多主体共同参与的意义生成结构。

在本次专访中，李小兵教授不仅深入阐释了这一概念的提出背景与理论内涵，更直面大众最关切的一系列迫切问题——当AI音乐产量暴增，作品的“人味”是否会被稀释？听众与创作者之间的信任该如何重建？AI会否加速音乐消费的分层？最终，所有追问汇向一个根本性命题：当机器也能谱写动人旋律，人类音乐的价值究竟何在？

羊城晚报：从您的观察来看，生成式音乐人工智能近年经历了哪些关键技术节点？这些变化是如何推动它从“辅助工具”走向“参与创作本身”的？

李小兵：我觉得近几年有几个非常关键的节点。第一个节点，是从符号层面的作曲，也就是旋律、和声、节奏、MIDI生成，进入到音频层面的生成。过去AI更多像一个“作曲助手”，帮你写一点旋律、配一点和声、做一点风格模仿；但当它能够直接生成音色、演唱、编曲、混音质感的时候，它就不只是写谱子的工具，而开始进入音乐作品最终呈现的层面。

第二个节点，是从“片段生成”走向“歌曲级生成”。以前AI生成一段旋律、一段伴奏，创作者还要大量加工。现在文本输入之后，可以生成带歌词、旋律、人声、伴奏、风格和制作感的完整歌曲。这意味着AI开始参与音乐作品从构思到声音成品的全过程。

第三个节点，是从单点工具走向系统协同。AI不只是一个“生成器”，它可以参与歌词、旋律、编曲、音色设计、混音、母带、视频、传播文案，甚至听众反馈分析。也就是说，AI从一个工具变成了创作系统中的一个行动者。它不一定拥有人的意图，但它已经在影响创作路径、作品形态和审美结果。

所以我认为，AI音乐最重要的变化，不是机器会不会“写歌”，而是音乐创作的结构变了：过去是人面对乐器、软件和录音棚；现在是人面对一个能生成、反馈、变形、协作的智能系统。

羊城晚报：很多人会觉得AI音乐“没有人味”“缺乏灵魂”。当AI越来越深地参与音乐创作与制作，这种基于“人味”的评价标准还能继续成立吗？如何重建听众与音乐创作者之间的信任？

李小兵：“人味”这个标准还会成立，但它的含义会变化。过去我们说一首歌有人味，往往指它来自人的亲身经验、情感记忆、生命处境和表达冲动。AI参与之后，如果我们只从声音表面判断，很可能已经判断不出来了。因为AI可以模拟哭腔、呼吸、颤音、复古质感，也可以模拟某种“真诚”的表达方式。

但真正的人味，不只是声音像不像人，而是作品背后有没有人的选择、判断和责任。谁提出这个主题？谁决定保留哪一句旋律？谁判断这个情绪是否成立？谁愿意为这首作品承担署名、版权、审美和伦理责任？这些问题会比“是不是AI生成”更重要。

听众和创作者之间的信任，未来要靠三件事重建：第一是透明，AI参与到什么程度要有基本说明；第二是责任，不能把所有问题推给工具；第三是价值，创作者要告诉听众，这首歌为什么值得被听，它表达了什么人的经验、什么时代的感受、什么不可替代的判断。

我不认为未来听众都会排斥AI音乐。很多普通听众首先关心的是好不好听、能不能打动我、适不适合此刻的情绪。但对于严肃创作、职业音乐、艺术作品和粉丝文化来说，AI参与程度会成为新的信任问题。因此未来不是简单地反AI，而是要建立“可说明、可追溯、可负责”的创作伦理。

羊城晚报：您提出“机文主义”，把艺术理解为人机协同的意义生成结构。这个概念主要解决什么问题？我们要如何重新定义创作？

李小兵：我提出“机文主义”，主要是想解决一个问题：当机器不再只是工具，而是进入意义生产过程之后，我们还用过去那套“人是主体、机器是工具”的框架，已经解释不了新的艺术现实。

“机文主义”不是说机器取代人，也不是说机器拥有和人一样的灵魂。它强调的是：未来艺术越来越多是在人的意图、机器的生成能力、数据结构、算法机制、平台传播和社会反馈之间共同形成的。艺术不再只是一个孤立主体的表达，而是一个复杂系统中的意义生成过程。

因此，创作也要重新定义。过去我们说创作，往往强调“从无到有”的原创性。未来创作更像是提出问题、组织系统、设定边界、选择材料、调度模型、判断结果、承担意义。创作者不只是写出每一个音符的人，也可能是设计创作机制的人，是决定审美方向的人，是在海量生成结果中作出价值判断的人。

所以我觉得，未来的创作者会从“技术执行者”变成“系统设计者”和“意义组织者”。真正重要的不是你有没有亲手敲下每一个音，而是你有没有独特的审美判断、文化立场和精神结构。

羊城晚报：AI音乐产量的爆发式增长，会对音乐产业结构和审美机制带来什么影响？会不会加剧音乐消费的分层？

李小兵：一定会。AI音乐最大的问题不是“能不能生成”，而是“生成太多”。当音乐的生产成本接近于零，平台上会出现海量歌曲、海量背景音乐、海量情绪化内容。音乐从一种作品，逐渐变成一种随时可生成的声音服务。

这会带来两个结果。第一，功能性音乐会大量增长，比如短视频配乐、广告音乐、游戏音乐、直播背景、睡眠音乐、学习音乐、情绪陪伴音乐。这些场景里，很多用户并不在乎是否AI参与，只要合适、便宜、快速、好用。

第二，真正具有人格、故事、现场感和文化身份的音乐会变得更稀缺，也更有价值。也就是说，AI会让音乐消费分层。一部分人消费的是“即时满足”的声音内容，另一部分人会更加重视真实艺术家、现场演出、创作故事、手工痕迹和人类经验。

这不是简单的好坏问题，而是产业结构的重组。未来音乐产业可能一边是高度自动化的内容工厂，一边是更强调人格、现场、版权、社群和身份认同的艺术生态。AI会稀释一部分普通内容的价格，但也会反过来凸显真正有创造力的人的价值。

羊城晚报：音乐一直被认为门槛更高。随着输入文本就能生成歌曲成为现实，它会让音乐变成像短视频一样人人都可创作的表达方式吗？

李小兵：我认为会，但“人人都能生成”不等于“人人都能创作”。这两者要区分。

AI确实会极大降低音乐表达的门槛。过去一个普通人想写一首歌，需要懂旋律、和声、编曲、录音、演唱、制作。现在他可能只需要描述一种情绪、一个故事、一种风格，就能得到一首完整歌曲。这会让音乐变得像短视频一样，成为大众表达、情绪记录、社交传播的一种方式。

但音乐创作的高阶能力不会消失。就像手机让人人都能拍视频，但并没有取消电影导演；AI让人人都能生成歌曲，也不会取消作曲家、制作人和艺术家。它降低的是入门门槛，提高的是专业创作的上限和复杂度。

未来真正的差别，不是会不会使用AI，而是能不能提出好问题、能不能听出好坏、能不能把生成结果变成有个人风格、有文化深度、有情感重量的作品。AI让更多人进入音乐，但也会让真正的审美判断变得更重要。

羊城晚报：如果把时间拉长十年，您认为AI会如何改变音乐？

李小兵：十年以后，AI对音乐的改变可能会超过我们今天的想象。我认为至少有几个方向。

第一，音乐会从“固定作品”变成“动态作品”。一首歌不一定只有一个版本，它可以根据听众的情绪、场景、空间、身体状态实时变化。比如同一首歌，在运动时、睡前、开车时、演唱会现场，可能呈现不同结构。

第二，音乐创作会从“单人创作”变成“人机系统创作”。未来作曲家、歌手、制作人、AI模型、虚拟人、数据系统、交互装置可能共同组成一个创作团队。

第三，音乐教育会发生很大变化。传统“四大件”不会消失，但纯技术性的训练会被重新安排。学生更重要的是形成音乐判断力、审美力、结构思维和文化理解力。

第四，版权和署名会被重新设计。我们需要新的机制来说明：训练数据来自哪里，AI参与了什么，人类贡献在哪里，收益如何分配。

最后，我认为AI不会终结音乐。它会逼迫我们重新回答一个更根本的问题：音乐为什么对人重要？如果机器也能生成好听的声音，那么人类音乐的价值就更要回到生命经验、文化记忆、情感共同体和精神表达上。

文 | 记者胡广欣李丽龚卫锋

视频 | 记者刘志勇林心怡梁喻

包装 | 记者余梓涛

责编：校对：审签：

版权申明

羊城晚报·羊城派原创，未经授权不得转载

投票

附件

请复制稿件链接到浏览器中下载附件

本文记者

收起

热门评论