生成式人工智能正在以前所未有的速度重塑音乐创作的边界。6月28日,第十四期岭南大讲堂特邀中央音乐学院教授、博导、音乐人工智能系主任李小兵带来《AI 来了,音乐的未来在哪里?》主题分享,并接受了羊城晚报记者的专访。
参照“人文主义”,李小兵提出“机文主义”这一面向未来的理论设想——艺术不再仅仅是“人表达自我”,而逐步演变为一种由人机协同、乃至多主体共同参与的意义生成结构。
在本次专访中,李小兵教授不仅深入阐释了这一概念的提出背景与理论内涵,更直面大众最关切的一系列迫切问题——当AI音乐产量暴增,作品的“人味”是否会被稀释?听众与创作者之间的信任该如何重建?AI会否加速音乐消费的分层?最终,所有追问汇向一个根本性命题:当机器也能谱写动人旋律,人类音乐的价值究竟何在?

羊城晚报:从您的观察来看,生成式音乐人工智能近年经历了哪些关键技术节点?这些变化是如何推动它从“辅助工具”走向“参与创作本身”的?
李小兵:我觉得近几年有几个非常关键的节点。第一个节点,是从符号层面的作曲,也就是旋律、和声、节奏、MIDI生成,进入到音频层面的生成。过去AI更多像一个“作曲助手”,帮你写一点旋律、配一点和声、做一点风格模仿;但当它能够直接生成音色、演唱、编曲、混音质感的时候,它就不只是写谱子的工具,而开始进入音乐作品最终呈现的层面。
第二个节点,是从“片段生成”走向“歌曲级生成”。以前AI生成一段旋律、一段伴奏,创作者还要大量加工。现在文本输入之后,可以生成带歌词、旋律、人声、伴奏、风格和制作感的完整歌曲。这意味着AI开始参与音乐作品从构思到声音成品的全过程。
第三个节点,是从单点工具走向系统协同。AI不只是一个“生成器”,它可以参与歌词、旋律、编曲、音色设计、混音、母带、视频、传播文案,甚至听众反馈分析。也就是说,AI从一个工具变成了创作系统中的一个行动者。它不一定拥有人的意图,但它已经在影响创作路径、作品形态和审美结果。
所以我认为,AI音乐最重要的变化,不是机器会不会“写歌”,而是音乐创作的结构变了:过去是人面对乐器、软件和录音棚;现在是人面对一个能生成、反馈、变形、协作的智能系统。
羊城晚报:很多人会觉得AI音乐“没有人味”“缺乏灵魂”。当AI越来越深地参与音乐创作与制作,这种基于“人味”的评价标准还能继续成立吗?如何重建听众与音乐创作者之间的信任?
李小兵:“人味”这个标准还会成立,但它的含义会变化。过去我们说一首歌有人味,往往指它来自人的亲身经验、情感记忆、生命处境和表达冲动。AI参与之后,如果我们只从声音表面判断,很可能已经判断不出来了。因为AI可以模拟哭腔、呼吸、颤音、复古质感,也可以模拟某种“真诚”的表达方式。
但真正的人味,不只是声音像不像人,而是作品背后有没有人的选择、判断和责任。谁提出这个主题?谁决定保留哪一句旋律?谁判断这个情绪是否成立?谁愿意为这首作品承担署名、版权、审美和伦理责任?这些问题会比“是不是AI生成”更重要。
听众和创作者之间的信任,未来要靠三件事重建:第一是透明,AI参与到什么程度要有基本说明;第二是责任,不能把所有问题推给工具;第三是价值,创作者要告诉听众,这首歌为什么值得被听,它表达了什么人的经验、什么时代的感受、什么不可替代的判断。
我不认为未来听众都会排斥AI音乐。很多普通听众首先关心的是好不好听、能不能打动我、适不适合此刻的情绪。但对于严肃创作、职业音乐、艺术作品和粉丝文化来说,AI参与程度会成为新的信任问题。因此未来不是简单地反AI,而是要建立“可说明、可追溯、可负责”的创作伦理。
羊城晚报:您提出“机文主义”,把艺术理解为人机协同的意义生成结构。这个概念主要解决什么问题?我们要如何重新定义创作?
李小兵:我提出“机文主义”,主要是想解决一个问题:当机器不再只是工具,而是进入意义生产过程之后,我们还用过去那套“人是主体、机器是工具”的框架,已经解释不了新的艺术现实。
“机文主义”不是说机器取代人,也不是说机器拥有和人一样的灵魂。它强调的是:未来艺术越来越多是在人的意图、机器的生成能力、数据结构、算法机制、平台传播和社会反馈之间共同形成的。艺术不再只是一个孤立主体的表达,而是一个复杂系统中的意义生成过程。
因此,创作也要重新定义。过去我们说创作,往往强调“从无到有”的原创性。未来创作更像是提出问题、组织系统、设定边界、选择材料、调度模型、判断结果、承担意义。创作者不只是写出每一个音符的人,也可能是设计创作机制的人,是决定审美方向的人,是在海量生成结果中作出价值判断的人。
所以我觉得,未来的创作者会从“技术执行者”变成“系统设计者”和“意义组织者”。真正重要的不是你有没有亲手敲下每一个音,而是你有没有独特的审美判断、文化立场和精神结构。
羊城晚报:AI音乐产量的爆发式增长,会对音乐产业结构和审美机制带来什么影响?会不会加剧音乐消费的分层?
李小兵:一定会。AI音乐最大的问题不是“能不能生成”,而是“生成太多”。当音乐的生产成本接近于零,平台上会出现海量歌曲、海量背景音乐、海量情绪化内容。音乐从一种作品,逐渐变成一种随时可生成的声音服务。
这会带来两个结果。第一,功能性音乐会大量增长,比如短视频配乐、广告音乐、游戏音乐、直播背景、睡眠音乐、学习音乐、情绪陪伴音乐。这些场景里,很多用户并不在乎是否AI参与,只要合适、便宜、快速、好用。
第二,真正具有人格、故事、现场感和文化身份的音乐会变得更稀缺,也更有价值。也就是说,AI会让音乐消费分层。一部分人消费的是“即时满足”的声音内容,另一部分人会更加重视真实艺术家、现场演出、创作故事、手工痕迹和人类经验。
这不是简单的好坏问题,而是产业结构的重组。未来音乐产业可能一边是高度自动化的内容工厂,一边是更强调人格、现场、版权、社群和身份认同的艺术生态。AI会稀释一部分普通内容的价格,但也会反过来凸显真正有创造力的人的价值。
羊城晚报:音乐一直被认为门槛更高。随着输入文本就能生成歌曲成为现实,它会让音乐变成像短视频一样人人都可创作的表达方式吗?
李小兵:我认为会,但“人人都能生成”不等于“人人都能创作”。这两者要区分。
AI确实会极大降低音乐表达的门槛。过去一个普通人想写一首歌,需要懂旋律、和声、编曲、录音、演唱、制作。现在他可能只需要描述一种情绪、一个故事、一种风格,就能得到一首完整歌曲。这会让音乐变得像短视频一样,成为大众表达、情绪记录、社交传播的一种方式。
但音乐创作的高阶能力不会消失。就像手机让人人都能拍视频,但并没有取消电影导演;AI让人人都能生成歌曲,也不会取消作曲家、制作人和艺术家。它降低的是入门门槛,提高的是专业创作的上限和复杂度。
未来真正的差别,不是会不会使用AI,而是能不能提出好问题、能不能听出好坏、能不能把生成结果变成有个人风格、有文化深度、有情感重量的作品。AI让更多人进入音乐,但也会让真正的审美判断变得更重要。
羊城晚报:如果把时间拉长十年,您认为AI会如何改变音乐?
李小兵:十年以后,AI对音乐的改变可能会超过我们今天的想象。我认为至少有几个方向。
第一,音乐会从“固定作品”变成“动态作品”。一首歌不一定只有一个版本,它可以根据听众的情绪、场景、空间、身体状态实时变化。比如同一首歌,在运动时、睡前、开车时、演唱会现场,可能呈现不同结构。
第二,音乐创作会从“单人创作”变成“人机系统创作”。未来作曲家、歌手、制作人、AI模型、虚拟人、数据系统、交互装置可能共同组成一个创作团队。
第三,音乐教育会发生很大变化。传统“四大件”不会消失,但纯技术性的训练会被重新安排。学生更重要的是形成音乐判断力、审美力、结构思维和文化理解力。
第四,版权和署名会被重新设计。我们需要新的机制来说明:训练数据来自哪里,AI参与了什么,人类贡献在哪里,收益如何分配。
最后,我认为AI不会终结音乐。它会逼迫我们重新回答一个更根本的问题:音乐为什么对人重要?如果机器也能生成好听的声音,那么人类音乐的价值就更要回到生命经验、文化记忆、情感共同体和精神表达上。
文 | 记者 胡广欣 李丽 龚卫锋
视频 | 记者 刘志勇 林心怡 梁喻
包装 | 记者 余梓涛
羊城晚报·羊城派原创,未经授权不得转载
