logo

Nostalgic Future Catalog

怀旧未来档案馆

AI能听懂音乐笑话吗

最近我一直在默默思考AI正在给宏观世界带来什么潜在影响的问题谈论这些问题很难我常常倾向于避开一些当下甚嚣尘上的争论仅仅因为不喜话题的风格或气质比如加密货币或Web3也许是一种Neo-luddite或是对理工科刻板印象中思维方式和意识形态的下意识叛逆但我碰巧是学习机器学习领域的学生深入接触过AI音乐这个方向所以我意识到我越来越难以忽略这个问题在我体内造成的割裂感和潜伏在其中的巨大困惑

不仅仅我自身割裂在几乎没有人不提到AI2024鼓吹者怀疑者加速主义者末日论者doomer各种观点立场缠绕交错我倾向于觉得世界还没有做好准备面对这次技术变革对我来说AI牵涉到复杂的世界线空气中无所不在盘根错节的隐形蛛网关于技术哲学媒介理论政治气候互联网乌托邦反乌托邦艺术创作和体验消费主义文化晚期资本主义技术封建主义甚至进化人性的边界之类的问题一直都存在也许现在AI把它们串联起来看起来会更明显吧我一直想做的事为了长大只是“making sense of the world”但即使是这样也实在太困难了我并不想得出一些草率的结论所以想要先花点时间静下心慢慢研究这些问题

不过即使是这样一点点地开始谈论也是有价值的今天看到Adam NeelyAI音乐果不其然听到了一些我期待已久的观点视频很精彩立论的核心在于音乐的图灵测试不应该在于输出音频乐谱而在于互动和人类一起即兴演奏jam也就是说音乐核心在于其作为动词的审美创作沟通的过程而不仅仅在于作为名词的作品或产品这当然也适用于任何其他艺术沟通不仅在舞台上不同乐手之间舞台上下乐手和观众之间也在时间轴上的创作者和传统之间——她们灵活地运用传统组装传统打破传统和塑造新的传统这些沟通构成了一种艺术文化

喜欢音乐的人应该会认同这些过程常常是身体性的听到funky味十足的音乐时很难控制身体不跟着摇摆神经科学家说大脑中的听觉系统和运动系统的活动时有重叠在听音乐时很明显很好玩的一点是AI能听懂音乐笑话吗你的鼓听起来像是1/1那这首歌就是400-bar Blues音乐的感知有超乎语言的东西有些是难以离开身体存在的很多部份人类自己也还没搞清楚不仅仅关于身体音乐是一种动作是什么让你想把某张唱片从架子上抽出来放在唱机上播放是什么让你在现场演出的时候忍不住想要跟着哼唱或者手舞足蹈是什么让一位母亲在哄宝宝睡觉的时候唱起多年以前从她的母亲那里听来的摇篮曲

如果在这里想要谈论具身智能和强化学习I think you missed the point.虽然说能否训练一个酷似人类能跟着音乐手舞足蹈的机器人不失为一个好的AI笑话大家或许低估了AI作为解构工具的趣味我一直想要发现其中的可能性像是Gwern做的This Waifu Does Not Exist

AI时代试图捍卫人性中艺术文化灵光的人们总有种五味杂陈的情绪我一直很有共鸣Adam的视频里从他的表情和语调当中我更深切体会到这是一种什么情绪面对某个说不清的庞然大物时自知不自量力的幻灭和恼怒而且那庞然大物并不是AI而是别的东西音乐AI永远不会通过图灵测试这句话在今天听来不得已会带有一种不得志的人冷嘲热讽的感觉而且我相信身为贝斯手的Adam自知如此但他仍这样说了所有Luddite式的观点不可避免带有一种学不会新技术的老狗传统文化人性的看门人gatekeeper般的语调所以我们现在到底在gatekeep些什么说艺术文化堕落到底说的是什么连这些问题都搞不清楚的悔恨也是五味杂陈的一部份你根本不知道在反抗什么

不过视频里Adam其实有明确所指他想指出的是在资本主义高效流水线互联网消费文化背景下如果你有一把锤子在你眼中所有东西都会变成钉子的工程产品思维音乐只是那些创业者的清单上另一个需要勾上的框框确实如此这是一针见血的见解但即使如此事情似乎还远远没有被弄清楚我们仍然每天不得不生活在迷雾般的庞然大物体内视若无睹这就是为什么空气这个隐喻很合适而且我们真的有把握说AI永远无法达到人的程度我们是应该在技术不断逼近人性界限时捍卫人之本真还是让技术成为我们崭新的四肢和大脑与之一同迈向人类下一段进化历程这些问题我目前还不得而知影片的最后Adam伴着AI生成的广告歌曲弹了一段贝斯即兴那是他的回应我几乎可以想象到那是一种什么心情