以协助使用者的角度出发,提供适合的选择。
生成式 AI 对话服务让一般消费者直接体验到科技的进步,但面向开发者端的时候,到底要如何选择自己最合用的 AI 服务?要有多少的前期投资才可以满足要求呢?跟微软、Google 的方向不一样,Amazon 旗下 AWS 希望透过提供 Bedrock、SageMaker 等服务来便利开发者,预先提供需要的硬体、软体、API 等方案,让开发者只需要专注到 app 本身的编写就可以。
小编获邀与 AWS 香港的代表,以及他们其中一个使用 AWS SageMaker 服务的开发商 KKLab 进行访谈,了解一下今天开发生成式 AI 时会遇到的问题,还有会用到的解决方案。这或许能够为正在烦恼如何起动专案的你,带来一点想法。
先来的就是一首饶舌作品《Machine Mind》,歌词、编曲都由不同的 AI 模型生成,再由人类创作者整合出版,其中的“Lyricist.ai 灵魂写手”更获著名词人林夕协助开发,不管是用字、押韵方面都有著一定水准。
KKLab 在 AI 和机器学习方面早早就有投入,天富登录累积了 10 年以上的技术经验。在抢先测试使用 AWS 的 LLM 大语言模型、EC2 执行个体和 SageMaker 服务后,发现“灵魂写手”的模型训练时间由过往的数小时,大大加速至仅需要数分钟就能完成。
灵魂写手
KKLab
以《Machine Mind》的创作过程为例,是先由人类创作者提供灵感片语和讯息内容作参考,进入不同 AI 服务裡就会各自生成歌词和韵脚,接著就能开始生成旋律和精修韵脚,此时歌曲雏型就开始出来。再来就有编曲、demo 等的步骤,当然也会有反覆的修改,但因为都由 AI 重覆生成,所以沟通、理解的需时就大大减少了。
对于音乐创作人来说,这样的工具到底会否对他们的生计带来压力呢?KKLab 认为不会,反而是能透过让创作人专注更创作、提高整个业界的效率。回到“灵魂写手”服务,他们的开发方向会是“填词人的助手”,提供符合使用者提供的灵感和要求而生成的“选择”,要使用哪个、如何使用都是以人类使用者自己的口味、感受、经验,“灵魂写手”只是简化了中间需要花时间苦苦思考的过程。
Amazon Web Service KKLab interview
Eric Chan / Engadget
特别是音乐作品、文艺创作,天富平台网站这些内容毕竟还是需要人类的创作做为起始、选用、润饰,才会有所谓的个人风格、作品温度的感性部分。
Amazon Web Service KKLab interview
Eric Chan / Engadget
同样的道理,Amazon Web Services 所做的也是一样,要为开发者提供本来可能需要千万资金才能组建起来的基建环境,以各种不同层级的服务来满足今天开发者在 AI 产品的编程。打比方说 AI 开发案首要有基础模型(Foundation Models),这需要大量人力物力来开发的元素,就可以藉由 Amazon Bedrock 去挑选现成的语言模型、影像模型和媒体模型的 API(Titan Text、Titan Embeddings、Jurassic-2、Claude、Stable Diffusion)来直接开始操作。如果是需要运算力,Amazon EC2 服务也能代劳,不用自行组建伺服器。
看到大家跟生成式对话机器人玩得不亦乐乎,证明了 AI 已经不再是遥不可及的超高科技,而是愈来愈贴近消费者端的产品,不妨也善用业界提供的各种服务来打造自己的吧。