音频工匠沈俊聪:能制出让耳朵“怀孕”的声音

南方都市报 2019-07-16 06:16

沈俊聪(前排右三)和他的团队。

南都人物给你好看

小档案

沈俊聪生于1984年,广州人。

2010年,从华南理工大学硕士毕业。曾就职华为。

现为荔枝音频技术总监。

他能制出让耳朵“怀孕”的声音,也能让AI听音“识”人,还准备研发一款能玩的“声音”。而为了制造这些声音,他的耳朵都磨出了“老茧”、险些被震伤。

80后沈俊聪,音频研发工程师,书卷气中略带腼腆,典型的“技术男”一枚。

7月初的一个燠热午后,身着白T恤工衣,沈俊聪坐在一个小会议室里,语速很快地讲述了自己的故事。

这个行业变化太快了。即使现在做得很好了,也要永远看到风险。——沈俊聪

爱看“为什么”的少年

1984年,沈俊聪生于广州白云区一个普通的家庭。小时候,无意中在家附近的书店翻到《十万个为什么》,被里面的宇宙大爆炸、黑洞吸引,才发现原来世界这么精彩。

这套丛书自此成了他的“伙伴”,也是他的科学启蒙“老师”,那些未知的神秘世界,令他着迷。这段经历在小小少年心里埋下理工科的种子。

从中学到大学再到研究生,莘莘学子沈俊聪一路走来,始终没偏离理工科之路,并一直在通信领域孜孜矻矻。

玩跨界的音频工程师

2010年,沈俊聪从华南理工大学硕士毕业后,父母希望他选择体制内的工作,比较稳定。沈俊聪有些犹豫,觉得这不是自己真正喜欢的方向。学了这么多年的理工科,还是想在技术方面有所作为。在抉择中,他收到了华为的Offer。而彼时的华为,名气远不如现在,尚在苦苦探行中。

加入华为后,沈俊聪在手机音频技术方面一展所长。参与研发了多个音频项目,技术上获得了长足进步。

当沈俊聪沉浸手机音频技术之时,中国的移动互联网已发展得如火如荼。沈俊聪觉得这将为社会带来大变化,同样的技术,在移动互联网行业能触达到更多用户,也会带来更多价值。于是他萌生了转行的想法。

华为三年磨砺,沈俊聪的机会来了。2013年,被朋友形容为“小眼睛质朴男”的粤西男人赖奕龙,在几次创业不顺后,这个喜欢Radiohead的英伦摇滚风、大学辍学去电台当了一年DJ、还在1999年组织过一场摇滚音乐会的文艺中年,选择创办移动电台。于是便有了荔枝FM(2018年改名荔枝),一个以UGC(用户原创内容)模式为主的情感治愈系电台诞生了。在这颗热带水果下,聚集了一批志同道合者,多年后,成长为一家用户过两亿的互联网新经济企业。

初创的荔枝FM亟需一位音频工程师,好实现移动终端上的节目录制功能。关注到这个新业态的沈俊聪,一下子喜欢上这个行业,并欣欣然加入。

“感觉电台是一个美好的事物,尤其在深夜,很多受伤的心灵会从中得到抚慰。如果真能做到手机替代电脑,录制出节目,是一件很有意义的事情。”沈俊聪从技术角度考虑,觉得这个行业很有挑战性,“即使不成功,我也能积累到很多知识,不担心找不到下一份工作。”

音频部的唯一员工

荔枝初创时,为了实现“人人都是主播”的口号,迫切需要一款能在手机上录制音频节目的工具。但当时的手机硬件和软件均有不少缺陷,尤其是安卓手机,其中最大的问题是录出来的音质不好。为降低风险,公司决定先从ios入手。

跨界而来的沈俊聪,边钻研边尝试。2013年第一版录音刚上线时,为了体验自己做出的产品,他客串了一把主播,从中不断优化录音功能的各个技术细节。

比如淡入淡出功能,当用户点击麦克风录音后,背景音乐音量需要自动降低,当关闭麦克风后,背景音乐音量又需自动恢复,这个自动降低和恢复的过程必须很平滑,才不会让用户有突兀感。为了解决这个问题,他不断尝试,通过声音渐变处理函数,截取多个声波的上升和下降段来做比较,过渡时间在0.5秒到2秒之间不断切换,听了不下数百遍,终于选到了最佳方案。

混响、EQ和降噪模块对音质的影响很大,三个模块,每个都包含了很多参数,多个组合起来,就会产生大量的排列组合。为了得到满意的效果,沈俊聪抱着电脑戴着耳机,经常跑去安静的角落,不厌其烦地试听,修改参数,再试听,耳朵都起了“老茧”。有时候操作不小心,声音突然变大,耳朵险些被震伤。

沈俊聪回忆创业时称,当时还有一位同事做音频,但没过两个月就离开了。此后超过一年的时间里,整个音频部就他一名员工。沈俊聪一人撑起了一个部门。相比网友吐槽的“996”上班节奏,那时他经常在夜深人静的时候仍在敲代码。

再次上线的主播

2016年荔枝遇到发展瓶颈,沈俊聪称:“当时UGC产品不温不火,公司面临生存压力。有人提出尝试做声音直播,但这块一直是视频的天下,CEO赖奕龙顶住压力拍板研发‘声音直播’。”任务再次下达沈俊聪团队,他们花了两个月时间做出产品。直播上线后,效果出乎预料的好,公司决定全力发展直播。在运营团队的推动下,直播给公司带来不菲的收益,至今仍是核心产品之一。

直播上线那段时间,主播沈俊聪再次“上线”。为了验证新技术的效果,他专门开发了一个直播测试版,并邀请很多直播主播来收听吐槽。还进行了多场直播,根据收集到的意见,再带领音频团队不断优化打磨,最终做出了令人满意的效果。虽然整个过程繁琐枯燥,但为了能给用户提供最好的体验,沈俊聪觉得很值。

6年来,沈俊聪一直专注于音频技术的研发,并带领着荔枝音频技术从1.0迭代至4.0。从实时录制、声音还原和美化、剪辑,到高音质低延时、音质更好、玩法更多的音频AI技术。

来自行业的焦虑

已过而立的沈俊聪时感焦虑,这种情绪源于自己所处的行业,“这个行业变化太快了。即使现在做得很好了,也要永远看到风险。比如前两年ofo这么火,现在说不行就不行了。”

因对技术的热爱和对行业的焦虑,沈俊聪一直关注着前沿技术发展。2017年,当直播产品成熟后,他转而关注人工智能领域。“如果不拥抱这种新技术,以后会被淘汰的。”

2017年过了一半,虽然当时团队仅有4个人,但沈俊聪还是决定带领大家探索人工智能领域。经过一年多的积累,陆续开发了声鉴卡、语音转Rap等创新好玩的声音产品。比如声鉴卡,AI通过分析,可以“认”出你是萝莉音、御姐音还是大叔音。这让荔枝的音频技术顺利过渡到4.0时代。

平均年龄超过30岁、拥有9名员工的音频部,与当初相比算是“兵强马壮”。朱海霆入职比沈俊聪稍晚些,当年两人没少在一起加班,互知秉性。“他很聪明,爱思考,总能敏锐指出问题症结。也能知人善用,要求也高。”与沈俊聪搭档这么多年,朱海霆很快描述出自己眼里的“沈总”。

而稍晚两年进公司的魏敦晓则说,沈俊聪“能力强,点子多,能把我们做出的技术价值最大化。也比较随和,常给新人业务上的帮助。”

“码农”的生活也不总是那么枯燥。除了音频研发总监身份,沈俊聪还有一个标签——公司篮球协会会长。这个与公司一起成长的社团由他一手创建,至今仍是活跃度最高的社团。大家写完“码”,一起打场篮球,舒展一下身体,这也是沈俊聪跟团队的另一种相处方式。

《寿司之神》是荔枝新员工入职培训时必看的纪录片,这部由大卫·贾柏拍摄、关于全球最年长的米其林三星大厨小野二郎的纪录片,与赖奕龙所信奉的“乔布斯信条”殊途同归:人要找到一个自己真正热爱的工作,并持之以恒,就能发挥巨大潜能。“这也是人生的价值,一切源于热爱。”赖奕龙希望他的团队也有这样的价值观。

6年一晃而过,沈俊聪的爱好一直没变。他把儿时对抽象未知事物的喜爱变成了事业,在变化莫测的声音世界里乐此不疲地前行着。

出品:南都采编指挥中心

统筹:南都人物新闻工作室 采写:南都记者靳格 摄影:南都记者钟锐均

新闻推荐

口福行动启动至今,成功覆盖全城,打造3公里口腔医疗圈,为羊城市民谋口福,累计84255人报名口福行动、22628人喜获一口好牙拨一个电话领特惠种牙730元1颗,

口福行动报名现场为倡导世卫组织“8020”健康理念,2016年3月,口福行动正式启动,开展至今,全国138家口腔医疗机构加入联盟...

 
相关阅读

新闻推荐