过去的十年,是以神经网络、深度学习为代表的新一代 AI 算法在计算机视觉、自然语言及语音等领域取得了革命性进展的十年;过去的十年,同样也是全球范围内移动互联网、多媒体互联网与各行各业深度融合,数字科技不断为社会发展带来惊喜的黄金十年。
在这十年里,音视频通信从网络社交深入日常办公、生产及生活场景;点播、直播产业在全球范围内崛起;对话机器人成为大众服务行业标配。数字产业的创新发展,为各行各业开拓了新的业务场景,也为现代企业带来了新的发展机遇。
新机遇、新场景对多媒体通讯、数字营销及网络安全等传统数字技术提出了新的技术要求,带来了新的挑战,而 AI 技术的融合应用在其中扮演着尤为关键的角色。
新机遇、新场景下,随之而来的技术挑战
首次公开,网易智企的 AI 技术驾驭之道
针对以上问题,网易智企携手机器之心联合发布《数字经济时代,AI 加持下的技术与业务创新》人工智能技术应用实践白皮书。
报告以网易智企为研究对象,在透视现代数字科技企业如何在对技术架构的持续创新的基础上,通过高效、灵活的技术解决方案全面拥抱 AI 技术,实现内容风控、音视频及智能客服等技术的高效迭代,解锁新型实时通讯、点播直播与智能营销业态,尝试为现代企业在 AI 时代进行业务创新,开展企业数字化转型提供有效参考。
驾驭 AI 加持下的内容风控技术
疫情持续的大环境下,视频通话、视频会议、在线教育等功能成为了人们工作生活中的刚性需求。丰富、广泛的市场需求,带动了音视频技术的超高速发展。
与此同时,更加多元化和复杂化的应用场景也对音视频技术提出了更高的要求。 网易云信对音视频的底层算法技术及端侧应用作出多维度优化,重点研究 RTC 产品相关的音频处理技术,例如回声消除、降噪、自动增益控制等通话中长期应用的算法。同时关注空间音效、基于统计机器学习和深度学习的 AI 降噪、场景检测、啸叫检测等最新技术方向。 AI 加持下的音频技术:
通过将 AI 与 DSP 算法结合、提高 AI 算法在复杂场景的泛化能力、降低端侧落地开销、提高稳定性及研发实时音视频环境中的 AI 算法,解决音频AI算法在真实场景中的落地困难问题。 AI 加持下的视频技术:
通过构建轻量级网络、深度优化视频处理模型与推理设备,持续改进计算机视觉网络设计和训练方法,实现视频处理算法在兼顾计算实时性及低功耗的前提下,对视频进行像素级处理。
AI 系统是一个相对比较宽泛和完备的概念,涵盖了一个 AI 任务落地应用的各个环节。将其概念拆解,则包括数据、模型、算法、解决方案、部署与加速等五个部分。五个方面任一存在短板,都可能成为制约 AI 系统总体性能的瓶颈。把握系统性研发的难点在于,需要同时立足于这五个环节。而在此之上,还需进一步结合业务场景的某个具体问题和特点,进行具有针对性的设计、创新和落地实施。
报告的第三章对数据、模型、解决方案、算法及部署这五个方面逐一展开,以网易智企 AI 技术团队所采用的架构为线索,总结当前 AI 系统架构的创新发展与实践方法论。 为企业插上 AI 技术的翅膀
互联网普及率的上升正在推动音视频市场急速增长,渗透率持续上升;5G 技术的突破促使高质量的音视频对话、内容输出、多媒体实时交互成为可能。在此趋势下,借助音视频技术所构建的新业态与暴增的多媒体内容进而引发了用户、政府及行业对内容安全的关注。
不断萌发的需求带来了企业业务模式创新的空间。本章节通过研究网易易盾、网易云信和网易云商的落地案例,详细解读其技术团队如何在充分深入理解业务场景的特点、难点和问题的基础上,系统性地进行探索和优化,完成 AI 技术的落地。
报告的第四章通过研究网易易盾、网易云信和网易云商与汽车之家、网易云音乐及松果出行的三个真实技术合作案例,聚焦企业如何通过采用高效、专业的 AI 解决方案抓住市场机遇,实现业务创新与发展突破,探索人工智能如何帮助企业在内容风控、音视频通信及营销客服场景实现突破与创新。
伴随 AI 算法的发展与突破,越来越多的企业开始熟悉各类 AI 能力,并逐步解锁了更多的难点场景。与此同时,人们对信息安全,隐私保护的重视程度也在逐步加深,可信 AI 成为了学界、产业界乃至政府部门的重点关注领域。
此外,在人工智能发展过程中,长期存在的数据问题也在近期愈发得到重视。吴恩达教授于 2021 年发表的论调中指出,太多人工智能研究工作聚焦于模型,而忽略了数据,但稍作优化的数据往往能对模型或算法的性能带来更明显的提升。另一方面,优质的数据同样能够为企业在 AI 模型训练、应用开发等工作中带来极大增益。由此,Data Centric AI 也成为了学界与产业界的关注重点。
报告的第五章将从可信 AI 与 Data Centric AI 两方面探讨当前人工智能技术的变革趋势,洞察业界在该方面的最新工作。 展望 AI 技术前沿
过去的十年,是以神经网络、深度学习为代表的新一代 AI 算法在计算机视觉、自然语言及语音等领域取得了革命性进展的十年。在这十年里,数字产业的创新发展,为各行各业开拓了新的业务场景,也为现代企业带来了新的发展机遇。人工智能技术的发展脚步将持续迈进,技术的突破与创新将继续层见迭出。
报告的最后一个章节将从多模态、无监督与超大规模和工程自动化三方面汇总学界、业界对 AI 技术前沿的观察。
点击「下方链接」免费获取报告,进一步探索 AI 在内容风控、音视频通信及自然语言对话领域的应用实践。