网站首页 > 科技前沿> 文章内容

核桃学术丨传媒领域时代前沿新技术

※发布时间:2024-6-23 13:41:21   ※发布作者:佚名   ※出自何处: 

  2021年10月,发布的《电视和网络视听 “十四五”发展规划》中提出,推动 4K/8K试验频道及云转播平台建设。在今年的冬奥会转播中,首次全面提供

  基于最新的5G通信技术和智能云网技术的应用,冬奥会的转播中部分采用了云转播技术,传统的现场转播被分为前端信号采集、云端传输处理与远程导播制作三部分,实现了转播设备云端化、转播人员远程化。云转播使得赛事直播中可以加入更多特殊效果,并通过更加灵活的信号采集、更加轻量级的远程导播内容制作,实现了兼具专业、便捷和低成本等特质,以及更多编辑可能性的转播服务平台。

  2022年即将过去,想必不少同学都还记得在今年引起过巨大流量和争议的AI绘画技术,有些同学或许已经开始利用这项技术进行生产和娱乐。AI绘画属于AIGC(AI-generated content)领域,即人工智能创作内容。作为一种新兴的内容生产方式,AIGC展现了媒体内容生产方面的巨大潜力。

  在图像生成的应用方面,此前已有诸多模型,例如OpenAI于去年三月开源发布的基于文本创作图像的DALL·E模型,以及将图像与文本进行匹配的CLIP模型。但过去一年内的一个重要转折最终导致了AI绘画的迅速演进:Diffusion模型与CLIP模型的结合。Diffusion模型,即生成扩散模型,在图像合成领域的性能验证中击败了生成对抗神经网络GAN模型,展现出广阔的应用前景。去年底,CLIP与Diffusion结合的技术门槛被解决,衍生出DALL·E 2.0、Stable Diffusion和Midjourney等性能优越的模型。新模型不仅支持直接从文字生成图像,且具备了成熟的商业落地能力,最终在今年下半年全世界范围内的讨论。

  如果有同学关注近期的科技新闻,或许会注意到另一项新的人工智能应用:ChatGPT,一个能够流畅生成文字对答的智能模型。ChatGPT也属于AIGC技术,在文本生成方面实现了重大进展。

  ChatGPT虽然尚未成熟,但已经成为一项极为优秀的自然语言处理模型,甚至可以进行编程纠错。OpenAI团队在经典的预训练语言模型GPT的基础上,引入了基于人类反馈的强化学习方法RLHF,并使用海量数据进行训练,最终完成了极高质量的对答内容生成模型。

  2001年,受互联网泡沫破裂影响,为提高新闻生产速度和数量,英国PA new media公司推出虚拟主播阿娜诺娃(Ananova),随后中韩日美各自推出Go Girl、Lusia、寺井有纪和Vivian等虚拟主播,形象从简单的2D头像逐渐扩充为3D形象,从仅有人物形象到配备演播室完成播报。然而,由于技术,第一批虚拟主播的形象和声音都不够自然,成本也居高不下,因此在几年后就逐渐淡出传媒行业。

  2021年10月20日,发布的《电视和网络视听“十四五”科技发展规划》中的“加快推进制播体系技术升级”部分指出:推动虚拟主播、动画手语广泛应用于新闻播报、 天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平。

  伴随这一浪潮,虚拟人合成技术获得了突飞猛进的发展。2020提出的神经辐射场NeRF方法有效完成了静态场景表示任务,2022年的改进研究Point-NeRF进一步加速和优化了场景表示过程。目前,NeRF和衍生模型已被广泛应用于虚拟人合成领域,实现多角度合成视觉图像。

  此外,前文提到的生成对抗神经网络GAN技术也成为了虚拟人合成领域的重要工具。GAN网络通过生成器和博弈器网络的持续博弈优化建模,适合解决脸部重建过程中的纹理提取任务,帮助完脸建模。2020年提出的styleGAN2针对光照条件进行了优化,并实现了高分辨率的人脸生成。此外,GAN也常被用于模拟不同拓扑的服装模型,从而实现虚拟人的着装建模。

  [1] 韩强.科技冬奥与转播创新——兼论冬奥会对体育赛事转播的未来影响[J].中国电视学刊,2022,(04):18-23.

  

关键词:前沿媒体技术
相关阅读
  • 没有资料