综合新闻
马栏山音视频实验室突破多项“卡脖子”技术,AI秒译20种语言  微短剧出海加速
发布时间:2025-07-18 编辑:湖南政协新闻网
分享

让长沙更有研值-栏花1-750-420.jpg


一段5分钟的中文微短剧,前后出场6个角色,对话紧凑,语调、情绪不一。将之导入AI译制软件,仅需30分钟,就能生成英语配音和字幕,台词准确,角色语调、情感、音色等各不相同,与原本的中文台词对话一致。


今年3月,长沙马栏山音视频实验室研发的一项AI译制技术投向市场。该技术能让一部上百分钟的中文微短剧在几小时内,生成带情绪、情感的外国语言版本。


该技术刚一上线,马栏山视频文创产业园内的一家微短剧出海企业就来到实验室,双方签下数百万元的合作订单。


AI译制助力短剧出海


社会科学文献出版社与暨南大学联合发布的《中国数字文化出海发展报告(2024—2025)》显示,中国微短剧出海市场呈爆发式增长。2024年上半年,中国短剧在海外市场总收入已超过2.3亿美元。


“微短剧出海,翻译是一大阻碍。”马栏山音视频实验室主任涂永峰介绍,传统人工译制方式流程复杂、速度较慢,加上高水平翻译人才数量不足,被精心译制的出海影视作品只占少数。一些机器翻译因缺乏语调变化和情感表达,极大地影响了出海译制作品的观看体验。


在马栏山视频文创产业园,每年走出国门的文化影视作品数以百计,一些微短剧团队甚至一个星期就能上线一部新剧。传统的译制方式,难以满足不断增长的出口需求。


为此,马栏山音视频实验室围绕智能翻译开展研发攻关,集成大语言模型、声音克隆、人声分离、字幕识别、语音合成、字幕擦除等先进技术,运用人工智能(AI)算法,在翻译台词的同时,模仿剧中角色说话的音色、音调、情感等,将汉语直接输出成外语。


AI译制技术使用的语言大模型通过反复学习、训练,会结合上下文作出精确翻译。如视频中出现的“俞家”被翻译为“Yu Family”,如果使用翻译软件则会受同音词“瑜伽”影响,将之翻译成“Yoga”。


该AI译制技术支持英语、法语、阿拉伯语等20种语种,可满足全球绝大部分国家的微短剧进口需求。记者了解到,目前国内多家电影、电视剧、专题片制作公司向实验室寻求合作。


湖南政协新闻网


多项“黑科技”引关注


由湖南省政府、长沙市政府及相关省直部门联合共建的马栏山音视频实验室,位于马栏山视频文创产业园,于2024年7月投入运营,聚焦音频与声学、图形图像、音视频编解码等关键技术展开攻关,研发出多项“黑科技”。


在实验室,记者看到一款仅有U盘大小的电视机顶盒,将其插上电视机后,能迅速让画面实现4K级别的画质,该产品已投向家庭影音市场。


配套家庭影音的菁彩声无线音箱系统,依托Audio Vivid(菁彩声)技术,可将普通立体声音源智能扩展为多声道空间音频。譬如观看足球赛电视直播,能让观众清晰地听到运动员的对抗声、触球声、观众呐喊声、现场鼓噪声等各种声音,带来更加真实、沉浸式的体验。该影音系统也被研发拓展至汽车上。据介绍,车载空间音频解决方案已突破国外技术封锁。


菁彩影像转换工具致力于修复老旧影片和低像素设备拍摄的影音素材。不论是上世纪二三十年代拍摄的黑白电影,还是八九十年代磁带摄像机拍摄的低像素彩色视频素材,都能通过数字技术修复至4K超高清画质。AIGC智能活现技术可以让历史文物实现场景动态重建,生成电影级画质影视作品,让文物“活”起来。


实验室自主研发的AI双目直播相机,仅需一个主播就能在任一场景搭建起直播间,主播可通过手势控制镜头推近、拉远、摇移,拍出景深效果,还能实现绿幕抠图,实时推送4K超高清画质。


今年5月,第二十一届中国国际文化产业博览交易会在深圳举办,马栏山音视频实验室作为湖南的参展代表之一,向110多个国家和地区观众展示了上述科研成果,引发广泛关注。


“西方发明了电影、电视、留声机,从解编码技术到视听呈现技术,音视频领域标准的制定过去一直由国外主导。”涂永峰说,实验室始终聚焦音视频领域“卡脖子”技术攻关,不仅要研发新技术、新产品,还要参与制定音视频行业的国际标准,努力实现音视频产业链上的国产化替代。


“音视频行业涉及采、编、播、传、显五个环节,任何一个环节的技术不匹配,效果都无法落地实现。”涂永峰表示,未来实验室将大力推进人工智能在音视频领域的应用,开发音视频领域创新产品。


培育新的万亿产业


近年来,马栏山视频文创产业园集聚了近5万名专业人才和5家上市公司,吸引了华为、爱奇艺、凌云光等一大批头部企业入驻,企业总数超3000家。据统计,2024年,该文创产业园内的企业营收突破2700亿元。


“音视频全产业链犹如一棵巨树,是文化和科技融合的典型业态。”省政协常委、省社会科学院(省人民政府发展研究中心)院长(主任)钟君认为,湖南应抢占全国乃至全球音视频产业研发、展示、制造、交易制高点,让马栏山成为文化和科技融合的重要技术策源地、成果诞生地、应用场景集聚地,培育湖南新的万亿产业。


在今年初的省政协全会上,钟君提交提案建议加快布局建设湖南算力平台,打造可管可控的国有数智超级平台,培育音视频全产业生态。


钟君的呼吁,正是马栏山音视频实验室的期盼。记者了解到,当前音视频技术关键环节仍受制于人。以视频渲染引擎、音视频编解码工具为例,核心软件主要依赖进口;高性能摄像机、虚拟现实设备国产化率并不高;已经落地的AI译制技术,底层算法模块仍基于国外开源框架。


省政协委员、万兴科技董事长吴太兵认为,湖南的关键技术自主创新能力有待提升,算法基础也比较薄弱。如万兴“天幕”大模型的单次训练需要2000P的算力资源,而目前湖南仅国家超算长沙中心能提供稳定的算力支持。


为此,吴太兵提交《以音视频大模型为抓手,助推湖南文化科技融合发展》的提案,建议加大政策支持力度,吸引更多头部企业、领军企业落地长沙;促进大校、大院、大企融合创新,突破大模型企业发展所需的资金、技术、数据、算力和人才制约瓶颈;探索建立“音视频智算中心”,提供普惠算力服务。


在吴太兵看来,湖南推进文化与科技融合发展还亟需引进高层次人才与团队。


“懂科技的不熟悉文化,懂文化的不擅长科技。”钟君也有着同样的思考,认为湖南的人才供给滞后于发展需求。


记者了解到,省委宣传部、省科技厅、省工信厅、省人社厅、省教育厅等部门积极采纳提案建议,从省级层面进行专题部署,将“超高清视频算法”“马栏山智能化融媒体关键技术开发与应用示范”等攻关项目,突破视频高性能计算、渲染加速等一批关键核心技术纳入了全省“十大技术攻关项目”和重点研发计划中。


在人才引育方面,相关部门大力实施“芙蓉人才”计划,创新高校学科设置,广邀全球青年创客、“内容+科技”复合型人才、文化科技领域紧缺人才来湖南创新创业。


目前,有关部门正积极支持国家超级计算长沙中心、高性能计算国家重点实验室等高能级创新平台,加强文化科技领域应用布局;加快建设湖南文化装备创新中心、文化大数据中心、音视频算料交易平台等公共服务平台,推动文化科技和文化产业深度融合。


文 | 政协融媒记者 许望桥  李丽娅

请使用微信扫一扫
请使用微信扫一扫
请使用微信扫一扫