新壹科技:大模型中场比拼的是落地实践
发布时间:2024-07-23 10:07
在2024世界人工智能大会(WAIC 2024)开幕首日,作为视频人工智能赛道的先行者,新壹科技正式发布了新壹视频大模型2.0版本,并展示了基于新壹视频大模型的系列产品及应用场景解决方案。
秉承“释放AIGC视频生产力”的理念,新壹科技聚焦视频人工智能的研发与应用,以新壹视频大模型为核心,推出了AI原生应用平台「一帧秒创」、AI数字人平台「新壹数字人」等AI系列产品及服务。
“我们相信,通过AI技术的赋能,劳动者们将能够更好地应对复杂多变的工作挑战,提高工作的质量和效率。同时,AI技术也将为劳动者带来更多的便利和舒适,减轻他们的工作负担,让他们有更多的时间和精力去关注自身的发展和成长。”新壹科技董事长韩坤说。
视频大模型爆发,新壹科技实现国内首发
2024年2月,Open AI推出的Sora惊艳世人。Sora不仅以其卓越的性能和广泛的适用性引起了业界的广泛关注,更以“世界模拟器”的理念推动了视频大模型的发展新方向。
在构建视频生成模型时,四大核心要素不容忽视:模型设计、数据保障、计算效率以及模型能力的扩展。一时之间,各大科技公司纷纷投入到视频大模型的研究与开发中。人们至今津津乐道Pika在海外的瞩目发布,Stable Diffusion的强劲势头,再到快手推出的可灵AI,以及极佳科技与清华大学自动化系联手打造的视界一粟YiSu等创新成果。
机会总是留给有准备的人,韩坤在中国网络视频行业拥有20年视频行业的经验、技术和数据,同时积累了行业资源、明星资源、推广平台资源等,这是过往沉淀下来的财富。
早年间,他曾推动PC视频网站酷6曲线上市,此后一手打造的秒拍App是中国第一个月活用户过亿的短视频应用,还有形成全民模仿风潮的小咖秀,在移动互联网时代推出了一直播,然后带领新壹科技团队正式回归视频赛道,并且从2020年开始,将研发重心转向视频AIGC(人工智能生成内容)领域。
2024年1月,新壹科技推出的国内首款聚焦视频领域生成式人工智能(大语言模型)新壹视频大模型,通过了《生成式人工智能服务管理暂行办法》备案,成为国内首个通过备案的视频人工智能大模型。
在WAIC 2024期间,新发布的新壹视频大模型2.0版在多模态AIGC技术的核心领域取得了显著突破,提升了视频的生成质量、生成速度、可控性等方面,为影视制作、游戏开发等领域提供了更加高效、便捷的工具。
北京通州融媒体中心、新壹科技联合打造的首部AIGC MV
曾经,传媒领域的劳动者们戏称自己是“民工”,因为视频素材动辄几个小时,还要为了版面想创意、做剪辑、搞分发,每一项任务都需要长时间紧盯屏幕,耗费了大量的时间和精力。但并非每一次都能收获百万加的视频爆款,更有可能为了适配不同平台的内容剪辑累到虚脱。现在,视频领域的劳动者终于有机会脱离“民工”身份,更贴近创作者。
北京日报、新壹科技联合打造的劳动节AI视频
无论是文字、图片还是语音,视频创作者需要的是能精准捕捉并理解用户的意图,为生成高质量视频内容奠定坚实基础的工具。多模态感知能力的增强,使得模型能够更自然地与用户互动,更准确地满足用户需求,也更进一步夯实了新壹科技在视频AI领域的领先地位,为视频人工智能在处理、分析、应用层面带来了更多可能性。
大模型的中场战事,比拼方案的落地实施
大模型领域从不缺乏噱头,AI新六小龙(百川智能、智谱AI、阶跃星辰、Minimax、零一万物、月之暗面)的融资、推出新的模型甚至进行专业跑分榜的比拼都能获得业内的关注。相较于这些热闹,那些专注于落地应用、成本控制和优质服务的企业显得更为稳健和务实。
250万用户,每天生成12万分钟视频,目前新壹科技已在文旅、金融保险、媒体、营销、出版、政务、教育、汽车、医疗等众多场景打造了落地方案。
以电商领域为例,在WAIC上首次亮相的新壹直播数字人充满活力。数字人主播没有时长及精力上限,还可以高度模拟真实世界复杂场景中的人物动作效果更加生动、自然。
没有一位主播能够在直播间里能7*24小时不间断地进行流量变现,但数字人主播可以。这也是为何对价格敏感度高的中小商家开始对数字人主播产生浓厚兴趣,因为主播直播的时长和ROI要求只有凭借先进的技术手段才能实现最高的性价比。
“从长远来看,数字人带货可以有效帮助到店铺闲时时段的直播销售,并且不需要额外配备人员,是一种行之有效的直播带货补充手段。”有商家表示已经从深夜中的数字直播成功带动转化,因为自己“在别人休息的时候还在工作”。
5分钟表情和动作拍摄+30分钟声音录制+24小时训练,即可生成1:1复刻真人的数字人。从脚本生成、素材生产和匹配、智能剪辑配音到数字人播报,新壹视频大模型2.0让整个流程更加智能化,大大减轻了商家负担。模型还升级拓展了素材库和模板库,涵盖更多风格及行业领域,用户可便捷地挑选并融入定制化,轻松创作出具有鲜明个人特色或品牌调性的视频作品。
“我们的优势体现在对素材的拆分和解析,特别是对视频脚本逻辑的梳理。与一般公司提供对内容简单的处理混剪不同,我们的剪辑有明显的故事线和叙事逻辑,因此更能匹配使用场景。”当越来越多的大模型出现,新壹科技相关负责人表示,在市场上谁能发挥大模型最大的优势帮助客户提升人效比是比技术先进性更重要的指标。
技术热度提升人文温度,厚积薄发拓展应用宽度
新壹科技脱胎于一下科技,在视频行业浸淫打拼多年,深知在比拼名人故事的声量之外,踏实构建与客户紧密相连的商业模式才能走得更远。在客户面前展现出拥有丰富的视频资源积累、团队积累、运营经验的特色优势是新壹科技的当务之急。
有了好产品,才有真底气。新壹视频大模型2.0以其卓越的能力和广泛的应用,正在引领AI视频制作的新纪元。
在短视频创作能力和真实场景与人物动作模拟方面,新壹视频大模型2.0也取得了新的突破,通过自动调整视频节奏、镜头切换等细节,使生成视频效果更加可控。它能够生成更高质量、更长时长的视频内容,满足用户在短视频创作和分享方面的更多需求。同时,它还能逼真地模拟出各种场景和人物动作,使得生成的视频作品更加生动自然。
这些都得益于新壹视频大模型2.0实时学习与自迭代功能的升级和交叉推理能力的进一步拓展。它能够从用户反馈和大规模数据中不断学习新知识,自动调整和优化自身性能,以不断提升视频生成的效率和精度。这种自我完善的能力,使得模型能够紧跟时代的步伐,支持在更广泛的场景下生成符合要求的视频内容。
正如新壹科技所展示的,技术的力量应当用来辅助而非取代创作者的智慧和灵感,通过优化生产流程,让视频内容的创作者们能够更专注于创作本身,释放他们的想象力和创造力,创作出更多具有深刻内涵和独特魅力的作品。在AI视频制作新纪元中,劳动者的创意和思维永远是无可替代的宝贵财富,它们值得尊重和保护。