牢记嘱托感恩奋进——安徽往前赶 “听文见画” 智象未来定义多模态AI

两年服务全球两千万用户

“听文见画”智象未来定义多模态AI

10月14日，记者跟随“牢记嘱托感恩奋进——安徽往前赶”集中采访团走进位于合肥科大硅谷片区的智象未来科技有限公司。该公司成立于2023年3月，是国内成立最早的多模态生成式人工智能初创公司，已累计服务了全球一百多个国家和地区的两千多万个人用户和四万多家企业客户，展现出卓越的技术实力与商业化进展。

在企业展示中心，多段由AI实时生成的视频画面引人注目。无论是办公会议场景中人物的自然手势，还是产品宣传片中流畅的镜头转场，均呈现出影视级别的视觉效果与4K高清画质，体现了其自主研发的“智象多模态大模型”在视觉内容生成方面的领先能力。

“未来创作者只需将创意转化为文字描述，甚至于输入一段音频，AI都能实时生成适当的视觉内容。”智象未来品牌传播负责人翟玥翀表示，“听文见画”已从科幻走向现实。

据了解，“智象多模态大模型”是国内首批通过模型和算法双备案的多模态大模型。该模型拥有行业最丰富的多模态版权语料库，覆盖超10亿组图文、视频素材，既规避了生成内容的版权风险，又让AI对视觉内容的理解与生成能力更精准。作为首批完成模型和算法双备案的多模态大模型，其还实现多项全球技术首创：率先推出纯自回归图像编辑模型，可完成像素级精准修图；攻克15秒多镜头视频生成技术，支持从文字脚本直接生成影视级短视频；商用DiT模型更降低了中小微企业使用高阶AI生成技术的门槛。

作为全球领先的多模态生成式AI企业，智象未来的技术实力近期再获国际认可。今年4月，智象未来迎来了公司的高光时刻，其自主研发的开源图像生成模型HiDream-I1，在全球生成式AI权威测评榜单Artificial Analysis中，仅用24小时便以1145分的ELO评分登顶全球第一，不仅领先OpenAI的GPT-4o等国际主流模型，更在图像质量、语义理解、艺术表现三大核心维度同步刷新行业纪录，成为首个跻身生成式AI全球第一梯队的中国自研模型。

除了技术领域的突破，智象未来也致力于从尖端技术走向大众消费市场。在智象未来公司里摆放着一台融合了公司核心AI技术的智能自拍设备。“大家只要选择好自己喜欢的服饰和场景，面对镜头，就可以自动生成AI照片，还可以打印带走。”翟玥翀介绍说，“我们的人物照片都很可爱啊。

目前，智象未来已形成“1+4+N”的商业化布局，即通过一个核心引擎“智象多模态大模型”，驱动“个人创作者平台及社区”“商业视频营销服务”“新媒体创作智能体”“多模态工业数字化平台”四大产品的商业化发展，覆盖影视、文旅、教育、营销等多个应用场景。

其中，个人创作平台“vivago.ai/智小象AI”月活跃用户数已突破400万，累计生成AIGC内容超3000万次；与中国移动联合推出的“AI视频彩铃”实现“一语成片”功能；商业视频工具PixMaker则帮助品牌客户实现获客成本下降12.7%、投放流量提升18.2%的成效……

智象未来创始人兼首席执行官梅涛说：“我们正积极推动AI技术的产品化，目前已推出一系列AI智能硬件，并在线下门店与线上渠道同步推广。”

“我们与安徽就是一场精准的双向奔赴。在合肥的人工智能布局中，需要一家企业能与科大讯飞形成战略互补，共同构成产业‘双子星’。而智象未来深耕的多模态领域，恰好与科大讯飞形成有力互补，有效填补了合肥乃至全省在AI产业发展上的空缺之处。”谈及智象未来落户合肥的原因，梅涛介绍道。

此外，作为中国科学技术大学的一名毕业生，梅涛认为中科大提供的丰富人才储备，以及安徽各级政府对企业创新的全力扶持政策，共同构成了吸引智象未来扎根于此的沃土。“公司将充分利用本地的资源优势，将人工智能技术从安徽辐射至全世界，平等地惠及每一个人。通过AI生成的内容，让不同种族、不同文化背景的人们实现思想共鸣，从而推动更深层次、更广泛的文化交流。”

智象未来的快速发展，正是安徽在人工智能领域前瞻布局与产业生态日渐成熟的一个缩影。

目前，安徽省已陆续出台《打造通用人工智能产业创新和应用高地若干政策》《安徽省加快推动“人工智能+”行动方案》等多项政策，进一步优化人工智能产业发展环境，培育具有全球竞争力的科技型企业。