首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

智象多模态生成大模型3.0发布 离幻觉更远与离落地更近

2024-12-31 15:42 · 稿源: 站长之家用户

12 月 28 日,智象未来科技有限公司在安徽人工智能产业先导区启动仪式中,正式发布智象多模态生成大模型3. 0 版。

启动仪式上,智象未来创始人兼首席执行官梅涛总结了 2024 年人工领域技术发展的五个标志性事件,分别是以Sora为代表的视觉生成物理世界模拟器、以Chat GPT 4o为代表的多模态模型、以GPT-o1 为代表的从预训练到后训练推理优化、多模态大模型赋能具身智能实现软硬件结合,以及人工智能学者荣获诺贝尔化学奖表明AI赋能科研范式变革。可以说,过去一年中,AI技术的未来发展路径和应用实践的方向正愈发清晰。

梅涛认为,多模态大模型是通往AGI的必经之路,其能够比单一模态模型更好地模拟物理世界。而多模态大模型的技术演进是线性的,但是在不同的技术路线中又可以实现跳跃式发展。基于以上判断,本次智象未来发布的智象多模态生成大模型3. 0 带来了图像和视频生成能力的全面升级,具体包含了画面质量与相关性提升、镜头运动和画面运动更可控以及多场景驱动的优化。

同时,智象未来还推出了智象多模态理解大模型1. 0 版,理解大模型1. 0 版通过对物体级别的画面建模以及事件级别的时空建模,实现了更精细、准确的图像与视频内容理解。这一理解大模型也进一步服务于理解增强的多模态生成技术,搭配多模态生成大模型实现多模态检索+多模态内容编辑与生成的二创平台系统,进一步降低用户的使用门槛并且大幅提升基于IP的多模态内容生成效果。

在模型升级的基础上,智象未来旗下多款产品也有了新的体验提升。例如,智象创作工具平台秉持“能打字,就能做视频”的理念,基于智象多模态生成大模型呈现了全新的模型交互体验。在新版本中,平台实现了与用户的自然语言交互,在原有文生视频的基础上,增加了对视频局部进行语音指令输入的调整。还可以基于用户上传的视频内容,整理成相关的模型输出指令。这一功能将极大的降低创意工作者使用AIGC工具编辑视频的学习门槛,从而提升视频创作的工作效率。

目前,智象未来拥有国内最全的多模态版权语料,包含数十万小时版权视频素材和上万个授权IP,涵盖国内70%影视数据,已形成上亿条AIGC二次创作素材,在影视、文旅、通信、营销、教育等多场景得到广泛应用,已累计服务全球一百多个国家和地区的一千多万用户和四万多家企业客户。

本次活动现场,智象未来与人民网、上海电影集团、彩讯科技、捷成华视网聚、安徽联通、中国移动咪咕音乐等 12 家生态伙伴企业代表签约,共同打造集技术研发、产业化应用、市场推广于一体的生态体系。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:Kimi发布多模态图片理解模型API;周鸿祎参演AI短剧开拍;MiniMax-01系列模型开源;星火同传语音大模型发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、月之暗面Kimi多模态图片理解模型API发布2025年1月15日,北京月之暗面科技有限公司正式发布了全新多模态图片理解模型moonshot-v1-vision-preview,该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力,旨在帮助Kimi更好地理解世界。通过模块化设计,MiniCPM-o2.6集成了多种强大组件,支持实时处理和多语言功能。

  • 多模态交互+健康新突破,歌尔发布新一代智能指环参考设计

    传感器技术、大数据、云计算、物联网以及人工智能技术的蓬勃发展,为智能穿戴设备集成更多健康监测功能提供技术支持。智能指环作为新型可穿戴终端,可将最新技术与生活方式结合,凭借其便携和实时性在健康监测、交互领域展现出独特优势。歌尔自2013年进入智能穿戴领域,可根据客户需求提供不同产品形态的智能穿戴整体技术制造方案,未来,歌尔将继续推动技术革新,不断探索智能穿戴设备的新可能,助力用户实现便捷、智能、健康的生活方式。

  • 多模态卷王阶跃震撼6连发,春节档最强AI家族来袭!

    【新智元导读】开年放大招!阶跃星辰重磅升级Step系基座模型全家桶,一口气连更上新6款模型。作为业内公认的「多模态卷王」,这家AI明星公司目前已拥有业内最全模型矩阵。在通过AGI的征程上,只有那些能够持续积累的玩家,才有可能走到最后。

  • AI日报:赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、国产大模型再突破!DeepSeekR1开源,性能直逼OpenAI,开启AI平权新时代DeepSeek最近发布并开源了其最新研发的大型语言模型R1,标志着国产AI技术的一次重大突破。预计2024年第四季度出货量同比增长3.7%,企业IT系统升级需求增加,AI笔记本电脑将改变用户体验,推动市场发展。

  • 大模型落地战,挺进大消费

    便利店市场在中国以及全球范围内迅速崛起,成为消费领域的重要增长点。据中国连锁经营协会联合毕马威发布的《2024年中国便利店发展报告》显示,中国便利店2023年全年销售额达到4248亿元,同比增速达10.8%。拉近企业与上下游及终端消费者距离,构建产业生态,精准洞察消费需求,驱动行业数字化转型。

  • 中科金财多模态应用拓展新领域,AI大剧1月24日起快手独播

    北京中科金财科技股份有限公司与北京快手科技有限公司、北京北斗映画传媒有限公司、南京造火文化传媒有限公司联合出品的微短剧《浮梦吟》,将于2025年1月24日起在快手平台全网独播。这是快手首部将实景拍摄与AIGC制作结合的精品古风微短剧,在奇幻叙事中融入现实意义主题,借助AI技术呈现东方美学,打造现象级精品之作。中科金财将继续深化AI技术在多模态领域的研究与应用,定期评测国内外领先的多模态大模型,向客户提供优质AIGC技术服务,搭建全球多模态创作与应用生态,降低创作门槛,为行业带来更多优质内容供给,并继续拓展多模态应用服务领域,低成本解决长尾企业宣传片生产、投放视频制作等需求,利用AI技术创造业务价值,推动产业的智能化升级。

  • AI日报:1秒出图!英伟达开源文生图模型Sana;阿里妈妈推淘宝星辰视频生成大模型;OpenAI发布经济蓝图

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震撼登场!英伟达开源图像生成模型Sana,1秒生图、支持中英文和emoji英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛

  • AI医疗新纪元:复旦王烁研究员引领多模态医学人工智能技术革新

    在人工智能与医疗健康深度融合的今天,AI技术正以前所未有的速度推动着医疗行业的革新与进步。AI医疗不仅提高了医疗服务的精准性和效率,更为患者带来了更加便捷、高效的诊疗体验。松果基金将继续发挥其独特作用,为青年学者提供更多元化的支持和帮助,助力他们在AI领域取得更大的科研成果。

  • 三星Galaxy S25系列多模态感知 树立人机交互新范式

    2025年1月23日,三星在AI手机领域再次迈出重要一步,推出了其最新一代旗舰手机——GalaxyS25系列。借助前沿的GalaxyAI技术、多模态AI助理,三星GalaxyS25系列可实现更加自然、直观、易用的人机交互体验,树立了移动交互新范式。随着AI技术的不断进步,我们有理由相信,未来的智能手机将更加智能与人性化三星GalaxyS25系列正是这一愿景下的先行者。

  • 搭载多模态AI助理 三星Galaxy S25系列重塑移动AI新格局

    正文不久前,市场研究机构CounterpointResearch发布了一份报告,预计到2028年,全球生成式AI智能手机的出货量将达到7.3亿台,其市场份额占比将攀升至54%,这一数字是2024年预期水平的三倍以上。到2028年,在售价超过250美元的智能手机中,预计每10部中就有9部将具备生成式AI功能。这一切成就,都是三星GalaxyS系列坚持长期主义创新理念、不懈追求技术突破与用户体验优化的璀璨结晶。