首页 > 业界 > 关键词  > Vimi最新资讯  > 正文

AI日报:商汤Vimi视频生成大模型开放内测;腾讯智影上线AI视频功能;可直接生成6k图像的生成器UltraPixel

2024-07-09 15:02 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、商汤科技推出Vimi视频生成大模型 C端应用Vimi相机开放内测

商汤科技在2024年世界人工智能大会(WAIC)上推出了Vimi视频生成大模型,为用户提供精准的表情和肢体控制,支持多种驱动方式,稳定性突出且能生成高一致性的视频内容。Vimi相机作为首款C端应用,满足广大女性用户的娱乐创作需求,支持多样化的生成风格和个性化创作。

image.png

【AiBase提要:】

👩‍💻 Vimi模型利用商汤先进的大模型技术,能够生成与目标动作一致的人物视频,具有多年积累的面部跟踪技术和精确控制能力。

🎥 Vimi能生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间劣化,支持环境场景调整和逼真的视觉效果模拟。

📸 Vimi相机支持用户上传高清人物图片生成数字分身和写真视频,提供多样化的生成风格和趣味人物表情包。

2、限时免费!腾讯智影小程序上线「AI视频」功能

智影小程序推出了名为「AI视频」的新功能,允许用户一键转换普通视频为风格化视频,特别是动漫风格,提升视频的吸引力。该功能目前限时免费,旨在帮助用户提升视频美感和趣味性。

image.png

【AiBase提要:】

🎥 一键式操作:快速上手,即使初学者也能制作专业级风格化视频。

🎨 多种风格模板:提供多样化模板,增强视频美观度和故事性。

🚀 提升视频传播力:风格化视频易分享,吸引更多观众关注。

3、UltraPixel:超大分辨率图像生成神器

UltraPixel是一款能够生成超高分辨率图像的黑科技,为设计师和创作者带来福音。通过Stable cascade训练和微调,支持直接生成1K到6K分辨率的图片。其技术手段包括隐式神经表示和尺度感知归一化层,保持高度细节和真实感。同时,在最小空间内高效处理,参数利用率高达97%,提高训练和推理效率。

QQ截图20240709110659.jpg

【AiBase提要:】

🔍 UltraPixel支持直接生成1K到6K分辨率的图片,细节精细到毛孔,清晰纤毫。

🚀 基于Stable cascade训练和微调,即将开源,让更多人体验这份科技的魅力。

💡 通过低分辨率图像中的丰富语义信息指导高分辨率图像生成,降低复杂性,保持高度细节和真实感。

详情链接:https://top.aibase.com/tool/ultrapixel

4、Groq推出闪电般快速的LLM引擎,仅四个月吸引28万开发者

Groq公司最近推出了闪电般快速的LLM引擎,引起了广泛关注。这款引擎每秒处理1256.54个标记,远超GPU速度,展示了LLM聊天机器人的快速和灵活性。Groq提供免费的LLM工作负载服务,已有超过28万开发者使用。CEO Ross预计到明年,全球一半推理计算将在Groq的芯片上运行。

image.png

【AiBase提要:】

🚀 Groq的LLM引擎每秒处理1256.54个标记,速度远超GPU

🤖 Groq的引擎展示了LLM聊天机器人的快速和灵活性,吸引开发者和非开发者关注

💻 Groq提供免费的LLM工作负载服务,已有超过28万开发者使用,预计全球一半推理计算将在其芯片上运行

5、无人车团队推出电影级视觉AI特效Odyssey

无人车团队跨足好莱坞,推出革命性电影级视觉AI特效Odyssey,颠覆电影、电视节目和视频游戏制作方式。Odyssey能生成好莱坞级别的故事镜头,突破视频AI障碍,实现完全掌控视觉叙事核心层。灵感源自皮克斯,目标是用AI制作影视作品,解决AI可控性难题。

【AiBase提要:】

🎬 Odyssey实现完全控制视觉叙事核心层,生成高质量场景元素和方面

🌟 提出更强大的生成模型,训练四个模型实现精细配置场景细节

🚗 团队与自动驾驶汽车紧密相关,创始人在自动驾驶领域有丰富经验

详情链接:https://top.aibase.com/tool/odyssey

6、报道称OpenAI内部论坛曾遭黑客入侵,机密被盗

近日,知名人工智能公司OpenAI的内部论坛遭到黑客攻击,引发安全问题,员工担忧安全漏洞可能被利用。公司发布更新加密聊天记录以提升数据安全性,成立安全与保安委员会加强安全措施。全球合作应对AI带来的挑战变得尤为重要。

【AiBase提要:】

💡 OpenAI内部论坛遭黑客攻击,公司安全性受到质疑,员工担忧安全漏洞可能被利用。

💡 发现ChatGPT macOS应用程序存在安全漏洞,公司发布更新加密聊天记录以提升数据安全性。

💡 OpenAI成功阻止多起来自俄罗斯、以色列的秘密影响行动,成立安全与保安委员会加强安全措施。

7、Meta AI为移动设备开发紧凑型语言模型MobileLLM

Meta AI研究团队推出了MobileLLM,这是为智能手机和其他资源受限的设备设计高效语言模型的新方法。该研究挑战了有关有效AI模型规模的假设,取得了2.7%到4.3%的性能提升。MobileLLM的开发符合人们对更高效AI模型的需求,尚未向公众开放,但已开源预训练代码。

image.png

【AiBase提要:】

🔑 MobileLLM是为资源受限设备设计的高效语言模型,挑战了大型模型的必要性。

🚀 MobileLLM的创新包括优先考虑模型深度、利用嵌入共享和分组查询注意、采用直接块权重共享技术。

💡 MobileLLM在基准测试任务上表现优异,3.5亿参数版本在某些任务上与70亿参数模型相当。

8、Poe社交平台推出Previews功能

Poe社交平台推出了名为Previews的创新功能,为用户带来前所未有的交互体验,标志着AI社交互动进入新纪元。Previews功能直观易用,让用户在聊天界面中实时查看AI生成的Web应用并进行即时交互,提升了用户与AI之间的互动质量。

image.png

【AiBase提要:】

🚀 AI社交互动进入新纪元,Previews功能让用户直观操作AI生成的Web应用。

💡 Previews功能易用直观,用户轻松自然与AI进行即时交互。

💻 适用于大型语言模型,提供普通用户接触高级AI编程应用的机会,增加Poe平台吸引力。

9、Xinsir开源Controlnet++模型 支持Openpose、Canny等十多种条件控制

Xinsir最新发布的Controlnet++开源模型具有多种控制条件,能够生成高质量图像,特别适用于需要精细编辑的设计师。该模型基于ControlNet架构,新增模块支持超过十种不同的控制类型,提供了多种控制条件下的图像生成示例。虽然目前无法在Web UI和Comfyui上使用,但其多功能性和高质量输出使其成为文本到图像生成领域的一个重要突破。

image.png

【AiBase提要:】

🔧 Controlnet++支持Openpose和Canny等输入,避免频繁更换模型。

🧩 模型设计特点多种控制,使用相同网络参数实现不同条件的图像生成。

🚀 Controlnet++在SDXL实验中表现优异,提供多种控制条件下的图像生成示例。

详情链接:https://top.aibase.com/tool/controlnet-

10、支付宝医疗大模型亮相 中英文考试超GPT-4水平

支付宝的医疗大模型在中英文考试中表现超越了GPT-4,已在江浙沪一线医院落地。该模型具备多模态能力,准确率达90%以上,可提供智能问答、病历结构化和检索等服务。支付宝联合多家机构发起AI医疗共建计划,致力于提升医疗效率和数据安全。

【AiBase提要:】

🏥 支付宝医疗大模型在中英文考试中超越GPT-4水平,已在一线医院落地。

💡 模型具备多模态能力,准确率达90%以上,可提供智能问答、病历结构化和检索服务。

🔒 支付宝采取多项措施保障技术可靠和数据隐私安全,推动人工智能规模化落地。

举报

  • 相关推荐
  • REDMI最强旗舰:曝REDMI K90全系标配2K窄边框直屏

    博主数码闲聊站暗示,REDMI K90标准版和Pro版都标配2K直屏,全系采用旗舰级发光材料,全系支持3D超声波屏幕指纹,全系采用LTPS屏幕。 该博主还爆料,REDMI K90系列的2K屏幕功耗明显下降,还有对称式双扬声器,屏幕比例为19.5:9。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • 王腾吃虫子:为了REDMI Note 15的新品宣传 我豁出去了

    REDMI总经理王腾表示,前几天跟德爷见面,他给我带了一盒竹节虫做早餐,我说我吃过早饭了,他还是硬要我尝了一个,为了REDMI Note 15系列的新品宣传,我也是豁出去了,大家有机会自己尝一下。 这次REDMI Note 15 Pro系列邀请荒野求生专家,地表最强实战之王德爷(埃德斯塔福德)挑战真实生活中更复杂、更高频、更极限的场景,共同见证手机实战品质之王的诞生。

  • 可赶上这波了!iOS用户“一键补课”了Mistplay的新功能

    在2023 ChinaJoy展会上,Mistplay凭借其独特的"玩赚"模式成为BTOB展区热门平台。该平台通过游戏时长激励玩家,同时为开发者提供高质量用户,已覆盖全球九大应用市场,累计安装超3500万次。Mistplay近期推出iOS版本,新增锦标赛、益智问答等功能,并创新推出LoyaltyPlay功能,为非游戏应用搭建激励桥梁。其核心AI引擎"Helios"能精准匹配用户与游戏,提升用户留存率和LTV。中国区负责人彭超楠在展会上分享了"忠诚度营销"理念,为游戏出海提供新思路。双平台布局使Mistplay优势更加突出,成为开发者提升用户留存的重要合作伙伴。

  • REDMI Note 15 Pro系列官宣下周发布

    REDMI官方正式宣布,备受瞩目的Note15Pro系列将于下周与消费者见面。官方宣称,该系列将以“耐用品质,打造品质里程碑之作;用真实场景,定义实战之王”,彰显其在品质与实用性上的双重追求。 据小米中国区市场部总经理、REDMI品牌总经理王腾透露,实战是检验品质的唯一标准。对于REDMI Note15Pro系列而言,好品质意味着要能够经受住真实生活中复杂、高频、极限场景的考验�

  • 检出率超95%,支持透明液体识别!INDEMIND脏污识别:更快、更准、更智能

    扫地机器人技术正从“盲目清扫”向“智能识别”进化。INDEMIND推出立体视觉污染识别方案,能精准识别固态、液态、粉末及混合四类污渍,检出率超95%。该技术结合智能决策引擎,实现自主调整清洁参数,避免二次污染。同时提供单目、双目及三目模块矩阵,支持快速适配升级,推动行业迈向精准化智能清洁新阶段。

  • INDEMIND:高需求和低渗透之间,服务机器人为何规模化落地难?

    在全球经济面临劳动力短缺的背景下,加之疫情的进一步催化,服务机器人取得了蓬勃发展,预计 2022 年,全球服务机器人市场规模将达到 217 亿美元,然而尽管如此,在高速发展之下,机器人的行业渗透率却并未明显提高,究其原因在于红利之后,机器人的规模化商业落地过程走的并不顺利...作为国内领先的机器人关键AI技术供应商,INDEMIND在机器人的导航、避障、决策、AI交

  • REDMI产品经理带着神秘新品出差:米粉都在猜是K90

    REDMI产品经理胡馨心闪现小米上海总部,她带着神秘新品来上海出差。不少米粉对神秘新品”表示好奇,都在猜测是不是REDMI K90系列产品。 据爆料,REDMI将在10月推出K90系列,包含K90和K90 Pro两款机型,其中REDMI K90 Pro首批搭载高通骁龙8 Elite 2旗舰平台,同时配备潜望长焦,这是K系列首款潜望长焦旗舰。

  • 从中国工厂到中东豪宅!海信RGB-Mini LED电视引千万粉丝博主探厂打call

    中国高端电视在中东市场表现强劲,海信电视凭借RGB-Mini LED等创新技术成为当地热门科技产品。中东博主实地探访海信研发中心,深入了解ULED、AI画质芯片等核心技术。海信UX系列电视采用三原色独立背光,突破传统显示限制,实现精准色彩控制,色域覆盖率达97% BT.2020。该产品搭载自研芯片,支持高精度色彩管理,推动全球电视行业进入RGB多基色显示新时代。海信计划在2025年德国IFA展发布重磅消息,加速RGB-Mini LED技术市场化进程。

  • 王腾晒出REDMI Note 15 Pro:云霞紫配色亮相

    REDMI总经理王腾在社交平台晒出了REDMI Note15Pro的官方照片,引发了广泛关注。 王腾介绍称,Note15Pro不仅拥有与Pro+同款的耐用品质,更采用了直屏形态设计,搭配优雅的大R角和超窄边框,旗舰级的质感扑面而来。他特别推荐了云霞紫配色,其细腻的云纹设计为整机增添了一抹灵动与时尚。 王腾进一步强调,Note15系列将品质从实验室带入了真实生活场景,提出了“耐久品质”的

今日大家都在搜的词: