首页 > 业界 > 关键词  > 文章搜索最新资讯  > 正文

3D领域的NanoBanana也来了,万物皆可用嘴操控。

2026-01-27 09:36 · 稿源: 数字生命卡兹克公众号

周末看到一个好玩的东西。3D领域的NanoBanana也来了。中间有一句比较重要的功能,是我觉得非常有意思的:可以通过提示进行局部编辑。玩过NanoBanana的肯定很熟了。算了补全了一块有意思的拼图。放下他们的视频。用嘴来修改一切,真的变成了一个是未来必然的趋势。图片领域有Nano Ba

......

本文由站长之家合作伙伴自媒体作者“数字生命卡兹克公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • 海尔智家发布行业首个AI+细分岗位能力模型

    随着AI 应用迈入规模化落地的关键阶段,兼具数字化思维与AI 技术能力的复合型人才成为行业发展的刚需。数据显示,2030年全球AI人才缺口预计达500万,中国占比超过40%。基于这一现状,3月5日,海尔智家率先发布了行业首个AI+细分岗位能力模型,涵盖AI产品经理与AI技术开发工程师岗位能力模型。该模型涵盖6大核心能力维度、24项细分能力指标,通过“标准制定—人才培养—�

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • ​别再盲目做 AI 营销了!这款 GEO监控工具,撕开了大模型引用的“黑盒”

    本文探讨了生成式引擎优化(GEO)的重要性,并介绍了AIBase推出的GEOBase平台。文章指出,当前品牌营销的关注点已从传统SEO转向GEO,即如何让品牌在AI搜索结果中获得更高可见度。GEOBase平台通过曝光趋势、引用来源、情感得分等核心功能,帮助品牌监测在各大AI平台(如DeepSeek、豆包等)中的表现,并提供数据驱动的优化策略。文章以3C品牌为例,展示了如何利用该工具分析竞争格局、优化内容投放,从而提升品牌在AI语境下的影响力。最后,文章强调GEO是算法时代的精密计算,而GEOBase为品牌提供了关键的“体检报告”和作战地图。

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • 诊疗提质、管理增效:AI如何重塑医院核心能力?北电数智“数算模用”全力破局

    文章探讨了医疗健康行业向高质量发展转型的关键阶段,指出临床大数据存在“难汇聚、难挖掘、难流通”的痛点,制约了行业从经验驱动向数据驱动的跨越。国家层面出台多项政策支持医疗数智化发展,明确推进临床大数据标准化集成应用,强化医疗数据要素价值释放。北电数智凭借在可信数据领域的技术积累,以“数算模用”全栈布局为核心,构建了从数据要素激活到应用落地的完整闭环,通过“樱智α·医疗可信平台”等创新架构打通医疗数据全链路,并打造“樱智医助”等协同决策型AI应用,深度嵌入临床工作流,显著提升诊疗精准性与效率。其全栈体系还延伸至医疗管理与基层医疗领域,构建起覆盖“诊前-诊中-诊后”全周期、“三甲-基层”全层级的医疗数智化服务生态,推动优质医疗资源下沉,助力分级诊疗落地。未来,北电数智将持续深化合作,推进医疗AI底座的标准化建设与国产化适配,探索临床大数据服务新范式,完善“人机协同”临床决策体系,推动行业从“经验医学”全面迈向“智能医学”。

  • AI日报:美团Tabbit浏览器开启公测;通义发布语音双模型;Notion 引入首个开源权重模型 MiniMax M2.5

    本期AI日报聚焦多领域AI新动态:美团旗下Tabbit浏览器公测,集成多模型AI Agent,实现网页自动化执行;阿里通义发布语音双模型,支持自然语言控制音色与场景;Notion引入开源模型MiniMax M2.5,打破闭源垄断,提升性价比;谷歌升级Flow AI工具,整合视频、绘画与特效功能;阿里巴巴AI品牌统一更名为“千问”,强化战略聚焦;三星宣布2030年迈向“AI工厂”,以Agentic AI驱动全链路自治;OpenAI疑似收购顶级域名GPT.com,巩固品牌地位;北京大学与OceanBase打造LoVR基准,入选WWW 2026,开启全视频智能检索新模式。

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

今日大家都在搜的词: