首页 > 业界 > 关键词  > StableDiffusion3最新资讯  > 正文

AI视野:Stable Diffusion3发布;剪映海外版CapCut推文生视频;微软win10、win11照片应用增加AI橡皮擦功能;OpenAI更新GPT商店

2024-02-23 15:06 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240223152418.png

🤖📱💼AI应用

Stable Diffusion3发布 文字渲染能力超强,图像生成质量超越Midjourney

image.png

【AiBase提要:】

⭐️ Stable Diffusion3发布,具有强大的文字渲染、多主题提示和图像质量能力。

⭐️ 技术方面结合了扩散型transformer架构和flow matching技术。

⭐️ 公测开放的Stable Video提供文生视频和图生视频功能。

排队地址:https://top.aibase.com/tool/stable-diffusion-3

剪映海外版CapCut推文生视频功能 每人每天可免费生成5个视频

image.png

【AiBase提要:】

⭐ 支持AI自动转换文字描述为视频

⭐ 多镜头组合剪辑,生成丰富视频效果

⭐ 每人每天免费生成5个视频,适用人群广泛

官方入口:https://top.aibase.com/tool/capcutwenshengshipin

微软Windows10和 Windows11的照片应用增加AI橡皮擦功能

image.png

【AiBase提要:】

⚙️ Generative Erase功能类似魔术橡皮擦,为照片编辑带来全新体验。

📷 用户可轻松进行图像中的AI移除操作,提高编辑便捷性和效果。

💡 微软通过Generative Erase持续创新图像处理,提供更丰富编辑工具和体验。

创新性3D数据合成模型,微软推出EgoGen

【AiBase提要:】

⭐ EgoGen能够适用于多个自我中心感知任务,使用创新的人体运动合成模型来合成高质量数据。

⭐ 通过双阶段强化学习方案,EgoGen无缝结合自我感知视觉线索和身体运动,实现更加自然的运动。

⭐ EgoGen在人称感知任务上取得了显著成果,提升了现有算法在头戴式摄像头建图和定位等任务中的性能。

论文地址:https://arxiv.org/abs/2401.08739

即将开源地址:https://github.com/ligengen/EgoGen

智源研究院推出新一代多模态小模型Bunny-3B

【AiBase提要:】

⭐ 通过数据浓缩技术获得高质量训练数据

⭐ 将LAION-2B压缩成2M核心集

⭐ Bunny-3B小模型在多模态任务上表现优异

项目地址:https://github.com/BAAI-DCAI/Bunny

强大代码解释器OpenCodeInterpreter 可运行生成的代码

image.png

【AiBase提要:】

⭐️ 自动创建代码段,完成编程任务

⭐️ 运行生成的代码验证预期工作

⭐️ 根据执行结果和反馈生成更优质代码

项目地址:https://top.aibase.com/tool/opencodeinterpreter

模型:

https://huggingface.co/collections/m-a-p/opencodeinterpreter-65d312f6f88da990a64da456

📰🤖📢AI新鲜事

OpenAI更新GPT商店,增加用户评分和扩展构建者资料

image.png

【AiBase提要:】

⭐ 用户现在可以为第三方GPT进行评分

🤖 GPT构建者的个人资料更丰富,包括链接和评分信息

🔄 OpenAI未实现根据GPT使用频率分享收益的计划

Midjourney计划在6个月内开放API 视频功能会推迟到V7模型

【AiBase提要:】

⭐ Midjourney计划在未来六个月内开放API

⭐ V7模型将生成视频,产品即将在中国推出

⭐ Midjourney的发展前景看好,值得期待

Reddit通过与AI公司合作的数据授权收入达2.03亿美元

【AiBase提要:】

🤖 Reddit强调与AI供应商的关系,特别是与OpenAI等公司的合作对上市前景产生积极影响。

🌐 Reddit数据对AI模型培训的重要性,以及AI公司通过授权协议获取数据的焦点。

📈 Reddit通过数据授权实现巨额收入,凸显数据在AI领域的关键作用。

Chrome 获得由 Gemini 提供支持的内置 AI 写作工具

【AiBase提要:】

⭐ Chrome浏览器推出新的AI写作生成器

⭐ Gemini驱动,可帮助写各种文本内容

⭐ 实验阶段,仅在Windows、Mac、Linux提供英文版本

举报

  • 相关推荐
  • 小米开启澎湃OS 3 Beta版最新招募:支持小米14、K70等机型

    小米澎湃OS 3 Beta版于9月24日启动招募,覆盖MIX Fold 4、MIX Flip、小米14 Ultra、14 Pro及钛金属版(卫星通讯)、小米14、Redmi K70系列四款机型和小米平板6S Pro 12.4共12款设备。招募采用分批推送机制,每机型设两批次,首批满员后启动第二批,入选用户优先获得更新。正式版将于10月15日推送,逐步扩大覆盖。该系统基于自研底层内核,通过深度优化微架构流水线,精准识别CPU空转,配合一体化调频技术,整体任务执行效率提升19%,带来更流畅体验。此次招募既为用户提供抢先体验机会,也通过反馈助力系统优化,强化小米生态竞争力。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 小米澎湃OS 3 Beta版第二批机型推送:覆盖手机、电视等7款

    小米澎湃OS 3 Beta版第二批机型推送启动,覆盖小米MIX Flip 2、Redmi K80、平板7系列、电视S Pro Mini LED等设备。第三批机型将于9月30日前推送,包括小米MIX Fold 4、小米14系列、Redmi K70系列及平板6S Pro等。新系统采用自研底层内核技术,通过一体化调频提升效率,整体任务执行效率提升19%。

  • 三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!

    三星Galaxy Tab S10 Lite平板电脑是新学期学习的理想助手。它配备10.9英寸大屏,支持S Pen触控笔,提供流畅书写体验。多任务处理功能可同时运行多个应用,提高学习效率。轻巧便携设计适合校园使用,Vision Booster技术确保户外清晰显示。内置AI功能可快速搜索解题,是课堂笔记、资料查阅的得力工具。

  • AI眼镜的痛,Meta也治不了

    对于全球科技从业者而言,Meta Connect大会是一年一度的重要时刻。 不少人早早守在电脑前,想知道扎克伯格此次会带来哪些前沿技术产品,更对会上即将亮相的新款AI眼镜充满关注。 事实上,AI眼镜这类消费电子产品,在过去一年里已快速从“小众科技产品”走进大众视野,但看似火热的市场背后,AI眼镜当下的发展却陷入了明显瓶颈。 此前,国内AI眼镜市场曾掀起“百镜大

  • Panduit 泛达荣获EcoVadis企业可持续发展表现银牌评级

    泛达公司宣布荣获EcoVadis企业可持续发展银牌评级,位列全球前6%,彰显其在环境责任与可持续商业实践方面的坚定承诺。该评估覆盖环境、劳工与人权、商业道德及可持续采购四大核心领域,包含21项可持续发展指标。泛达全球可持续发展经理Mark Dehmlow表示,这一成就证明公司在环境管理、道德采购及员工健康安全方面的努力正产生可衡量影响。作为全球领先的电气与网络基础设施解决方案制造商,泛达将持续提升可持续发展表现,契合市场期望,并支持合作伙伴生态系统及行业优先发展事项。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • 小米澎湃OS 3第二批Beta版开启招募:覆盖REDMI K80、小米MIX Flip2等五款

    据小米官方消息,澎湃OS 3第二批Beta版已经开启招募,覆盖五款机型,包括:小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad。 据了解,澎湃OS 3采用自研底层内核技术平台,深入微架构流水线,识别CPU空转时长,通过一体化调频技术提升效率,整体任务执行效率提升19%。 同时,澎湃OS 3终于登岛”,命名为小米超级岛”,支持三岛并存,能显示待取快递提醒、登�

今日大家都在搜的词: