首页 > 原创 > 关键词  > 正文

AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

2025-08-11 15:43 · 稿源:AIbase基地

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维正式发布SkyReels-A3模型:照片可根据语音对口型

昆仑万维集团推出的SkyReels-A3模型,基于DiT视频扩散模型,实现了音频驱动数字人创作。该模型能够使静态图像或视频中的人物根据语音内容开口说话或唱歌,并支持改台词、运镜控制等功能,为广告、直播带货、音乐MV等提供了高效便捷的AI技术方案。

image.png

【AiBase提要:】

📷 SkyReels-A3可将静态图像或视频中的人物根据语音内容进行动态表演。

🎥 支持长达60秒的单分镜视频输出,多分镜支持无限时长,满足不同创作需求。

🔄 提供8种预设运镜参数,强度可调节,实现专业级运镜效果。

详情链接:https://skyworkai.github.io/skyreels-a3.github.io/

2、马斯克旗下xAI宣布Grok4AI模型永久免费开放

xAI公司宣布Grok4人工智能模型将永久免费开放,为全球用户提供先进的AI工具。

微信截图_20250811084036.png

【AiBase提要:】

🤖 Grok4人工智能模型将永久免费开放给全球用户。

⚙️ 提供Auto模式和Expert模式,满足不同用户需求。

🌐 免费开放可能推动AI技术的普及和应用。

3、Open AI重磅发布GPT-5提示词指南:解锁AI编程与多模态新境界

文章详细介绍了Open AI推出的GPT-5模型及其官方提示词指南,强调了其在复杂任务、编程和多模态交互方面的提升。指南提供了优化策略,如调整推理力度、控制代理行为倾向以及利用工具序言等,帮助用户最大化发挥GPT-5的潜力。

image.png

【AiBase提要:】

🧠 GPT-5通过精准的提示设计提升了代理任务、代码生成和指令遵循的表现。

💻 支持生成前端界面、调试大型代码库,并结合Responses API提高代码生成效率。

🖼️ 引入多模态交互功能,包括文本、图像、语音处理及个性化设置,增强实用性。

详情链接:https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide

4、百度搜索 PC 端全面上线 AI 搜索功能

百度搜索 PC 端全面上线一系列 AI 功能,将传统信息入口转变为任务中枢。新增的“超级智能双行框”和“工作台”模块,集成了 AI 阅读、AI 写作和 AI PPT 工具,提升了用户的搜索效率和办公体验。同时,百度 AI 搜索的月活跃用户已超过3.22亿,稳居国内 AI 搜索行业第一

image.png

【AiBase提要:】

🧠 百度搜索 PC 端全面上线 AI 功能,提升用户搜索体验。

🛠️ 新增 “工作台” 模块,集成 AI 阅读、写作与 PPT 工具。

📈 月活跃用户达3.22亿,百度稳居国内 AI 搜索行业 第一

5、Windows11Co pilot 应用免费接入GPT-5,使用限制远低于 ChatGPT

微软宣布其 Windows11和 Windows10中的 Co pilot 应用已全面支持 GPT-5智能模式。该功能通过 Web 路由技术实现,用户无需更新即可启用智能模式,且在使用限制上比 ChatGPT 更加宽松。

image.png

【AiBase提要:】

🌟 Co pilot 现已支持 GPT-5智能模式,用户体验更流畅。

💬 相较于 ChatGPT,Co pilot 的使用限制更为宽松,提升自由度。

🖥️ 用户可通过简单步骤免费访问 Co pilot 和 GPT-5,方便获取信息。

6、反超OpenAI!百川智能开源医疗大模型 Baichuan-M2能力全球登顶

百川智能发布的开源医疗增强大模型 Baichuan-M2在HealthBench评测中获得60.1分,超越了OpenAI的gpt-oss120b模型,并在国际上领先于其他开源大模型。该模型经过极致轻量化处理,可在单卡部署,大幅降低医疗机构成本。同时,Baichuan-M2在复杂医疗问题处理能力上与GPT-5相当,展现出强大的应用潜力。

image.png

【AiBase提要:】

🌟 Baichuan-M2在HealthBench评测中得分60.1,成为全球领先的开源医疗模型。

💡 模型经过轻量化处理,可在单卡部署,显著降低医疗机构成本。

🚀 Baichuan-M2在复杂医疗问题处理能力上与GPT-5相当,具备广泛应用潜力。

详情链接:https://huggingface.co/baichuan-inc/Baichuan-M2-32B

7、苹果宣布GPT5将入驻iOS26:iOS26将集成ChatGPT5

苹果公司宣布将在下个月发布的iOS26系统中集成ChatGPT-5模型,这将显著提升Apple智能的性能,并带来一系列新功能,如实时翻译和内容搜索优化。用户无需OpenAI账户即可使用这些功能,但关联账户可享受更多优惠。

image.png

【AiBase提要:】

🧠 ChatGPT-5将集成至iOS26,提升Apple智能性能。

🌐 新增实时翻译功能,改善跨语言交流体验。

💰 关联OpenAI账户可享受订阅优惠,提供更多选择。

8、谷歌推出 BlenderFusion:颠覆3D 视觉编辑与生成合成的新框架

谷歌推出的BlenderFusion是一个创新框架,旨在提升3D视觉编辑与生成合成的能力,为设计师和创作者提供更直观和高效的创作工具。

image.png

【AiBase提要:】

🎨 BlenderFusion 集成了先进的3D编辑工具与扩散模型,实现了高效的3D视觉编辑与生成合成。

🛠️ 该框架的工作流程包括分层、编辑和合成三个阶段,用户可以方便地编辑3D对象并生成最终图像。

📈 谷歌的BlenderFusion通过优化模型,提升了对复杂场景的处理能力,助力设计师实现创意。

详情链接:https://blenderfusion.github.io/

9、超小的TTS模型 Kitten TTS:参数量仅为1500万

Kitten TTS 是一款开源的轻量级文本转语音模型,参数量仅为1500万,体积小于25MB,适合各种设备部署。它支持无 GPU 运行,能够在普通 CPU 上实现高质量语音合成,并提供了简单的安装和使用指南,方便用户快速上手。

image.png

【AiBase提要:】

🐱 Kitten TTS 是一款开源的轻量级文本转语音模型,体积小于25MB,适合各种设备。

⚡ 模型支持无 GPU 运行,确保用户在普通 CPU 上也能进行高质量语音合成。

🚀 Kitten TTS 已提供简单的安装和使用指南,用户可快速上手并生成音频。

详情链接:https://huggingface.co/KittenML/kitten-tts-nano-0.1

10、小钢炮4.0视觉模型MiniCPM-V4.0,手机端应用更流畅

MiniCPM-V4.0作为MiniCPM-V系列的最新版本,在视觉理解、多图及视频处理方面表现出色,并在OpenCompass评测中取得了69.0的高分,超越了多个同类模型。其专为移动设备设计,响应速度快且无发热问题,同时提供了多种使用方式和开源工具,便于用户上手。

image.png

【AiBase提要:】

🌟 MiniCPM-V4.0在OpenCompass评测中得分69.0,超越多款同类模型。

📱 该模型专为移动设备设计,响应快且无发热问题。

📚 开源iOS应用及详细使用指南,让用户更轻松上手。

详情链接:https://huggingface.co/openbmb/MiniCPM-V-4

11、Stripe 报告:AI 经济火箭式增长,营收速度超越 SaaS 三倍

Stripe 发布的最新分析报告揭示了 AI 经济的迅猛发展,包括营收增长速度、全球市场拓展和商业模式创新等趋势。报告指出,AI 初创公司实现营收里程碑的速度远超以往科技公司,并且具备‘天生全球化’的基因。

image.png

【AiBase提要:】

🚀 AI 企业营收增长速度远超传统 SaaS 企业,100万美元年化营收仅需11.5个月。

🌍 AI 公司从成立之初便具备国际化基因,第一年覆盖国家数量是 SaaS 企业的两倍。

💡 商业模式不断创新,按用量计费和按成果计费模式日益流行,推动 AI 企业快速变现。

举报

  • 相关推荐
  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • 昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

    2025年8月11日,昆仑万维启动SkyWork+AI技术发布周,将连续五天发布五大领域AI模型:视频生成模型Skyreels、世界模型、生图一体化模型、智能体(Agent)模型和AI音乐创作模型Mureka。首日发布的Skyreels-A3是全球首个支持分钟级长视频生成的模型,通过四大技术创新解决直播电商等场景痛点,可实现180秒连贯视频生成、影视级运镜控制与自然动作交互。该模型采用多模态协同生成范式,突破传统视频生成技术误差累积限制,并通过Step蒸馏技术将推理步数压缩至4步,生成时间缩短至80秒。商业化方面,昆仑万维已形成"研发-产品变现-现金流反哺"闭环,2025年Q1经营性现金流净额增长58.3%,旗下DramaWave、Mureka等产品年化流水分别达1.2亿和1200万美元。此次技术周标志着中国AI企业首次跑通规模化盈利路径。

  • 马斯克宣布Grok4免费开放:全球最强AI模型 学术问题表现已达到博士级别

    马斯克今日上午在社交平台上宣布,Grok 4现在对所有用户免费开放,免费用户每天可完成少量查询,超过限制则需要订阅。 xAI官方介绍,用户只需使用自动”模式,Grok就会将复杂的查询路由到Grok 4。若用户偏好掌控一切”,则可以切换到专家”模式。

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • 苹果正在招聘团队:自研AI搜索平台

    彭博社记者马克古尔曼(Mark Gurman)报道,苹果正在组建一支新团队,开发一款类似ChatGPT的AI问答引擎,以应对快速变化的搜索与人工智能市场。 去年,苹果推出了自家的人工智能平台Apple Intelligence,并与OpenAI合作,将ChatGPT集成到Siri中,让用户能够通过Siri调用ChatGPT获取世界知识。 当时,苹果高层明确表示不会自研聊天机器人,称消费者兴趣有限,并坚称苹果在AI领域并未�

  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • AI日报:Kimi K2 高速版发布;美图WHEE上线视频超清功能;字节发布新模型Seed Diffusion Preview

    【AI日报】今日AI领域重要动态:1)美图WHEE推出"视频超清"功能,通过AI技术提升视频画质;2)Kimi K2高速版发布,输出速度提升至每秒40 Tokens;3)通义千问开源编程模型Qwen3-Coder-Flash,支持大规模上下文理解;4)Anthropic企业AI市场份额升至32%,超越OpenAI;5)字节跳动发布实验性扩散语言模型Seed Diffusion;6)马斯克将为Grok用户推出视频生成器Imagine和AI虚拟男友;7)Quora的Poe平台推出开发者API;8)Black Forest Labs开源图像生成模型FLUX.1-Krea;9)Augment推出CLI工具Auggie优化开发流程;10)清华开源AI语音模型MOSS-TTSD;11)Claude升级支持多格式文件上传。