首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

2025-05-19 16:18 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、B站团队推出AniSora开源动漫视频生成模型,一键打造多种风格动画!

B站团队通过AniSora开源动漫视频生成模型,填补了动漫视频生成领域的技术空白,支持多种动漫风格的视频创作。

image.png

【AiBase提要:】

😊 AniSora支持一键生成多种动漫风格视频,涵盖系列剧集、中国原创动画等多种类型。

🌟 引入时空掩码模块,支持图像生成视频、帧插值和局部图像引导等功能,提升生成质量。

🏆 经过严格测试,人物与运动一致性达到当前最高标准(SOTA),展现卓越性能。

2、OpenAI 发布全新编程智能体 Codex

我作为一名开发者,对OpenAI推出的Codex感到非常兴奋。Codex不仅能大幅缩短开发时间,还与GitHub无缝集成,极大提升了工作效率。它通过强化学习生成符合人类偏好的代码,展现了强大的自我委派能力。

image.png

【AiBase提要:】

🚀 Codex 智能助手由 OpenAI 推出,能在30分钟内完成复杂的开发任务。

🔗 Codex 与 GitHub 无缝集成,支持多任务并行处理,极大提升开发者效率。

🤖 Codex 通过强化学习训练,确保生成的代码符合人类开发者偏好。

3、Google搜索推出AI Mode实验,探索全新智能问答体验

Google推出了名为 'AI Mode' 的实验性功能,提供文本、语音和图像提问的智能问答体验,并鼓励用户反馈以持续优化服务。

image.png

【AiBase提要:】

🌟 支持文本、语音和图像提问,提供更智能的问答体验。

🔍 可通过跟进问题深入探索,获取更多相关信息和网页链接。

🔒 注重用户隐私,采取措施保护数据安全并鼓励用户反馈。

详情链接:https://support.google.com/websearch/answer/16011537?visit_id=638832352895396136-3267382421&p=aimodeavailability&rd=1#aimodeavailability

4、ChatGPT将整合MCP协议,助力企业接入多样AI服务

ChatGPT即将支持MCP协议,该协议允许其与第三方AI服务无缝对接,提供更个性化的用户体验。企业可通过此协议优化工作流程,提升效率和决策质量。

【AiBase提要:】

🌟 MCP协议旨在统一大语言模型与外部系统的互动方式,类似AI应用的“USB-C接口”。

⚙️ 用户可自定义添加工具,填写名称、URL和描述,实现ChatGPT与个人应用的结合。

💼 MCP为企业提供数据按需共享能力,优化工作流程,推动智能化决策。

5、阿里通义实验室推出 ZeroSearch:让大模型无需 API 自我 “搜索”

ZeroSearch 是一种新框架,通过强化学习和少量标注数据,使大语言模型能够模拟搜索引擎,提升检索和推理能力,同时减少对真实搜索引擎的依赖,降低训练成本。

【AiBase提要:】

✨ ZeroSearch 利用强化学习和少量标注数据,使大模型无需依赖真实搜索引擎即可生成高质量文档,增强推理能力。

📚 框架采用课程式学习法,从高质量到低质量文档逐步训练,提高模型适应复杂检索任务的能力。

🌟 在问答数据集测试中,ZeroSearch 表现优于传统方法,在单跳和多跳问答任务中均有显著优势。

6、Stability AI与Arm推出手机级音频生成AI:7秒内创建11秒立体声

Stability AI和Arm联合发布了稳定音频开放小型模型,该模型能在7秒内生成11秒高质量立体声音频,优化后可在移动设备上流畅运行,基于对抗相对对比技术,大幅减少参数量,适合消费级硬件。

【AiBase提要:】

突破性技术让音频生成仅需7秒,实现接近实时的音频合成能力。

模型架构优化至三部分,适配移动端,支持多种音频生成任务。

训练数据严格筛选,确保合法合规,但当前更适用于英语提示输入。

7、Qwen发布全新偏好建模模型系列WorldPM

Qwen团队推出了WorldPM系列模型,包括WorldPM-72B及其衍生版本,通过大规模训练实现偏好建模的突破,为开发者提供高效优化路径。

image.png

【AiBase提要:】

🌍 WorldPM通过1500万条偏好数据训练,验证了偏好建模遵循规模化定律,提升模型在监督学习中的表现。

🌐 模型系列开源发布,降低技术门槛,助力全球开发者提升模型优化效率。

🌟 强化风格中立性,克服主观偏见,在编码、数学等任务中展现显著优势。

详情链接:https://huggingface.co/Qwen/WorldPM-72B

8、OpenAI 揭秘 GPT-5:将多款产品整合为一体

Jerry Tworek 在Reddit上分享了GPT-5的最新动态,它将整合Codex、Operator、Deep Research和Memory,以简化用户的操作流程。Codex的编程效率提升了三倍,并且OpenAI计划通过这一工具帮助新手开发者更快入门。

【AiBase提要:】

🌟 GPT-5整合了Codex、Operator、Deep Research和Memory,减少了工具间的切换困扰。

💻 Codex提升了编程效率三倍,特别适合解决琐碎问题的开发者。

👨‍💻 OpenAI计划通过Codex帮助新手开发者快速学习编程,增强人类开发者的整体能力。

9、ListenHub:颠覆播客体验的 AI 生成工具正式上线

ListenHub是一款基于AI技术的播客生成工具,支持中文和英文,提供个性化播客体验。它以其高效的生成速度和友好的用户界面受到欢迎,适合普通用户及内容创作者。提供免费和高级会员服务,并注重移动端体验。

image.png

【AiBase提要:】

🌟 使用AI技术快速生成与用户兴趣相关的内容,涵盖科技、历史和社会话题。

⚡️ 生成速度快,1-5分钟即可完成播客制作,适合忙碌人群和内容创作者。

📱 支持多平台和移动端使用,提供免费和高级会员选项,满足多样化需求。

详情链接:https://listenhub.ai/zh

10、QQ浏览器升级为AI浏览器:上线QBot 新增5大AI新能力

QQ浏览器升级为AI浏览器并推出QBot,带来更智能的浏览体验,包括搜索、阅读、翻译、写作及办公辅助等功能。

image.png

【AiBase提要:】

🚀 QBot支持多模态提问,能精准回答各类问题,提供24/7智能陪伴。

📚 AI阅读工具可快速总结网页内容、生成脑图,提升信息处理效率。

💼 办公场景下,QBot提供文档编辑、翻译、写作等多功能工具,助力高效办公。

11、数学建模的AI助手MathModelAgent

MathModelAgent是一款专为数学建模设计的智能工具,能够自动完成从问题分析、模型构建、代码编写到论文撰写的全流程,展现了AI在学术与技术领域的深远潜力。

image.png

【AiBase提要:】

问题分析与建模:建模手能快速解析数学问题并生成逻辑清晰的数学模型。

代码生成与调试:代码手内置反思模块,生成高质量代码并通过本地解释器实时调试。

论文自动撰写:论文手根据建模和计算结果自动生成格式规范的学术论文。

12、GenSpark推出全球首个 Agentic AI下载代理,革新文件管理体验

我非常看好GenSpark推出的这款Agentic Download Agent工具,它真正实现了文件管理和信息处理的自动化与智能化,极大地简化了我的工作流程。无论是学术研究还是日常办公,这款工具都能让我专注于更重要的事情。

【AiBase提要:】

🚀 支持通过自然语言指令一键完成文件搜索、下载和整理,大幅提升效率。

📚 提供AI Drive功能,支持对文件进行摘要生成、关键信息提取和分析报告生成。

🌐 具备强大的自动化与智能化特性,支持批量处理、智能整理和透明操作。

13、谷歌NotebookLM即将推出Sparks视频概览

谷歌旗下的NotebookLM计划推出‘Sparks’功能,将文档、笔记等转化为1-3分钟的短视频,其中10%内容由AI生成,结合Gemini2.5和Deep Research功能,实现从研究到呈现的端到端解决方案。

image.png

【AiBase提要:】

✨ Sparks视频概览结合Gemini2.5和Deep Research,将文档转化为1-3分钟短视频,助力高效内容创作。

📚 适用于教育、研究、内容创作等多个场景,显著提升工作效率。

🌐 全球化布局,支持多语言,未来有望进一步拓展国际市场。

举报

  • 相关推荐
  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • 突发!OpenAI将收购谷歌浏览器Chrome

    OpenAI高管在谷歌反垄断案庭审中作证透露,若谷歌败诉将收购其Chrome浏览器。美国司法部要求拆分Chrome以打破谷歌搜索垄断。ChatGPT产品负责人Turley作证称,OpenAI曾试图与谷歌合作使用其搜索技术但遭拒。邮件显示OpenAI去年7月提出合作请求,8月被谷歌以涉及竞争对手为由拒绝。Turley认为,若法院强制谷歌共享搜索数据将加速ChatGPT改进。目前ChatGPT距离实现80%查询使用自有搜索技

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 苹果探索在浏览器中加入AI搜索功能

    行业分析指出,苹果若在Safari等原生浏览器中集成AI搜索能力,将直接冲击搜索引擎市场现有格局。传统搜索引擎依赖关键词匹配,而AI技术可通过语义分析精准捕捉用户意图,显著提升信息检索效率与结果相关性。

  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • AI日报OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • AI日报:百度大招!发布文心大模型X1Turbo和AI开放计划;OpenAI免费开放轻量版Deep Research;即梦视频3.0内测

    【AI日报】主要报道了AI领域的最新动态:1)百度发布文心大模型X1Turbo和4.5Turbo,性能价格优势显著;2)百度推出AI开放计划,降低开发者门槛;3)OpenAI免费开放轻量版Deep Research研究工具;4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力;5)百度发布全球首个内容操作系统"沧舟OS";6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具;7)Pixverse推出MCP协议简化AI视频创作;8)Tavus发布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上线,提供免费额度;10)Adobe整合OpenAI和Google模型升级Firefly创意平台;11)ImageSlider2.0即将加入Gradio核心产品线;12)李彦宏谈DeepSeek现存痛点,强调多模态能力与降本需求。