首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

2025-04-29 15:45 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、通义千问Qwen3发布:推理能力显著增强

通义千问团队推出了Qwen3,这是其大型语言模型系列的最新成员。Qwen3在多个基准测试中表现出色,尤其在代码、数学和通用能力方面,展现了与顶级模型的竞争力。该模型支持两种思考模式,能够灵活应对复杂和简单问题,并且开源了多个模型的权重,旨在推动大型基础模型的研究与开发。

image.png

【AiBase提要:】

🧩 Qwen3系列模型在代码、数学和通用能力等基准测试中表现优异,展现出与顶级模型的竞争力。

🔍 Qwen3支持思考模式和非思考模式,用户可根据任务需求控制模型的推理程度,提升效率。

🌍 Qwen3开源多个模型并支持119种语言,为国际应用提供了新的可能性,推动大型基础模型的研究与开发。

详情链接:https://huggingface.co/Qwen/Qwen3-235B-A22B

2、抖音AI搜索能力开放 可为第三方应用提供更丰富内容

抖音平台最近开放了其搜索能力接口,允许第三方应用接入其内容搜索服务。这项服务旨在通过抖音的丰富内容资源,提升其他应用的搜索和问答功能,从而优化用户体验。传统AI搜索通常仅提供文字结果,而接入抖音搜索后,第三方应用能够获取视频和图文等多种形式的优质内容,满足用户多样化的需求。

image.png

【AiBase提要:】

📹 接入抖音搜索能力后,第三方应用可以获取生活、教育、娱乐等多个领域的优质内容,包括视频和图文。

📝 用户输入搜索词后,系统将返回相关的抖音经验内容,具有较高的时效性和可信度。

🤖 目前该服务主要面向AI智能体和内容工具等应用,提升信息获取效率,提供更丰富的搜索结果。

3、ChatGPT 搜索新增网购功能,对话获得个性化商品推荐

OpenAI 最近对其 ChatGPT Search 进行了重要的功能升级,新增了网购功能,旨在为用户提供更便捷的购物体验。用户可以通过自然对话与 ChatGPT 互动,获取个性化商品推荐,并实现一站式购物体验。系统能够记忆用户的偏好,确保推荐的中立性,未来还将扩展更多商品类别。

【AiBase提要:】

🛒 OpenAI 为 ChatGPT Search 新增购物功能,正式进军电商领域。

🤖 用户可通过自然对话获得个性化商品推荐,并实现一站式购物体验。

📈 系统能够记忆用户偏好,确保推荐的中立性,未来将扩展更多商品类别。

4、Suno AI即将推出V4.5版本:音乐生成技术再升级

Suno AI即将推出其V4.5版本,这一升级引发了音乐创作者和科技爱好者的广泛关注。新版本将提供更精细的音乐控制和音质提升,特别在人声和乐器音色的真实度上有所改善。V4.5的更新不仅回应了市场反馈,还可能进一步巩固Suno在AI音乐生成领域的领先地位,尤其是在音质和人声生成方面。

【AiBase提要:】

🎤 V4.5版本将提供更强大的音乐生成控制功能,优化音质表现,特别是在音色真实度上。

🎼 新版本可能引入更灵活的生成选项,降低创作门槛,使无音乐背景的用户也能创作高品质音乐。

🚀 Suno在AI音乐生成领域的竞争中,V4.5的推出被视为对市场反馈的积极回应,旨在缩小与竞争对手的音质差距。

5、Simular AI登陆macOS,本地智能助手革新人机协作体验

Simular AI的推出标志着本地化智能助手的新时代,强调人机协作与隐私保护。作为首个在用户本地设备上运行的AI浏览器智能体,Simular通过理解屏幕内容和自动化网页操作,极大提升了用户的工作效率。

image.png

【AiBase提要:】

🌐 本地化处理:Simular AI在Mac上本地运行,无需上传数据,确保隐私安全。

🤖 自动化网页操作:支持自动浏览、搜索、填写表单等,适合重复性任务。

👥 人机协作模式:用户可随时介入AI操作,实现高效的并行协作。

详情链接:https://www.simular.ai/

6、暗月之面发布开源模型 Kimi-VL,28亿个参数即可处理文本、图像和视频

Moonshot AI 最近推出的 Kimi-VL 模型,凭借其高效的性能和处理长文档、复杂推理的能力,成为多模态 AI 领域的亮点。该模型仅有2.8亿个活跃参数,却在多个基准测试中表现出色,超越了许多大型模型。Kimi-VL 不仅能够处理图像、文本和视频,还能解读用户界面并自动化数字任务,展现出强大的应用潜力。

【AiBase提要:】

🌟 Kimi-VL 是 Moonshot AI 发布的开源多模态 AI 模型,处理图像、文本和视频表现优异。

📈 该模型以2.8亿个活跃参数在多项基准测试中超越许多大型模型,显示出高效的性能。

🤖 Kimi-VL 支持长文档处理和复杂推理,能解读用户界面并自动化数字任务。

7、大幅提升 AI 推理速度:UCLA 与 Meta AI 联合推出 d1框架

UCLA与Meta AI研究人员推出的d1框架通过强化学习显著提升了扩散式大语言模型(dLLMs)的推理能力。该框架结合监督微调和新算法diffu-GRPO,优化了模型的学习效果,尤其在生成长响应时展现出自我修正能力。d1框架为企业提供了加速与自动化的数字工作流程解决方案,适应不同的延迟和成本需求,展示了扩散式模型在质量、速度和成本上的优势。

image.png

【AiBase提要:】

🌟 d1框架结合强化学习技术,显著提升扩散式大语言模型的推理能力。

⚡ dLLMs 采用遮蔽生成方法,能更高效地处理上下文信息,降低延迟。

🚀 d1在多项推理基准测试中表现优异,展现出自我修正能力,适用于企业各种数字工作流程。

详情链接:https://arxiv.org/abs/2504.12216

8、通义灵码上线Qwen3:编程智能体即将上线 集成魔搭MCP广场

通义灵码团队推出了Qwen3,标志着编程智能体的重大进展。此次开源的混合推理模型包括多款MoE和Dense模型,展现出卓越的性能,尤其是旗舰模型Qwen3-235B-A22B在多个基准测试中表现突出。开发者可以在主流IDE中体验Qwen3的强大功能,支持灵活的思考模式,并具备多语言能力,推动全球应用。

image.png

【AiBase提要:】

🛠️ Qwen3团队开源了8款混合推理模型,包括两款MoE和六款Dense模型,展示了强大的技术能力。

🌍 Qwen3支持119种语言和方言,促进全球开发者的应用,提升编程效率。

📈 在Agent能力评测中,Qwen3创下70.8的新高,超越了顶尖模型,降低了开发者的编码复杂度。

详情链接:https://lingma.aliyun.com/download

9、光影魔术手!Gen-4References 惊艳亮相,AI 实时混合图像,精准拿捏光影氛围!

Gen-4References是一项新兴的图像生成技术,凭借其卓越的实时图像混合能力和光影一致性,迅速成为AI创作领域的焦点。该技术通过融合两张参考图像,能够根据用户的描述生成高质量的新图像,展现出在艺术创作和商业设计中的巨大潜力。

image.png

【AiBase提要:】

🎨 实时图像混合:基于两张参考图像生成新图像,构图生成仅需数秒,支持自然语言描述。

🌟 光影环境保留:精准捕捉光影特征,确保生成图像与环境风格一致,视觉效果自然。

🚀 高分辨率输出:支持2K至4K分辨率,适合专业设计与艺术创作,细节清晰。

10、Hugging Face 推出全新 SO-101机械臂:低价高效、可编程 AI 助手

Hugging Face 最新推出的 SO-101机械臂在前代产品的基础上进行了多项升级,特别是在机械性能和操作速度上有显著提升。该产品结合了强化学习 AI 技术,能够学习执行各种任务,提升用户体验。售价在100至500美元之间,具体取决于供应商,展示了 Hugging Face 在机器人领域的技术积累及全球扩展的雄心。

image.png

【AiBase提要:】

🚀 SO-101机械臂在SO-100基础上进行多项升级,提升了机械性能和操作速度。

🧠 通过强化学习AI技术,SO-101能够学习执行任务,提升精确度和效率。

🤝 Hugging Face与多家企业合作,增强机器人硬件供应链整合能力。

11、Windsurf 推出全新品牌标志与功能,AI编码工具进一步优化

Windsurf(前身为Codeium)于2025年4月28日推出全新视觉形象和品牌标志,标志着其在人工智能编码助手领域的重要进展。新标志象征着流动与专注,体现了公司对开发者的承诺。同时,Windsurf还宣布了一系列针对免费用户的功能升级,提升了用户体验。此外,关于OpenAI可能以30亿美元收购Windsurf的传闻也在业界引发热议,显示出Windsurf在市场中的重要性与潜力。

image.png

【AiBase提要:】

🌊 新标志灵感来源于流动的波浪,象征着高效的编码体验。

🔧 免费用户层功能升级,包括更多高级积分和无限制访问完整代理功能。

💼 OpenAI可能以约30亿美元收购Windsurf,显示出其市场潜力。

12、Ollama 支持全线的 Qwen3模型,本地部署Qwen3更便捷

Ollama官方宣布全面支持阿里巴巴通义千问的最新大语言模型系列Qwen3,此次更新极大丰富了Ollama的开源模型生态,为开发者和企业提供了强大的本地化部署选择。Qwen3模型在多种基准测试中表现出色,支持29种语言和长达128K token的上下文处理,适合多种应用场景。

【AiBase提要:】

🌍 Qwen3模型支持29种语言,满足全球化应用需求。

⚙️ 支持高达128K token的长上下文处理,适合复杂对话和长文本生成。

💻 Ollama简化了Qwen3的本地部署,让用户轻松运行,无需复杂配置。

举报

  • 相关推荐
  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

今日大家都在搜的词: