AI日报：OpenAI推搜索引擎SearchGPT；智谱推AI视频产品清影；字节发布豆包图生图模型；B站上线AIGC推荐广告标题功能

2024-07-26 15:13 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、挑战谷歌!OpenAI推搜索引擎SearchGPT初期仅邀请1万人测试

OpenAI推出SearchGPT，一个由人工智能驱动的搜索引擎，与传统搜索引擎不同，它整理和总结搜索结果。目前处于原型阶段，由GPT-4支持，向1万测试用户开放。OpenAI与第三方合作构建搜索结果，计划将搜索功能集成到ChatGPT中。

【AiBase提要:】
🔍 SearchGPT是由人工智能驱动的搜索引擎，整理和总结搜索结果。
🚀 目前处于原型阶段，由GPT-4支持，向1万测试用户开放。
💡 OpenAI计划将搜索功能直接集成到ChatGPT中，与Google竞争，注重内容使用合作与信息归属清晰性。
详情链接:https://chatgpt.com/search

2、智谱AI推出AI生成视频产品清影

智谱AI推出了名为清影（Ying）的AI大模型，能够将任意文字生成视频，用户只需输入一段文字和选择风格即可生成高精度视频。清影已上线清言App，支持文本生成视频和图片生成视频，同时推出“照片动起来”小程序。CEO张鹏提到清影底座的视频生成模型CogVideoX融合了文本、时间和空间三个维度，提升了推理速度。用户可以通过智谱清言PC/APP体验清影，将灵感转化为艺术视频创作。

【AiBase提要:】
🎥 清影是智谱AI推出的AI大模型，能够生成高精度视频，支持文本生成视频和图片生成视频。
💡 清影基于新型DiT模型架构，融合文本和视频内容，提升了指令遵从能力和内容连贯性。
🚀 CogVideoX是清影底座的视频生成模型，融合了文本、时间和空间三个维度，提升了推理速度，未来将推出更高分辨率、更长时长的生成视频功能。
详情链接:https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu

3、字节跳动发布豆包·图生图模型豆包大模型日均tokens使用量超5000亿

火山引擎在成都举办了2024AI 创新巡展，宣布豆包大模型日均tokens使用量超过5000亿，客户日均使用量增长22倍。张鑫副总裁表示火山引擎正向智能化、行业化和区域化方向发展，助力企业实现业务创新。发布豆包大模型的最新能力包括视觉图像、语音合成、声音复刻等升级。

【AiBase提要:】
🚀 豆包大模型日均tokens使用量超5000亿，客户日均使用量增长22倍。
🔍 豆包·图生图模型和豆包·文生图模型在保留原图特征和提升画面质感方面表现突出。
🔊 豆包·语音合成模型和豆包·声音复刻模型在表达情绪和还原说话人声音特征方面有所提升。

4、AI视频生成器Runway被曝使用盗版YouTube内容进行训练

这篇文章揭露了Runway公司开发的Gen-3Alpha视频生成器使用盗版内容的丑闻，引发了版权争议。AI公司频频触犯版权法，立法者也在重新审视版权法规以适应新的技术挑战。

【AiBase提要:】
📊 Runway视频生成器被曝使用盗版内容—引发版权争议
🛡️ AI公司频频触犯版权法—版权纠纷成为AI发展的瓶颈
📜 立法者重新审视版权法规—法律和版权使用政策不断更新

5、告别标题难民!B站上线AIGC推荐广告标题功能

在这个创意为王的时代，B站推出的AIGC推荐广告标题功能为广告创作注入了新的活力。通过AI生成的10个爆款标题，让创作过程更简单高效，为广告效果提升增添了可能。

【AiBase提要:】
🔑 创意为王，标题是关键。AIGC推荐广告标题功能让创作更简单高效。
🤖 AI大师背后，基于海量数据训练。生成风格各异、抓人眼球的标题。
🚀 持续优化AI大师，让标题更精准、更有针对性。广告创作自由度得到大胆拓展。

6、即刻AI搜索神器问问小宇宙来了

即刻App推出了基于小宇宙的AI搜索功能——问问小宇宙，专注于声音内容的深度挖掘，提供深度讨论和独到见解。界面复古的配色和个性化推荐功能是其特色，让搜索结果更加丰富、多元，贴近用户需求。

【AiBase提要:】
🔍 问问小宇宙是基于小宇宙的AI搜索功能，专注声音内容挖掘。
🎧 提供深度讨论和独到见解，推荐相关音频内容。
🎨 界面复古配色，个性化推荐功能，丰富、多元的搜索结果，贴近用户需求。
详情链接:https://top.aibase.com/tool/wenwenxiaoyuzhou

7、翻译界的“AI特工”!字节跳动推端到端语音同步翻译系统CLASI

CLASI是字节跳动推出的端到端语音同步翻译系统，为全球交流带来革新。它结合语言模型和信息检索系统，实现准确快速的翻译，具备上下文记忆功能，超越人类译员。虽然不完美，但通过机智的应对能力，提供高效的翻译服务。CLASI的出现开辟了跨语言交流新天地，为人类沟通方式带来温和革新。

【AiBase提要:】
🌐 CLASI是端到端语音同步翻译系统，结合语言模型和信息检索系统，实现准确快速翻译。
🧠 CLASI具备上下文记忆功能，能联系之前内容确保翻译连贯性，超越人类译员。
🔍 CLASI通过机智的应对能力，猜测意思并提供合理翻译，在传达有效信息能力上胜过商业和开源系统。
详情链接:https://top.aibase.com/tool/clasi

8、武汉大学联合中国移动九天人工智能团队开源音视频说话人识别数据集 VoxBlink2

武汉大学联合中国移动九天人工智能团队和昆山杜克大学基于YouTube数据开源了超过11万小时的音视频说话人识别数据集VoxBlink2，是目前最大的公开可用的音视频说话人识别数据集。该数据集丰富了开源语音语料库，支持训练声纹大模型。

【AiBase提要:】
🔍 数据集规模超过11万小时，包含9904382个高质量音频片段及视频片段，来自YouTube上的111284名用户。
🔬 数据集经过多步骤的数据挖掘，包括候选人准备、人脸提取&检测、人脸识别、活动说话人检测等，准确率提升至92%。
🛠 VoxBlink2开源了不同大小的声纹模型，包括基于ResNet的2D卷积模型和基于ECAPA-TDNN的时序模型，以及超大模型ResNet293，在Vox1-O数据集上表现出色。
详情链接:https://VoxBlink2.github.io

9、谷歌Gemini重大更新:多语言支持、性能提升、面向青少年开放

谷歌宣布对其AI聊天机器人Gemini进行全面升级，包括多语言支持、性能提升和面向青少年开放。这次更新将提升用户体验，降低运营成本，增加透明度，拓展应用场景，展现谷歌在AI领域的雄心和决心。

【AiBase提要:】
🌐 多语言支持: Gemini1.5Flash支持40种语言，覆盖230个国家和地区，提升质量和响应速度。
🔍 上下文窗口扩展: Gemini上下文窗口扩展到32，000个标记，支持更长文本处理和文件上传功能。
🚀 更广泛的应用场景: Gemini功能将扩展到Messages应用集成、手机应用推广和面向青少年开放。

10、轻松调优!微软针对Phi-3小型语言模型推出无服务器微调功能

微软推出针对Phi-3小型语言模型的无服务器微调功能，为开发者提供了轻松调整和优化模型性能的便利。这一举措将进一步推动AI应用的发展和普及。

【AiBase提要:】
📈 无服务器微调功能:开发者可以在无需管理服务器的情况下，轻松调整Phi-3模型，提高性能表现。
💰 高性价比的Phi-3模型:以低成本提供高效性能，适用于各种企业应用场景。
🤖 市场竞争激烈:微软与OpenAI等AI提供商之间的竞争加剧，推动了AI行业的发展。
详情链接:https://azure.microsoft.com/en-us/blog/announcing-phi-3-fine-tuning-new-generative-ai-models-and-other-azure-ai-updates-to-empower-organizations-to-customize-and-scale-ai-applications/

11、马斯克寻求特斯拉董事会批准向 xAI 注资50亿美元

马斯克计划向人工智能初创公司 xAI 投资50亿美元，可能引发科技公司网络利益冲突。特斯拉转型为机器人和人工智能公司，马斯克承诺建立自主机器人出租车和人形机器人车队。 xAI 成立于去年7月，估值180亿美元，马斯克追赶竞争对手OpenAI和Anthropic。

【AiBase提要:】
🚀 马斯克计划向 xAI 投资50亿美元，可能引发科技公司网络利益冲突。
🤖 特斯拉转型为机器人和人工智能公司，马斯克承诺建立自主机器人出租车和人形机器人车队。
💰 xAI 成立于去年7月，估值180亿美元，马斯克追赶竞争对手OpenAI和Anthropic。

12、谷歌AI几何超进化:IMO金牌之争，19秒解题速度碾压人类选手

本文介绍了谷歌DeepMind的AI系统在国际数学奥林匹克竞赛（IMO）上的惊人表现，以一分之差惜败夺得银牌。AI展现出超凡的解题能力和速度，碾压人类选手，引发人们对AI在数学领域的无限可能性的思考。

【AiBase提要:】
🏅 AI系统在IMO竞赛中以惊人表现夺得银牌，展现出超凡的解题能力和速度。
🧠 AlphaProof和AlphaGeometry2两款AI系统擅长数学推理和几何解题，在未来发展中具有巨大潜力。
🌐 谷歌AI在数学领域的超进化挑战人类智能，为人工通用智能（AGI）的发展提供新方向。
详情点此查看：https://www.chinaz.com/ainews/10608.shtml

13、Anthropic的爬虫机器人无视网站反AI抓取政策遭吐槽

Anthropic公司的爬虫机器人ClaudeBot在24小时内频繁访问多个网站，引发了网站所有者和创始人的不满。这种行为不仅违反了使用条款，还占用了网站的开发资源，导致多个网站遭受爬虫侵扰。

【AiBase提要:】
🤖 爬虫频繁访问iFixit、Read the Docs等网站，违反使用条款和占用开发资源。
🔒 iFixit已添加crawl-delay扩展限制爬虫访问，其他网站也遭到侵扰。
🚫 许多AI公司通过robots.txt拒绝爬虫访问，但存在忽略规则和保护数据的争议。

（举报）

相关推荐

关键词：

SearchGPT

让搜索“一步到位”！快手提出端到端生成式搜索方案OneSearch

当前电商平台普遍采用“召回、粗排、精排”级联式搜索架构，但存在商品描述混乱、相关性差、冷启动难等痛点。快手提出业界首个工业级端到端生成式搜索框架OneSearch，集成三大创新模块：关键词增强量化编码（KHQE）提升商品特征建模能力，多视角用户行为序列注入策略实现精准偏好捕捉，偏好感知奖励系统（PARS）优化排序多样性。实际部署后，订单量提升3.22%，买家数增长2.4%，在线推理成本降低75.4%，冷启动场景表现尤为突出。该系统标志着生成式模型在大规模工业场景中首次完整替代传统搜索链路，为电商搜索技术发展指明方向。

电商平台搜索架构 OneSearch
ChatGPT正秘密测试私信功能：支持用户之间直接交流

OpenAI正在为其明星产品ChatGPT测试名为私信”（Direct Messages）的社交功能。这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具，逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

ChatGPT OpenAI 社交功能
荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

AI 开源轻量级
曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”，用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能，包括搜索个人数据、执行App内操作（如编辑照片）等。虽然不面向消费者发布，但该工具标志着苹果对Siri的全面升级已进入新阶段，旨在帮助员工高效完成测试。

苹果 Siri ChatGPT
Checkout.com正式推出Flow Remember Me：一键支付，全球通用

Checkout.com推出嵌入式支付产品Flow的"记住我"功能，消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示，该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络，并与Visa、Mastercard和Google达成AI智能体合作，助力商户在数字支付领域保持领先地位。

支付产品 Remember Me
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
想释放多网卡带宽？银河麒麟V11的MPTCP方案来了

本文介绍银河麒麟操作系统V11的MPTCP解决方案，通过多路径TCP协议聚合多网卡带宽，实现数据传输速度倍增和链路故障无缝切换。方案提供内核级原生支持，部署简单，兼容主流应用，显著提升网络性能与可靠性，有效解决单网卡带宽瓶颈和多网卡资源闲置问题，为高吞吐业务场景打造高效网络传输新引擎。

多路径TCP 带宽优化网络传输
续科天下发布全新XUKE TECH产品体系，为AI时代构建可靠数据基石

续科天下发布XUKE TECH完整AI数据处理系统，推出Base、Embed、Vault三款核心产品，解决企业AI化过程中的非结构化数据处理难题。该系统能统一处理多模态数据，通过向量化转换和安全存储管理，形成端到端解决方案，帮助企业将70%的数据预处理精力转向模型开发，显著缩短AI项目上线周期，已在金融、互联网等领域验证实效。

AI数据预处理非结构化数据处理智能数据基础设施
OPPO Watch S官宣：轻薄表皇

OPPO宣布将于10月16日推出OPPO Watch S智能手表，主打“轻薄表皇”设计，厚度不足9mm，号称目前市面上最薄的智能圆表。搭载全新智能手表系统，操作体验媲美手机，健康配置亦有惊喜。同时具备“健身教练”功能，可自动识别运动并提供超100种运动模式，专业记录数据。此外，发布会还将推出OPPO Find X9和X9 Pro旗舰手机，首批搭载联发科天玑9500平台，出厂预装全新ColorOS 16系统。

OPPO Watch S
女子用ChatGPT选号中百万大奖全部捐出帮助有需要的人

美国弗吉尼亚州女子卡丽爱德华为非经常购彩者，近日通过手机向ChatGPT询问彩票号码建议，AI提供几组数字供参考。她购买后幸运中得15万美元（约106万元人民币）大奖。领奖时她当场宣布将全部奖金捐出，帮助有需要的人，并表示自己已足够幸运，希望以此鼓励其他中奖者回馈社会。

ChatGPT 彩票中奖 AI推荐

今日大家都在搜的词：

热文

3 天
7天

AI日报：OpenAI推搜索引擎SearchGPT；智谱推AI视频产品清影；字节发布豆包图生图模型；B站上线AIGC推荐广告标题功能

让搜索“一步到位”！快手提出端到端生成式搜索方案OneSearch

ChatGPT正秘密测试私信功能：支持用户之间直接交流

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

Checkout.com正式推出Flow Remember Me：一键支付，全球通用

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

想释放多网卡带宽？银河麒麟V11的MPTCP方案来了

续科天下发布全新XUKE TECH产品体系，为AI时代构建可靠数据基石

OPPO Watch S官宣：轻薄表皇

女子用ChatGPT选号中百万大奖全部捐出帮助有需要的人

今日大家都在搜的词：

热文

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

荣耀Magic8系列暨MagicOS10发布会定档10月15日

真我官宣与理光达成影像战略合作：真我GT8 Pro首发搭载

iQOO 15搭载自研电竞芯片Q3 能效提升40%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

比特币价格突破12.5万美元刷新历史最高纪录

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

腾讯混元图像3.0登顶LMArena榜一

雷军：小米17系列开售仅5天销量破100万台

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

站长商机